LITEOPSDOCS
Agents & SystèmesPacemaker

Capture photo

Extraction automatique depuis photos de reunion via Claude Vision : tableau blanc, Post-it, slides.

REF-SPEC/PM-004 v1.0 — 2026-04-05

1. Principe

Pacemaker permet de photographier des artefacts physiques de reunion (tableau blanc, Post-it, slides projetes, cahiers) et d'en extraire automatiquement des informations structurees grace a Claude Vision.

2. Pipeline

Camera mobile          Resize client          Upload Blob          Claude Vision
(arriere)          ──▶ (max 1600px,      ──▶ (Vercel Blob)   ──▶ (multimodal)
                        JPEG 85%)
        │                                                            │
        │                                                            ▼
        │                                                     Extraction
        │                                                     structuree
        │                                                            │
        ▼                                                            ▼
   Photo originale                                          Preview + actions
   conservee                                                (Integrer / Garder / Rejeter)

3. Types de supports detectes

SupportElements extraits
Tableau blancSchemas, decisions, actions, notes
Post-itActions, idees, priorites
Slides projetesTitres, contenus cles, KPI
Ecran de PCDonnees, configurations, schemas
Cahier manuscritNotes, schemas, calculs

4. Structure de l'extraction

Le modele Vision retourne un objet structure :

{
  "ocr_text": "Texte brut extrait de l'image",
  "summary": "Resume en une phrase",
  "detected_elements": [
    { "type": "decision", "content": "..." },
    { "type": "action", "content": "..." },
    { "type": "risk", "content": "..." },
    { "type": "kpi", "content": "..." },
    { "type": "schema", "content": "..." },
    { "type": "note", "content": "..." }
  ],
  "confidence": 0.85
}

5. Actions post-extraction

ActionComportement
IntegrerCree des taches (source: "vision") et/ou risques depuis les elements detectes. Indexe l'OCR dans la base RAG. Logue un evenement journal.
Garder en docStocke l'image et l'OCR dans la base documentaire sans creer d'entites.
RejeterSupprime l'image et l'extraction.

6. Contraintes techniques

ContrainteValeur
Taille max10 MB
Formats acceptesJPEG, PNG, WebP, HEIC
Resize clientObligatoire avant envoi (max 1600px)
Modeleclaude-sonnet-4-20250514 (multimodal natif)
Cout moyen~0.015 USD par image

7. Responsive

  • Mobile : bouton camera plein ecran, utilise <input capture="environment"> pour la camera arriere
  • Desktop : file picker standard, preview de l'image avant extraction
  • L'apercu et les resultats s'affichent en cards empilees sur mobile, cote-a-cote sur desktop

On this page