Capture photo

Extraction automatique depuis photos de reunion via Claude Vision : tableau blanc, Post-it, slides.

REF-SPEC/PM-004 v1.0 — 2026-04-05

1. Principe

Pacemaker permet de photographier des artefacts physiques de reunion (tableau blanc, Post-it, slides projetes, cahiers) et d'en extraire automatiquement des informations structurees grace a Claude Vision.

2. Pipeline

Camera mobile          Resize client          Upload Blob          Claude Vision
(arriere)          ──▶ (max 1600px,      ──▶ (Vercel Blob)   ──▶ (multimodal)
                        JPEG 85%)
        │                                                            │
        │                                                            ▼
        │                                                     Extraction
        │                                                     structuree
        │                                                            │
        ▼                                                            ▼
   Photo originale                                          Preview + actions
   conservee                                                (Integrer / Garder / Rejeter)

3. Types de supports detectes

Support	Elements extraits
Tableau blanc	Schemas, decisions, actions, notes
Post-it	Actions, idees, priorites
Slides projetes	Titres, contenus cles, KPI
Ecran de PC	Donnees, configurations, schemas
Cahier manuscrit	Notes, schemas, calculs

4. Structure de l'extraction

Le modele Vision retourne un objet structure :

{
  "ocr_text": "Texte brut extrait de l'image",
  "summary": "Resume en une phrase",
  "detected_elements": [
    { "type": "decision", "content": "..." },
    { "type": "action", "content": "..." },
    { "type": "risk", "content": "..." },
    { "type": "kpi", "content": "..." },
    { "type": "schema", "content": "..." },
    { "type": "note", "content": "..." }
  ],
  "confidence": 0.85
}

5. Actions post-extraction

Action	Comportement
Integrer	Cree des taches (source: `"vision"`) et/ou risques depuis les elements detectes. Indexe l'OCR dans la base RAG. Logue un evenement journal.
Garder en doc	Stocke l'image et l'OCR dans la base documentaire sans creer d'entites.
Rejeter	Supprime l'image et l'extraction.

6. Contraintes techniques

Contrainte	Valeur
Taille max	10 MB
Formats acceptes	JPEG, PNG, WebP, HEIC
Resize client	Obligatoire avant envoi (max 1600px)
Modele	claude-sonnet-4-20250514 (multimodal natif)
Cout moyen	~0.015 USD par image

7. Responsive

Mobile : bouton camera plein ecran, utilise <input capture="environment"> pour la camera arriere
Desktop : file picker standard, preview de l'image avant extraction
L'apercu et les resultats s'affichent en cards empilees sur mobile, cote-a-cote sur desktop