Agents & SystèmesPacemaker
Capture photo
Extraction automatique depuis photos de reunion via Claude Vision : tableau blanc, Post-it, slides.
REF-SPEC/PM-004 v1.0 — 2026-04-05
1. Principe
Pacemaker permet de photographier des artefacts physiques de reunion (tableau blanc, Post-it, slides projetes, cahiers) et d'en extraire automatiquement des informations structurees grace a Claude Vision.
2. Pipeline
Camera mobile Resize client Upload Blob Claude Vision
(arriere) ──▶ (max 1600px, ──▶ (Vercel Blob) ──▶ (multimodal)
JPEG 85%)
│ │
│ ▼
│ Extraction
│ structuree
│ │
▼ ▼
Photo originale Preview + actions
conservee (Integrer / Garder / Rejeter)3. Types de supports detectes
| Support | Elements extraits |
|---|---|
| Tableau blanc | Schemas, decisions, actions, notes |
| Post-it | Actions, idees, priorites |
| Slides projetes | Titres, contenus cles, KPI |
| Ecran de PC | Donnees, configurations, schemas |
| Cahier manuscrit | Notes, schemas, calculs |
4. Structure de l'extraction
Le modele Vision retourne un objet structure :
{
"ocr_text": "Texte brut extrait de l'image",
"summary": "Resume en une phrase",
"detected_elements": [
{ "type": "decision", "content": "..." },
{ "type": "action", "content": "..." },
{ "type": "risk", "content": "..." },
{ "type": "kpi", "content": "..." },
{ "type": "schema", "content": "..." },
{ "type": "note", "content": "..." }
],
"confidence": 0.85
}5. Actions post-extraction
| Action | Comportement |
|---|---|
| Integrer | Cree des taches (source: "vision") et/ou risques depuis les elements detectes. Indexe l'OCR dans la base RAG. Logue un evenement journal. |
| Garder en doc | Stocke l'image et l'OCR dans la base documentaire sans creer d'entites. |
| Rejeter | Supprime l'image et l'extraction. |
6. Contraintes techniques
| Contrainte | Valeur |
|---|---|
| Taille max | 10 MB |
| Formats acceptes | JPEG, PNG, WebP, HEIC |
| Resize client | Obligatoire avant envoi (max 1600px) |
| Modele | claude-sonnet-4-20250514 (multimodal natif) |
| Cout moyen | ~0.015 USD par image |
7. Responsive
- Mobile : bouton camera plein ecran, utilise
<input capture="environment">pour la camera arriere - Desktop : file picker standard, preview de l'image avant extraction
- L'apercu et les resultats s'affichent en cards empilees sur mobile, cote-a-cote sur desktop