Pipeline opérateurs
Chaîne de traitement complète : ingestion catalogue, embedding, parsing NLP, matching, scoring et conversation.
REF-SPEC/AG003-PIP v1.0 — 2026-04-09
1. Principe
Le pipeline de Matchmaker enchaîne 6 opérateurs pour transformer un besoin textuel en un classement scoré de ressources. Chaque opérateur est atomique et communique via des structures de données standardisées.
2. Vue du pipeline
OP-01 OP-02 OP-03 OP-04
DATA LAYER ──▶ EMBEDDING ──▶ NLP PARSER ──▶ MATCH ENGINE
(catalogue) (vectorisation) (extraction) (candidats)
│
▼
OP-05
SCORER
(radar)
│
▼
OP-06
CONV AGENT
(raffinement)3. Détail des opérateurs
OP-01 — Data Layer
Ingestion et indexation du catalogue de ressources.
| Entrée | Sortie |
|---|---|
| Ressources brutes (profils, compétences, références) | Catalogue normalisé et indexé |
Chaque ressource est structurée avec :
- Identité (nom, titre, bio)
- Compétences par niveau (expert, confirmé, débutant)
- Références passées avec client, mission, secteur, KPI
- Secteurs d'activité
OP-02 — Embedding
Vectorisation sémantique des ressources et du besoin dans un espace partagé.
| Entrée | Sortie |
|---|---|
| Texte de profil / texte de besoin | Vecteurs 1536 dimensions |
- Modèle : OpenAI text-embedding-3-small
- Le profil est vectorisé à l'indexation
- Le besoin est vectorisé à la recherche
- Les références sont vectorisées individuellement
OP-03 — NLP Parser
Extraction de critères structurés depuis du texte libre.
| Entrée | Sortie |
|---|---|
| Texte du besoin (fiche de poste, AO, texte libre) | Critères structurés |
Sortie :
{
"competences": ["React", "TypeScript", "AWS"],
"secteurs": ["assurance", "banque"],
"typeMission": "développement",
"motsCles": ["migration", "cloud", "microservices"]
}Limites : max 15 compétences, 5 secteurs, 10 mots-clés.
OP-04 — Match Engine
Calcul de correspondance entre les critères extraits et les ressources vectorisées.
| Entrée | Sortie |
|---|---|
| Critères + embeddings + catalogue | Ressources candidates avec scores bruts |
- Similarité cosinus profil vs besoin
- Overlap de compétences avec pondération niveau
- Correspondance de secteurs (profil + références)
- Similarité des missions passées
- Filtrage par disponibilité sur la période
OP-05 — Scorer
Quantification et visualisation des raisons de sélection.
| Entrée | Sortie |
|---|---|
| Scores bruts par axe | Score global + radar + classement |
- Score global pondéré 0-100
- Score par dimension (5 axes)
- Diagramme radar structuré
- Classement final décroissant
OP-06 — Conv Agent (prévu)
Boucle conversationnelle de raffinement.
| Entrée | Sortie |
|---|---|
| Feedback utilisateur sur les résultats | Classement mis à jour |
L'utilisateur peut :
- Clarifier des critères ("je cherche plutôt du cloud Azure que AWS")
- Commenter les propositions ("trop senior", "budget trop élevé")
- Ajuster les pondérations implicitement
Le système re-calcule le classement dynamiquement en fonction du feedback.