Pipeline opérateurs

Chaîne de traitement complète : ingestion catalogue, embedding, parsing NLP, matching, scoring et conversation.

REF-SPEC/AG003-PIP v1.0 — 2026-04-09

1. Principe

Le pipeline de Matchmaker enchaîne 6 opérateurs pour transformer un besoin textuel en un classement scoré de ressources. Chaque opérateur est atomique et communique via des structures de données standardisées.

2. Vue du pipeline

OP-01              OP-02              OP-03              OP-04
DATA LAYER    ──▶  EMBEDDING     ──▶  NLP PARSER    ──▶  MATCH ENGINE
(catalogue)        (vectorisation)    (extraction)       (candidats)
                                                              │
                                                              ▼
                                                         OP-05
                                                         SCORER
                                                         (radar)
                                                              │
                                                              ▼
                                                         OP-06
                                                         CONV AGENT
                                                         (raffinement)

3. Détail des opérateurs

OP-01 — Data Layer

Ingestion et indexation du catalogue de ressources.

Entrée	Sortie
Ressources brutes (profils, compétences, références)	Catalogue normalisé et indexé

Chaque ressource est structurée avec :

Identité (nom, titre, bio)
Compétences par niveau (expert, confirmé, débutant)
Références passées avec client, mission, secteur, KPI
Secteurs d'activité

OP-02 — Embedding

Vectorisation sémantique des ressources et du besoin dans un espace partagé.

Entrée	Sortie
Texte de profil / texte de besoin	Vecteurs 1536 dimensions

Modèle : OpenAI text-embedding-3-small
Le profil est vectorisé à l'indexation
Le besoin est vectorisé à la recherche
Les références sont vectorisées individuellement

OP-03 — NLP Parser

Extraction de critères structurés depuis du texte libre.

Entrée	Sortie
Texte du besoin (fiche de poste, AO, texte libre)	Critères structurés

Sortie :

{
  "competences": ["React", "TypeScript", "AWS"],
  "secteurs": ["assurance", "banque"],
  "typeMission": "développement",
  "motsCles": ["migration", "cloud", "microservices"]
}

Limites : max 15 compétences, 5 secteurs, 10 mots-clés.

OP-04 — Match Engine

Calcul de correspondance entre les critères extraits et les ressources vectorisées.

Entrée	Sortie
Critères + embeddings + catalogue	Ressources candidates avec scores bruts

Similarité cosinus profil vs besoin
Overlap de compétences avec pondération niveau
Correspondance de secteurs (profil + références)
Similarité des missions passées
Filtrage par disponibilité sur la période

OP-05 — Scorer

Quantification et visualisation des raisons de sélection.

Entrée	Sortie
Scores bruts par axe	Score global + radar + classement

Score global pondéré 0-100
Score par dimension (5 axes)
Diagramme radar structuré
Classement final décroissant

OP-06 — Conv Agent (prévu)

Boucle conversationnelle de raffinement.

Entrée	Sortie
Feedback utilisateur sur les résultats	Classement mis à jour

L'utilisateur peut :

Clarifier des critères ("je cherche plutôt du cloud Azure que AWS")
Commenter les propositions ("trop senior", "budget trop élevé")
Ajuster les pondérations implicitement

Le système re-calcule le classement dynamiquement en fonction du feedback.

On this page