Pipeline IA

Chaîne de traitement IA de Pilot : matérialisation, contexte, génération et modes de fallback.

REF-SPEC/AG001-IA v1.0 — 2026-04-09

1. Principe

Le pipeline IA de Pilot utilise des vues matérialisées comme couche d'abstraction entre les données brutes et le LLM. Les données ne sont jamais envoyées directement au modèle — seules les vues analytiques pré-calculées servent de contexte.

2. Architecture du pipeline

Données brutes       Matérialisation       Prompt builder       LLM              Sortie
(clean_data)    ──▶  (4 vues           ──▶ (contexte +     ──▶ Claude /     ──▶ JSON
                      analytiques)          instructions)      Mistral /        structuré
                                                               Ollama

3. Vues matérialisées

Le matérialiseur pré-calcule 4 vues à chaque upload ou transformation :

Vue Schema

Structure des données, types, cardinalités :

Noms de colonnes et types inférés
Nombre de valeurs distinctes par colonne
Exemples de valeurs

Vue Stats

Statistiques descriptives pour les colonnes numériques :

Moyenne, médiane, écart-type
Quartiles (Q1, Q2, Q3)
Min, max, distribution

Vue Dimensions

Agrégations GROUP BY sur les colonnes catégorielles :

Top valeurs par fréquence
Répartition des catégories
Croisements significatifs

Vue Anomalies

Détection automatique d'outliers et tendances :

Z-score pour identifier les valeurs aberrantes
Détection de tendances temporelles
Corrélations significatives

4. Points d'appel IA

Opération	Entrée	Sortie	Max tokens
Suggestions	4 vues matérialisées	5-8 idées de rapports	2000
Génération rapport	Suggestion + 4 vues	JSON rapport complet	4000
Chat	Question + historique + vues	Réponse texte	2000
Génération section	Description + vues	JSON section unique	2000
Itération	Rapport + feedback + vues	JSON rapport amélioré	4000

5. Chaîne de fallback

Pilot implémente une chaîne de fallback à 3 niveaux :

Claude Sonnet 4 ──(erreur/timeout)──▶ Mistral 3B ──(erreur)──▶ Ollama local
   (primaire)                           (cloud)                  (dernier recours)

Détection de répétition

En mode Ollama, Pilot détecte les boucles de répétition (tokens répétés) et tronque automatiquement la réponse pour éviter les générations infinies.

6. Confidentialité

Mesure	Implémentation
Pas de données brutes	Seules les vues matérialisées sont envoyées au LLM
Mode local disponible	Ollama pour zéro cloud
Isolation workspace	Chaque workspace a ses propres vues matérialisées

On this page