Pipeline IA
Chaîne de traitement IA de Pilot : matérialisation, contexte, génération et modes de fallback.
REF-SPEC/AG001-IA v1.0 — 2026-04-09
1. Principe
Le pipeline IA de Pilot utilise des vues matérialisées comme couche d'abstraction entre les données brutes et le LLM. Les données ne sont jamais envoyées directement au modèle — seules les vues analytiques pré-calculées servent de contexte.
2. Architecture du pipeline
Données brutes Matérialisation Prompt builder LLM Sortie
(clean_data) ──▶ (4 vues ──▶ (contexte + ──▶ Claude / ──▶ JSON
analytiques) instructions) Mistral / structuré
Ollama3. Vues matérialisées
Le matérialiseur pré-calcule 4 vues à chaque upload ou transformation :
Vue Schema
Structure des données, types, cardinalités :
- Noms de colonnes et types inférés
- Nombre de valeurs distinctes par colonne
- Exemples de valeurs
Vue Stats
Statistiques descriptives pour les colonnes numériques :
- Moyenne, médiane, écart-type
- Quartiles (Q1, Q2, Q3)
- Min, max, distribution
Vue Dimensions
Agrégations GROUP BY sur les colonnes catégorielles :
- Top valeurs par fréquence
- Répartition des catégories
- Croisements significatifs
Vue Anomalies
Détection automatique d'outliers et tendances :
- Z-score pour identifier les valeurs aberrantes
- Détection de tendances temporelles
- Corrélations significatives
4. Points d'appel IA
| Opération | Entrée | Sortie | Max tokens |
|---|---|---|---|
| Suggestions | 4 vues matérialisées | 5-8 idées de rapports | 2000 |
| Génération rapport | Suggestion + 4 vues | JSON rapport complet | 4000 |
| Chat | Question + historique + vues | Réponse texte | 2000 |
| Génération section | Description + vues | JSON section unique | 2000 |
| Itération | Rapport + feedback + vues | JSON rapport amélioré | 4000 |
5. Chaîne de fallback
Pilot implémente une chaîne de fallback à 3 niveaux :
Claude Sonnet 4 ──(erreur/timeout)──▶ Mistral 3B ──(erreur)──▶ Ollama local
(primaire) (cloud) (dernier recours)Détection de répétition
En mode Ollama, Pilot détecte les boucles de répétition (tokens répétés) et tronque automatiquement la réponse pour éviter les générations infinies.
6. Confidentialité
| Mesure | Implémentation |
|---|---|
| Pas de données brutes | Seules les vues matérialisées sont envoyées au LLM |
| Mode local disponible | Ollama pour zéro cloud |
| Isolation workspace | Chaque workspace a ses propres vues matérialisées |