Sailor
Agent de navigation documentaire augmentée par IA. Base docs, chatbot RAG, sources toujours citées.
REF-SPEC/AG002 v1.0 — 2026-04-09
1. Vue d'ensemble
Sailor est un agent de navigation documentaire développé par LiteOps. Il permet à une organisation d'uploader sa base documentaire (PDF, Word, Excel, HTML) et de l'interroger en langage naturel via un chatbot. Chaque réponse cite ses sources — c'est la promesse fondamentale de Sailor.
| Propriété | Valeur |
|---|---|
| Code agent | AG002 |
| Couleur sémantique | Copper #A0694A |
| Tier design | T2 — Product |
| Stack | Express + React/Vite, SQLite, Mistral/Ollama |
| Interfaces | Workspace multi-projet |
| Langue | Français |
2. Problème résolu
Les bases documentaires d'entreprise sont volumineuses, dispersées et sous-exploitées. Trouver une information précise dans des centaines de documents (procédures, contrats, spécifications, comptes-rendus) prend du temps et repose sur la mémoire des collaborateurs.
Sailor transforme n'importe quelle base documentaire en un assistant conversationnel qui retrouve l'information pertinente en quelques secondes, avec la source exacte citée pour chaque réponse.
3. Capacités principales
| Capacité | Description |
|---|---|
| Ingestion multi-format | PDF, Word, Excel, HTML, TXT, Markdown, ZIP (extraction auto) |
| Chunking intelligent | Découpage en chunks de ~500 mots avec overlap, respect des phrases |
| Embedding vectoriel | Vectorisation via Mistral Embed, Voyage AI ou Ollama |
| Recherche hybride | Recherche vectorielle (primaire) + BM25 lexicale (fallback) |
| Chat avec sources | Réponses en langage naturel avec citations [[source:ID|TITRE]] |
| Suggestions contextuelles | 6 questions suggérées adaptées aux catégories de documents |
| Sessions persistantes | Conversations multi-tours avec historique sauvegardé |
| Mode dual IA | Online (Mistral cloud) ou offline (Ollama local) |
4. Interfaces
Onboarding
Wizard en 2 étapes : upload de documents puis définition du contexte projet (nom, description, objectifs). L'onboarding est vérifié à chaque accès au workspace.
Chat (interface principale)
Interface conversationnelle avec historique de sessions, suggestions contextuelles et badges de sources cliquables. Chaque réponse affiche les documents sources avec leur type, catégorie et score de pertinence.
Documents
Vue tabulaire de tous les documents indexés avec recherche, filtrage par catégorie/auteur/type, et panel de prévisualisation.
5. Stack technique
| Couche | Technologie | Rôle |
|---|---|---|
| Frontend | React 19 + Vite 8 | SPA avec React Router |
| Backend | Express.js 4 | API REST |
| Base de données | SQLite (better-sqlite3) | Stockage documents + chunks + embeddings |
| LLM online | Mistral Large | Génération de réponses |
| LLM fallback | Mistral Small | Fallback cloud |
| LLM local | Ollama Ministral 3B | Mode offline |
| Embedding online | Mistral Embed | Vectorisation principale |
| Embedding fallback | Voyage AI voyage-3-lite | Fallback embedding |
| Embedding local | Ollama nomic-embed-text | Mode offline (768 dims) |
| Parsing | pdf-parse, mammoth, cheerio, xlsx, yauzl | Extraction multi-format |
| Upload | Multer (100 MB max) | Gestion fichiers |
6. Opérateurs utilisés
Sailor s'appuie sur les opérateurs LiteOps suivants :
| Opérateur | Usage dans Sailor |
|---|---|
OP-003 RAG | Recherche vectorielle + sémantique dans les chunks |
OP-004 OCR | Extraction de texte depuis PDF et documents |
OP-005 Doc Understanding | Parsing structuré multi-format |
OP-008 Embedding | Vectorisation des chunks et requêtes |
OP-009 Chunker | Découpage des documents en segments |
OP-010 Reranker | Classement BM25 des résultats |
OP-011 Vector Store | Stockage et recherche vectorielle SQLite |