La Stack

Chaque composant a été choisi pour sa fiabilité, sa performance et sa compatibilité avec les exigences de souveraineté des données.

Pipeline d'ingestion

Transforme vos fichiers bruts en base de connaissances vectorielle interrogeable. Il est conçu pour être modulaire, robuste et sécurisé.

Chaque fichier passe par un Gardien LLM qui valide le contenu avant ingestion. Les données reçoivent une description contextuelle pour améliorer la précision des recherches futures.

Unstructured.io SHA-256 Deduplication Late Chunking Guardian LLM

Base de données vectorielle

PostgreSQL avec l'extension pgvector, hébergé directement sur le VPS dédié. Cette isolation totale garantit la conformité RGPD stricte.

PostgreSQL + pgvector Cosine Similarity BM25 Hybrid Isolated VPS

Recherche Hybride (RRF)

Oracle combine recherche sémantique (sens) et mots-clés BM25 (précision brute). La fusion Reciprocal Rank Fusion garantit les meilleurs résultats.

Sémantique

Comprend le contexte et les synonymes, même sans mots-clés exacts.

BM25

Indispensable pour les codes internes, acronymes et références précises.

Boucle Agentique ReAct

Utilisation du protocole MCP pour exposer des ressources et des outils au LLM. L'agent peut raisonner, agir, et observer le résultat en boucle.

Model Context Protocol FastAPI Backend SSE Streaming ReAct Loop

Observabilité — LLM Judge

Évaluation asynchrone de chaque réponse par un modèle dédié (température 0.0) sur 4 piliers fondamentaux.

Faithfulness
Fidélité source
Relevance
Pertinence
Coverage
Couverture
Adéquation
Réponse/Question

PII Masking & Souveraineté

Masquage automatique des données sensibles avant traitement LLM. Plusieurs niveaux de détection selon le tier choisi.

Presidio Engine Custom NER Models Cloud EU Guarantee Audit Logs

Prêt à déployer votre Oracle ?

Choisissez le plan adapté à votre structure ou contactez-nous pour une installation on-premise.