Architecture & Technologie

La Stack

Chaque composant a été choisi pour sa fiabilité, sa performance et sa compatibilité avec les exigences de souveraineté des données.

Pipeline d'ingestion

Transforme vos fichiers bruts en base de connaissances vectorielle interrogeable. Il est conçu pour être modulaire, robuste et sécurisé.

Chaque fichier passe par un Gardien LLM qui valide le contenu avant ingestion. Les données reçoivent une description contextuelle pour améliorer la précision des recherches futures.

Base de données vectorielle

PostgreSQL avec l'extension pgvector, hébergé directement sur le VPS dédié. Cette isolation totale garantit la conformité RGPD stricte.

Recherche Hybride (RRF)

Oracle combine recherche sémantique (sens) et mots-clés BM25 (précision brute). La fusion Reciprocal Rank Fusion garantit les meilleurs résultats.

Sémantique

Comprend le contexte et les synonymes, même sans mots-clés exacts.

BM25

Indispensable pour les codes internes, acronymes et références précises.

Boucle Agentique ReAct

Utilisation du protocole MCP pour exposer des ressources et des outils au LLM. L'agent peut raisonner, agir, et observer le résultat en boucle.

Observabilité — LLM Judge

Évaluation asynchrone de chaque réponse par un modèle dédié (température 0.0) sur 4 piliers fondamentaux.

Faithfulness

Fidélité source

Relevance

Pertinence

Coverage

Couverture

Adéquation

Réponse/Question

PII Masking & Souveraineté

Masquage automatique des données sensibles avant traitement LLM. Plusieurs niveaux de détection selon le tier choisi.

Prêt à déployer votre Oracle ?

Choisissez le plan adapté à votre structure ou contactez-nous pour une installation on-premise.

← Comment ça marche Voir les abonnements