★ Featured 🏢 Caisse des Dépôts (ICDC)

Archi+ - Chatbot IA

Technologies & tools

Python FastAPI

Angular

LLM / RAG / LangChain

Azure AI Search

MongoDB

Vue d’ensemble

Chatbot IA conversationnel multimodal pour le groupe de la Caisse des Dépôts, ancré dans les données internes de l’entreprise.

Architecture multi-modèle avec orchestration intelligente (Mistral pour le conversationnel, Codestral pour le code, Flux pour la génération d’images)
Pipeline RAG avancé avec chunking sémantique, RAG Fusion et agents autonomes pour traiter les documents internes complexes
Système d’agents ReAct (Reasoning + Acting) avec accès à des outils externes (recherche web, génération d’images)
Architecture scalable supportant une charge importante avec optimisations asynchrones et multi-threading

Conception et implémentation complète de l’architecture backend, avec itérations successives pour répondre aux besoins évolutifs du métier.

Problématique : La majorité du temps d’exécution est passé en attente de réponses des LLMs (latence réseau).

Architecture FastAPI fully asynchrone avec :

Gestion asynchrone complète (asyncio) pour maximiser le throughput
Concurrence des requêtes multiples sans blocage
Pipeline de streaming optimisé pour une expérience utilisateur fluide
Multi-threading et multi-processing pour les tâches CPU-intensives (embedding, parsing de documents)

Implémentation SSE (Server-Sent Events) plutôt que WebSockets pour optimiser la simplicité et la performance en communication unidirectionnelle.

Résultats :

Ancrage du chatbot dans les données internes de l’entreprise (documentation technique, processus, base de connaissances).

Pipeline RAG complet :

Développement d’un système d’ingestion multi-format (PDF, DOCX, TXT) avec parsing et normalisation
Intégration avec Azure AI Search pour l’indexation et la recherche vectorielle
Orchestration de l’ensemble du pipeline : ingestion → chunking → embedding → retrieval → génération

Optimisations avancées :

Chunking sémantique - Algorithme de découpage intelligent basé sur la structure et le sens du document. Préservation du contexte et amélioration significative de la pertinence.
RAG Fusion - Stratégie de retrieval générant plusieurs reformulations de la question, recherches parallèles et fusion des résultats avec re-ranking. Robustesse face aux formulations imparfaites.
Multi-query retrieval - Génération automatique de variations de requêtes pour maximiser le rappel et couvrir différents angles sémantiques.
Agents autonomes - Architecture d’agents pour orchestrer dynamiquement les stratégies de recherche et affiner itérativement les résultats.