Vue dâensemble
Chatbot IA conversationnel multimodal pour le groupe de la Caisse des DĂ©pĂŽts, ancrĂ© dans les donnĂ©es internes de lâentreprise.
Mes Réalisations (Projet from scratch) :
- Architecture multi-modĂšle avec orchestration intelligente (Mistral pour le conversationnel, Codestral pour le code, Flux pour la gĂ©nĂ©ration dâimages)
- Pipeline RAG avancé avec chunking sémantique, RAG Fusion et agents autonomes pour traiter les documents internes complexes
- SystĂšme dâagents ReAct (Reasoning + Acting) avec accĂšs Ă des outils externes (recherche web, gĂ©nĂ©ration dâimages)
- Architecture scalable supportant une charge importante avec optimisations asynchrones et multi-threading
Challenges techniques
Conception et implĂ©mentation complĂšte de lâarchitecture backend, avec itĂ©rations successives pour rĂ©pondre aux besoins Ă©volutifs du mĂ©tier.
ProblĂ©matique : La majoritĂ© du temps dâexĂ©cution est passĂ© en attente de rĂ©ponses des LLMs (latence rĂ©seau).
Architecture FastAPI fully asynchrone avec :
- Gestion asynchrone complĂšte (asyncio) pour maximiser le throughput
- Concurrence des requĂȘtes multiples sans blocage
- Pipeline de streaming optimisé pour une expérience utilisateur fluide
- Multi-threading et multi-processing pour les tĂąches CPU-intensives (embedding, parsing de documents)
2. Streaming temps réel
Implémentation SSE (Server-Sent Events) plutÎt que WebSockets pour optimiser la simplicité et la performance en communication unidirectionnelle.
Résultats :
- Affichage progressif des réponses du LLM (token par token)
- Expérience utilisateur fluide sans attente de la réponse complÚte
- Protocole lĂ©ger et performant adaptĂ© au cas dâusage
- Gestion native de la reconnexion automatique
3. SystÚme RAG avancé
Ancrage du chatbot dans les donnĂ©es internes de lâentreprise (documentation technique, processus, base de connaissances).
Pipeline RAG complet :
- DĂ©veloppement dâun systĂšme dâingestion multi-format (PDF, DOCX, TXT) avec parsing et normalisation
- IntĂ©gration avec Azure AI Search pour lâindexation et la recherche vectorielle
- Orchestration de lâensemble du pipeline : ingestion â chunking â embedding â retrieval â gĂ©nĂ©ration
Optimisations avancées :
- Chunking sémantique - Algorithme de découpage intelligent basé sur la structure et le sens du document. Préservation du contexte et amélioration significative de la pertinence.
- RAG Fusion - Stratégie de retrieval générant plusieurs reformulations de la question, recherches parallÚles et fusion des résultats avec re-ranking. Robustesse face aux formulations imparfaites.
- Multi-query retrieval - GĂ©nĂ©ration automatique de variations de requĂȘtes pour maximiser le rappel et couvrir diffĂ©rents angles sĂ©mantiques.
- Agents autonomes - Architecture dâagents pour orchestrer dynamiquement les stratĂ©gies de recherche et affiner itĂ©rativement les rĂ©sultats.