Vue d’ensemble
Problématique : Les bilans carbone obligatoires pour les entreprises contiennent de nombreux champs optionnels, rendant les données incomplètes et difficiles à analyser.
Solution du projet : Système de prédiction par Machine Learning pour compléter automatiquement les bilans carbone incomplets des entreprises françaises soumis à l’ADEME.
Mes Réalisations (Projet from scratch) :
- Modelisation de la base de donnée
- Architecture microservices avec Spring Boot et Python
- API REST Spring Boot exposant les bilans complétés avec métriques de confiance
- Communication asynchrone avec ML Python via Kafka pour découplage et scalabilité
Architecture microservices
[API Spring Boot] → [Kafka Topics] → [Service ML Python]
↓ ↓
[PostgreSQL] ←────────── [Résultats] ────────┘
Architecture avec 3 microservices :
- 2 services Spring Boot - Séparation des responsabilités (ingestion et exposition des données)
- 1 service Python - Traitement ML et prédictions
- Kafka - Bus d’événements asynchrone pour communication inter-services
- PostgreSQL - Persistance des bilans et résultats de prédiction
Flow de traitement :
- Ingestion des bilans carbone incomplets via API REST
- Publication d’événements Kafka avec données à prédire
- Consommation par le service Python et application des modèles ML
- Publication des résultats sur Kafka
- Persistance en base et exposition via API avec métriques de confiance