★ Featured 🏢 Caisse des Dépôts (ICDC)

C'bilan - Prédiction ML Bilan Carbone

Technologies & tools

Java Spring Boot

Kafka

PostgreSQL

Machine Learning

Docker

Vue d’ensemble

Problématique : Les bilans carbone obligatoires pour les entreprises contiennent de nombreux champs optionnels, rendant les données incomplètes et difficiles à analyser.

Solution du projet : Système de prédiction par Machine Learning pour compléter automatiquement les bilans carbone incomplets des entreprises françaises soumis à l’ADEME.

Mes Réalisations (Projet from scratch) :

Modelisation de la base de donnée
Architecture microservices avec Spring Boot et Python
API REST Spring Boot exposant les bilans complétés avec métriques de confiance
Communication asynchrone avec ML Python via Kafka pour découplage et scalabilité

Architecture microservices

[API Spring Boot] → [Kafka Topics] → [Service ML Python]
       ↓                                      ↓
[PostgreSQL] ←────────── [Résultats] ────────┘

Architecture avec 3 microservices :

2 services Spring Boot - Séparation des responsabilités (ingestion et exposition des données)
1 service Python - Traitement ML et prédictions
Kafka - Bus d’événements asynchrone pour communication inter-services
PostgreSQL - Persistance des bilans et résultats de prédiction

Flow de traitement :

Ingestion des bilans carbone incomplets via API REST
Publication d’événements Kafka avec données à prédire
Consommation par le service Python et application des modèles ML
Publication des résultats sur Kafka
Persistance en base et exposition via API avec métriques de confiance