ML sur la Chaîne d'Approvisionnement DataCo
ML sans fuite sur 180 519 commandes. LightGBM AUC 0,8563 (livraison tardive). Gradient Boosting R²=0,9996 (régression profit). Suppression des colonnes post-exécution qui gonflent à AUC=1,0 dans la plupart des solutions publiées.
DataCo SCMS : 180 519 enregistrements (après audit de fuite)
Audit de fuite → double tâche (classification + régression) → validation CV à 5 plis
ML avancé sur la chaîne d'approvisionnement DataCo avec correction critique de fuite.
Jeu de données
- ▸180 519 commandes, 53 features brutes → 44 après audit de fuite
Audit de Fuite — Colonnes Supprimées
| Colonne | Raison de Suppression |
|---|---|
| Days for shipping (real) | Résultat réel — non disponible au moment de la prédiction |
| Delivery Status | Encodage direct du label cible |
| Benefit per order | Calcul post-exécution |
| Sales per customer | Agrégé post-livraison |
Sans fuite : AUC ~0,86. Avec fuite : AUC = 1,0 (plupart des résultats publiés — invalide).
Tâche 1 : Classification Livraison Tardive
| Modèle | Précision | AUC |
|---|---|---|
| Régression Logistique | 72,2% | 0,790 |
| Random Forest | 73,8% | 0,871 |
| XGBoost | 74,5% | 0,859 |
| LightGBM | 74,5% | 0,856 |
CV 5 plis : RF 0,862±0,001 | XGB 0,853±0,002 | LGB 0,851±0,002
Tâche 2 : Régression Profit Commande
| Modèle | RMSE | R² |
|---|---|---|
| Ridge/Linéaire | 56,5 | 0,706 |
| XGBoost | 3,60 | 0,9988 |
| LightGBM | 4,52 | 0,9981 |
| Gradient Boosting | 2,04 | 0,9996 |
Features Engineerées (uniquement au moment de la commande) order_month, day_of_week, hour, quarter, discount_rate, price_band