Prédiction du Temps de Livraison Alimentaire
Benchmark de régression sur 16 modèles. La Régression Linéaire gagne étonnamment : RMSE=8,76 min, R²=0,829. XGBoost ajusté : RMSE=9,19. Distance & trafic dominent. Caractéristiques d'interaction capturent les non-linéarités.
1 000 commandes de livraison alimentaire — 9 caractéristiques
Ingénierie de caractéristiques d'interaction → benchmark de 16 modèles → HPO RandomizedSearchCV
Benchmark de régression complet pour la prédiction du temps de livraison alimentaire.
Jeu de données
- ▸1 000 commandes : distance, météo, trafic, heure du jour, type de véhicule, temps de préparation, expérience du coursier
- ▸30 valeurs manquantes (3%) → imputation mode/médiane
- ▸Cible : Delivery_Time_min
Ingénierie des caractéristiques
- ▸Ordinal : trafic (Faible→Élevé=0,1,2), heure du jour (Matin→Nuit=0,1,2,3)
- ▸One-hot : météo (5 conditions), véhicule (4 types)
- ▸Interaction : distance×trafic_encodé, expérience_coursier×distance
Résultats 16 Modèles
| Modèle | RMSE (min) | R² |
|---|---|---|
| Régression Linéaire | 8,76 | 0,829 |
| Ridge / Lasso | 8,76 | 0,829 |
| SVR (RBF) | 9,12 | 0,816 |
| Random Forest | 9,09 | 0,817 |
| LightGBM | 9,09 | 0,817 |
| CatBoost | 9,16 | 0,813 |
| XGBoost | 9,20 | 0,811 |
| XGBoost (ajusté) | 9,19 | 0,812 |
| Decision Tree | 12,93 | 0,600 |
Découverte Surprenante La Régression Linéaire gagne sur ce dataset. Avec des features d'interaction adéquates, elle capture la majeure partie de la variance. Les termes engineerés encodent déjà les non-linéarités — laissant peu à découvrir pour les modèles arborescents.
Top Features SHAP (XGBoost)
- ▸Distance (km) — contrainte physique directe
- ▸Niveau de trafic — multiplicateur de la distance
- ▸Temps de préparation — les délais s'accumulent
- ▸Expérience du coursier — efficacité de navigation