Tous les Projets
Détection de Fraude
Prédiction de Résiliation Client Télécom
Pipeline churn en 3 phases sur 7 043 clients. XGBoost optimisé Optuna : AUC 0,8484, F1 0,5947. Phase 1 : 5 baselines → Phase 2 : ensembles de boosting → Phase 3 : 100 essais Optuna + SHAP. Durée d'abonnement & type de contrat dominent.
0.8484
XGBoost Optuna AUC
0.5947
XGBoost Optuna F1
0.844 (SVM)
Best baseline AUC
100
Optuna trials
Jeu de Données
7 043 clients télécom, 21 caractéristiques, 26,5% de taux de résiliation
Approche
Baseline → ensemble → 100 essais Optuna HPO → interprétabilité SHAP
Stack Technique
PythonXGBoostLightGBMCatBoostOptunaSHAPScikit-learn
Mots-clés
XGBoostLightGBMCatBoostOptunaSHAPChurnCustomer Analytics
Visualisations5 Graphiques
Analyse Approfondie
Pipeline churn en 3 phases sur le dataset Telco Customer.
Données
- ▸7 043 clients, 21 caractéristiques (démographie, services, compte, charges)
- ▸Taux de churn : 26,54% — déséquilibre modéré, division stratifiée 80/20
Phase 1 — Classificateurs de base
| Modèle | Précision | AUC |
|---|---|---|
| Logistic Regression | 81,1% | 0,842 |
| Decision Tree | 78,8% | 0,735 |
| SVM | 79,2% | 0,844 |
| Random Forest | 80,4% | 0,843 |
Phase 2 — Ensembles de boosting
| Modèle | Précision | AUC |
|---|---|---|
| XGBoost | 80,0% | 0,840 |
| LightGBM | 80,0% | 0,813 |
| CatBoost | 79,3% | 0,817 |
| Stacking | 79,8% | 0,834 |
Phase 3 — Optuna HPO (XGBoost, 100 essais)
- ▸AUC : 0,8484, Précision : 80,55%, F1 (churn) : 0,5947
- ▸Meilleur : n_estimators=500, max_depth=5, lr=0,05, subsample=0,8
Principaux facteurs de churn (SHAP)
- ▸Durée d'abonnement (↓ churn avec ancienneté plus longue)
- ▸Type de contrat (mensuel = risque le plus élevé)
- ▸Charges mensuelles (charges plus élevées → plus de churn)
- ▸Support technique (absence = churn plus élevé)
- ▸Service Internet (les utilisateurs fibre churntent plus)