Tous les Projets
Détection de Fraude

Prédiction de Résiliation Client Télécom

Pipeline churn en 3 phases sur 7 043 clients. XGBoost optimisé Optuna : AUC 0,8484, F1 0,5947. Phase 1 : 5 baselines → Phase 2 : ensembles de boosting → Phase 3 : 100 essais Optuna + SHAP. Durée d'abonnement & type de contrat dominent.

0.8484
XGBoost Optuna AUC
0.5947
XGBoost Optuna F1
0.844 (SVM)
Best baseline AUC
100
Optuna trials
Jeu de Données

7 043 clients télécom, 21 caractéristiques, 26,5% de taux de résiliation

Approche

Baseline → ensemble → 100 essais Optuna HPO → interprétabilité SHAP

Stack Technique
PythonXGBoostLightGBMCatBoostOptunaSHAPScikit-learn
Mots-clés
XGBoostLightGBMCatBoostOptunaSHAPChurnCustomer Analytics
Visualisations5 Graphiques
Analyse Approfondie

Pipeline churn en 3 phases sur le dataset Telco Customer.

Données

  • 7 043 clients, 21 caractéristiques (démographie, services, compte, charges)
  • Taux de churn : 26,54% — déséquilibre modéré, division stratifiée 80/20

Phase 1 — Classificateurs de base

ModèlePrécisionAUC
Logistic Regression81,1%0,842
Decision Tree78,8%0,735
SVM79,2%0,844
Random Forest80,4%0,843

Phase 2 — Ensembles de boosting

ModèlePrécisionAUC
XGBoost80,0%0,840
LightGBM80,0%0,813
CatBoost79,3%0,817
Stacking79,8%0,834

Phase 3 — Optuna HPO (XGBoost, 100 essais)

  • AUC : 0,8484, Précision : 80,55%, F1 (churn) : 0,5947
  • Meilleur : n_estimators=500, max_depth=5, lr=0,05, subsample=0,8

Principaux facteurs de churn (SHAP)

  1. Durée d'abonnement (↓ churn avec ancienneté plus longue)
  2. Type de contrat (mensuel = risque le plus élevé)
  3. Charges mensuelles (charges plus élevées → plus de churn)
  4. Support technique (absence = churn plus élevé)
  5. Service Internet (les utilisateurs fibre churntent plus)