كل المشاريع
كشف الاحتيال
التنبؤ بانسحاب عملاء الاتصالات
خط أنابيب تمييع بـ 3 مراحل على 7,043 عميل. XGBoost محسّن بـ Optuna: AUC 0.8484، F1 0.5947. المرحلة 1: 5 خطوط أساسية → المرحلة 2: مجموعات تعزيزية → المرحلة 3: 100 تجربة Optuna + SHAP. مدة العقد ونوعه يهيمنان.
0.8484
XGBoost Optuna AUC
0.5947
XGBoost Optuna F1
0.844 (SVM)
Best baseline AUC
100
Optuna trials
مجموعة البيانات
7,043 عميل اتصالات، 21 ميزة، معدل انسحاب 26.5%
المنهجية
خط أساسي → مجموعة → 100 تجربة Optuna HPO → تفسيرية SHAP
المكدس التقني
PythonXGBoostLightGBMCatBoostOptunaSHAPScikit-learn
الكلمات المفتاحية
XGBoostLightGBMCatBoostOptunaSHAPChurnCustomer Analytics
المرئيات5 مخططات
التعمق
خط أنابيب تمييع من 3 مراحل على مجموعة بيانات Telco Customer.
مجموعة البيانات
- ◂7,043 عميل، 21 ميزة (ديموغرافيا، خدمات، حساب، رسوم)
- ◂نسبة الانسحاب: 26.54% — عدم توازن معتدل، تقسيم طبقي 80/20
المرحلة 1 — مصنفات أساسية
| النموذج | الدقة | AUC |
|---|---|---|
| Logistic Regression | 81.1% | 0.842 |
| Decision Tree | 78.8% | 0.735 |
| SVM | 79.2% | 0.844 |
| Random Forest | 80.4% | 0.843 |
المرحلة 2 — مجموعات التعزيز
| النموذج | الدقة | AUC |
|---|---|---|
| XGBoost | 80.0% | 0.840 |
| LightGBM | 80.0% | 0.813 |
| CatBoost | 79.3% | 0.817 |
| Stacking | 79.8% | 0.834 |
المرحلة 3 — Optuna HPO (XGBoost، 100 تجربة)
- ◂AUC: 0.8484، الدقة: 80.55%، F1 (انسحاب): 0.5947
- ◂الأفضل: n_estimators=500، max_depth=5، lr=0.05، subsample=0.8
أبرز عوامل الانسحاب (SHAP)
- ◂مدة الاشتراك (↓ انسحاب مع طول المدة)
- ◂نوع العقد (شهري = أعلى خطورة)
- ◂الرسوم الشهرية (رسوم أعلى → انسحاب أكثر)
- ◂الدعم التقني (غيابه = انسحاب أعلى)
- ◂خدمة الإنترنت (مستخدمو الألياف ينسحبون أكثر)