كل المشاريع
كشف الاحتيال

التنبؤ بانسحاب عملاء الاتصالات

خط أنابيب تمييع بـ 3 مراحل على 7,043 عميل. XGBoost محسّن بـ Optuna: AUC 0.8484، F1 0.5947. المرحلة 1: 5 خطوط أساسية → المرحلة 2: مجموعات تعزيزية → المرحلة 3: 100 تجربة Optuna + SHAP. مدة العقد ونوعه يهيمنان.

0.8484
XGBoost Optuna AUC
0.5947
XGBoost Optuna F1
0.844 (SVM)
Best baseline AUC
100
Optuna trials
مجموعة البيانات

7,043 عميل اتصالات، 21 ميزة، معدل انسحاب 26.5%

المنهجية

خط أساسي → مجموعة → 100 تجربة Optuna HPO → تفسيرية SHAP

المكدس التقني
PythonXGBoostLightGBMCatBoostOptunaSHAPScikit-learn
الكلمات المفتاحية
XGBoostLightGBMCatBoostOptunaSHAPChurnCustomer Analytics
المرئيات5 مخططات
التعمق

خط أنابيب تمييع من 3 مراحل على مجموعة بيانات Telco Customer.

مجموعة البيانات

  • 7,043 عميل، 21 ميزة (ديموغرافيا، خدمات، حساب، رسوم)
  • نسبة الانسحاب: 26.54% — عدم توازن معتدل، تقسيم طبقي 80/20

المرحلة 1 — مصنفات أساسية

النموذجالدقةAUC
Logistic Regression81.1%0.842
Decision Tree78.8%0.735
SVM79.2%0.844
Random Forest80.4%0.843

المرحلة 2 — مجموعات التعزيز

النموذجالدقةAUC
XGBoost80.0%0.840
LightGBM80.0%0.813
CatBoost79.3%0.817
Stacking79.8%0.834

المرحلة 3 — Optuna HPO (XGBoost، 100 تجربة)

  • AUC: 0.8484، الدقة: 80.55%، F1 (انسحاب): 0.5947
  • الأفضل: n_estimators=500، max_depth=5، lr=0.05، subsample=0.8

أبرز عوامل الانسحاب (SHAP)

  1. مدة الاشتراك (↓ انسحاب مع طول المدة)
  2. نوع العقد (شهري = أعلى خطورة)
  3. الرسوم الشهرية (رسوم أعلى → انسحاب أكثر)
  4. الدعم التقني (غيابه = انسحاب أعلى)
  5. خدمة الإنترنت (مستخدمو الألياف ينسحبون أكثر)