تعلم آلة على سلسلة إمداد DataCo
ML بدون تسرب على 180,519 طلباً. LightGBM AUC 0.8563 (التسليم المتأخر). Gradient Boosting R²=0.9996 (انحدار الربح). إزالة الأعمدة التي تظهر بعد التنفيذ والتي ترفع AUC=1.0 في معظم الحلول المنشورة.
DataCo SCMS: 180,519 سجلاً (بعد مراجعة التسرب)
مراجعة التسرب → مهمة مزدوجة (تصنيف + انحدار) → تحقق CV بـ 5 أضعاف
تحليل ML متقدم على سلسلة إمداد DataCo مع إصلاح حيوي لتسرب البيانات.
مجموعة البيانات
- ◂180,519 طلباً، 53 ميزة خام → 44 بعد مراجعة التسرب
مراجعة التسرب — الأعمدة المحذوفة
| العمود | سبب الحذف |
|---|---|
| أيام الشحن (الفعلي) | نتيجة فعلية — غير متاحة وقت التنبؤ |
| حالة التسليم | تشفير مباشر للهدف |
| الفائدة لكل طلب | حساب ما بعد التنفيذ |
| مبيعات لكل عميل | مجمّع بعد التسليم |
بدون تسرب: AUC ~0.86. مع تسرب: AUC = 1.0 (معظم النتائج المنشورة — غير صالحة).
المهمة 1: تصنيف التسليم المتأخر LightGBM الأفضل: دقة 74.5%، AUC 0.856. CV 5 أضعاف: 0.851±0.002
المهمة 2: انحدار ربح الطلب Gradient Boosting الأفضل: RMSE 2.04، R² 0.9996
الميزات المهندَسة (وقت الطلب فقط) order_month، day_of_week، hour، quarter، discount_rate، price_band