كل المشاريع
سلاسل زمنية

تعلم آلة على سلسلة إمداد DataCo

ML بدون تسرب على 180,519 طلباً. LightGBM AUC 0.8563 (التسليم المتأخر). Gradient Boosting R²=0.9996 (انحدار الربح). إزالة الأعمدة التي تظهر بعد التنفيذ والتي ترفع AUC=1.0 في معظم الحلول المنشورة.

0.8563
LightGBM AUC (class)
0.9996
GB R² (regression)
2.04
GB RMSE (profit $)
0.862 ± 0.001
5-fold CV RF AUC
مجموعة البيانات

DataCo SCMS: 180,519 سجلاً (بعد مراجعة التسرب)

المنهجية

مراجعة التسرب → مهمة مزدوجة (تصنيف + انحدار) → تحقق CV بـ 5 أضعاف

المكدس التقني
PythonXGBoost 3.2.0LightGBM 4.6.0Gradient BoostingPandas
الكلمات المفتاحية
XGBoostLightGBMSupply ChainLeakage-FreeClassificationRegression
المرئيات6 مخططات
التعمق

تحليل ML متقدم على سلسلة إمداد DataCo مع إصلاح حيوي لتسرب البيانات.

مجموعة البيانات

  • 180,519 طلباً، 53 ميزة خام → 44 بعد مراجعة التسرب

مراجعة التسرب — الأعمدة المحذوفة

العمودسبب الحذف
أيام الشحن (الفعلي)نتيجة فعلية — غير متاحة وقت التنبؤ
حالة التسليمتشفير مباشر للهدف
الفائدة لكل طلبحساب ما بعد التنفيذ
مبيعات لكل عميلمجمّع بعد التسليم

بدون تسرب: AUC ~0.86. مع تسرب: AUC = 1.0 (معظم النتائج المنشورة — غير صالحة).

المهمة 1: تصنيف التسليم المتأخر LightGBM الأفضل: دقة 74.5%، AUC 0.856. CV 5 أضعاف: 0.851±0.002

المهمة 2: انحدار ربح الطلب Gradient Boosting الأفضل: RMSE 2.04، R² 0.9996

الميزات المهندَسة (وقت الطلب فقط) order_month، day_of_week، hour، quarter، discount_rate، price_band