العودة إلى المدونة
Machine Learning 20 فبراير 2025 9 min للقراءة

استراتيجيتي في مسابقات Kaggle: من البرونز إلى الذهب

سير العمل الدقيق الذي أتبعه في كل مسابقة Kaggle — EDA، خط الأساس، سباقات هندسة الميزات.

الأسبوع 1: الأساس

  1. EDA (يومان): تحليل التوزيعات، القيم المفقودة، فحص تسرب الهدف
  2. خط الأساس (يوم): نموذج بسيط، تثبيت درجة CV
  3. قابلية إعادة الإنتاج (يوم): تثبيت البذور وإعداد خط أنابيب CV

الأسبوعان 2-3: هندسة الميزات

اعمل بسباقات من 2-3 ميزات، ولا تعتمد إلا إذا تحسّنت CV:

  • ابدأ بالميزات الواضحة في المجال
  • أضف تجميعات حسب أعمدة الكيانات الرئيسية
  • استخرج مكوّنات التاريخ/الوقت
  • احسب التفاعلات الثنائية

الأسبوع 4: المجموعة (Ensemble)

  1. درّب 5-10 نماذج أساس متنوعة
  2. احجز 20% كمجموعة تحقق للـ ensemble
  3. استخدم متوسطاً مرجّحاً بسيطاً مضبوطاً بـ Optuna
  4. لا تلجأ للـ stacking إلا إذا كان لديك وقت لإجراء CV سليم

آخر 3 أيام: الدفعة الأخيرة

  • قدّم 3-4 متغيرات من المجموعة
  • اختر النهائي بناءً على توازن CV+LB
  • لا تفرط في ملاءمة لوحة الصدارة (احتفظ بتقديمين احتياطيين)
KaggleCompetitionStrategyEnsembleFeature Engineering
O

Ossama Elhakki

مهندس ذكاء اصطناعي وأنظمة ML — المغرب