تحقيق AUC 0.9648 على كشف الاحتيال IEEE-CIS مع LightGBM
دليل شامل لبناء مجموعة نماذج حققت AUC 0.9648 على مجموعة بيانات IEEE-CIS للكشف عن الاحتيال.
مقالات متعمقة في تعلم الآلة وهندسة الذكاء الاصطناعي وأنظمة ML في الإنتاج
دليل شامل لبناء مجموعة نماذج حققت AUC 0.9648 على مجموعة بيانات IEEE-CIS للكشف عن الاحتيال.
15 تقنية لهندسة الميزات أستخدمها في كل مسابقة Kaggle على البيانات الجدولية.
مقارنة عملية بين XGBoost و LightGBM من حيث السرعة والدقة والذاكرة — مع توصيات للإنتاج.
كيف يتعامل CatBoost مع الميزات الفئوية دون تسرب بيانات باستخدام الترميز المرتب.
بعد أكثر من 20 مشروع تصنيف غير متوازن، إليك ما يصنع الفرق فعلاً.
كيفية استخدام Optuna لتحسين المعلمات الفائقة بما يتجاوز البحث العشوائي.
دليل عملي لقيم SHAP — الأهمية العالمية، التفسيرات المحلية، ورسوم الشلال.
K-Fold، Stratified، GroupKFold، TimeSeriesSplit — دليل عملي لاختيار استراتيجية CV الصحيحة.
سير العمل الدقيق الذي أتبعه في كل مسابقة Kaggle — EDA، خط الأساس، سباقات هندسة الميزات.
متى تعمل الطرق الكلاسيكية ومتى يفوز تعلم الآلة — هندسة الميزات للسلاسل الزمنية.
تنفيذ DQN كامل من الصفر بـ PyTorch — البيئة، وذاكرة التشغيل، واستكشاف epsilon-greedy.
كيف تطور NEAT أوزان وطوبولوجيا الشبكات العصبية — التخصص والتهجين وأرقام الابتكار.
شرح واضح لـ MCTS — الاختيار والتوسع والمحاكاة والنشر الخلفي.
استخدام الخوارزميات الجينية لاختيار الميزات وضبط المعلمات الفائقة والجدولة.
لماذا يجب تغليف كل شيء في Pipeline من sklearn — منع تسرب البيانات، التحقق المتقاطع الصحيح.
استخدام المشفرات التلقائية للكشف عن الشذوذ غير الخاضع للإشراف — عتبة خطأ إعادة البناء.
نهج منظم لمقابلات تصميم نظام تعلم الآلة — صياغة المشكلة واستراتيجية البيانات.
تحليل المصفوفة، التغذية الراجعة الضمنية، والفلترة التعاونية العصبية — تنفيذ عملي.