تحقيق AUC 0.9648 على كشف الاحتيال IEEE-CIS مع LightGBM
دليل شامل لبناء مجموعة نماذج حققت AUC 0.9648 على مجموعة بيانات IEEE-CIS للكشف عن الاحتيال.
مقالات متعمقة في تعلم الآلة وهندسة الذكاء الاصطناعي وأنظمة ML في الإنتاج
دليل شامل لبناء مجموعة نماذج حققت AUC 0.9648 على مجموعة بيانات IEEE-CIS للكشف عن الاحتيال.
15 تقنية لهندسة الميزات أستخدمها في كل مسابقة Kaggle على البيانات الجدولية.
كيف بنيت خط أنابيب U-Net لتجزئة آفات الجلد على ISIC 2018 — من Dice 0.72 إلى 0.796.
كيف نشرت Stable Diffusion مع ControlNet في Ofoto — قرارات المعمارية، API، وهندسة المطالبات.
كل ما تعلمته من ضبط BERT عبر أكثر من 10 مشاريع NLP — التحليل، جداول معدل التعلم، تجميد الطبقات.
معمارية وكود لنظام RAG إنتاجي — استراتيجيات التقطيع، نماذج التضمين، البحث الهجين.
كيف بنيت وكيل ذكاء اصطناعي WhatsApp لمتجر إلكتروني مغربي — المعمارية والذاكرة وأسئلة المنتجات.
مقارنة عملية بين XGBoost و LightGBM من حيث السرعة والدقة والذاكرة — مع توصيات للإنتاج.
كيف يتعامل CatBoost مع الميزات الفئوية دون تسرب بيانات باستخدام الترميز المرتب.
بعد أكثر من 20 مشروع تصنيف غير متوازن، إليك ما يصنع الفرق فعلاً.
كيفية استخدام Optuna لتحسين المعلمات الفائقة بما يتجاوز البحث العشوائي.
دليل عملي لقيم SHAP — الأهمية العالمية، التفسيرات المحلية، ورسوم الشلال.
K-Fold، Stratified، GroupKFold، TimeSeriesSplit — دليل عملي لاختيار استراتيجية CV الصحيحة.
دليل شامل لتدريب YOLOv8 على مجموعة بيانات مخصصة — من التوسيم حتى نشر FastAPI.
تنفيذ خطوة بخطوة لمعمارية Attention is All You Need الأصلية.
الدقة المختلطة، وnuanced gradients، وضبط DataLoader، وtorch.compile، و6 حيل أخرى بقياسات حقيقية.
دليل عملي لمعالجة اللغة العربية — أفضل النماذج، تحديات المعالجة المسبقة، التعامل مع اللهجات.
Chain-of-thought، few-shot، مطالبات النظام، وضع JSON و5 أنماط أخرى مع أمثلة حقيقية.
تأهيل العملاء المحتملين، معالجة الوثائق، أتمتة وسائل التواصل — تدفقات عمل حقيقية بعائد استثمار حقيقي.
معماريات المنسق-العامل، وPeer-to-Peer، والهرمية — متى تستخدم كل منها.
كيفية بناء خط أنابيب MLOps كامل — إصدار البيانات، تتبع التجارب، سجل النماذج.
انجراف البيانات مقابل انجراف المفاهيم — طرق الكشف، ولوحات المراقبة.
من pickle إلى FastAPI الإنتاجي — الاستدلال غير المتزامن، التحقق من المدخلات، حد المعدل، الفحوصات الصحية.
سير العمل الدقيق الذي أتبعه في كل مسابقة Kaggle — EDA، خط الأساس، سباقات هندسة الميزات.
متى تعمل الطرق الكلاسيكية ومتى يفوز تعلم الآلة — هندسة الميزات للسلاسل الزمنية.
تنفيذ DQN كامل من الصفر بـ PyTorch — البيئة، وذاكرة التشغيل، واستكشاف epsilon-greedy.
نظام التعرف على الوجوه من البداية إلى النهاية — الكشف والمحاذاة واستخراج التضمينات.
كيفية ضبط EfficientNet لتصنيف الصور المخصصة — جداول إلغاء التجميد والزيادة وتنعيم التسميات.
حيل تدريب GAN لمنع انهيار النمط — التطبيع الطيفي، النمو التدريجي، عقوبة التدرج.
من 10 دقائق إلى 30 ثانية: تصغير أنواع البيانات، والتجهيز المتجه، والرجوع إلى Dask.
كيفية استخدام PostgreSQL كمخزن للميزات — مشاهدات مجسدة للتجميعات، والتقسيم للسلاسل الزمنية.
كيف تطور NEAT أوزان وطوبولوجيا الشبكات العصبية — التخصص والتهجين وأرقام الابتكار.
شرح واضح لـ MCTS — الاختيار والتوسع والمحاكاة والنشر الخلفي.
استخدام الخوارزميات الجينية لاختيار الميزات وضبط المعلمات الفائقة والجدولة.
إعداد Ollama للاستخدام الإنتاجي — اختيار النموذج، تكامل API، وتشغيل Llama 3.1 محلياً.
معيار عملي لأفضل قواعد البيانات المتجهية — سرعة الفهرسة والكمون والتصفية.
أفضل الممارسات لاحتواء كود تعلم الآلة — البناءات متعددة المراحل، دعم GPU، تخزين النماذج مؤقتاً.
لماذا يجب تغليف كل شيء في Pipeline من sklearn — منع تسرب البيانات، التحقق المتقاطع الصحيح.
معيار قياس نماذج التضمين من OpenAI و Cohere و E5 و BGE و Jina على مهام الاسترجاع.
استخدام المشفرات التلقائية للكشف عن الشذوذ غير الخاضع للإشراف — عتبة خطأ إعادة البناء.
استخدام GPU، وتشخيص الاختناقات، وتحسين DataLoader — تقنيات عملية للتدريب 2x أسرع.
بناء مصنف المشاعر للإنتاج لمراجعات العملاء العربية — تنظيم مجموعة البيانات وتحديات المعالجة المسبقة.
Mixup وCutMix وAugMix والبيانات الاصطناعية مع GANs — ماذا تستخدم عندما تكون مجموعة بياناتك صغيرة.
نهج منظم لمقابلات تصميم نظام تعلم الآلة — صياغة المشكلة واستراتيجية البيانات.
التقطيع، والتطبيع، والجذع مقابل الليمة، وترميز الكلمات الفرعية.
تحليل المصفوفة، التغذية الراجعة الضمنية، والفلترة التعاونية العصبية — تنفيذ عملي.
نشر Whisper من OpenAI للنسخ متعدد اللغات — اختيار النموذج والتحسينات وضبط الدارجة المغربية.
التكميم INT8 والتقليم المنظم وتقطير المعرفة — تقليص حجم النموذج بنسبة 90% مع الحفاظ على 95% من الدقة.