كل المشاريع
أكثر من 42 مشروع تعلم آلي في كل المجالات — جميعها على مستوى الإنتاج، موثقة بالكامل
42 مشروع
⭐ مميزكشف احتيال IEEE-CIS
خط أنابيب ML كامل على 590K معاملة، 433 ميزة. LightGBM AUC 0.9648 — مجموعة تكدس LGB+XGB+CatBoost+RF مع هندسة ميزات سلوكية متقدمة.
منصة توليد الصور بالذكاء الاصطناعي (Ofoto)
نشر إنتاجي لـ Stable Diffusion (Automatic1111 + ControlNet) مع خلفية FastAPI وواجهة Vue.js — 500+ طلب متزامن، 99.9% وقت تشغيل، -35% زمن استجابة، -40% وقت الإصدار.
وكيل مبيعات ذكي على واتساب
وكيل مبيعات ذكاء اصطناعي على واتساب للأعمال. يصنف الرسائل (مبيعات/دعم/خارج الموضوع)، يستعلم من قاعدة بيانات Supabase، يستخدم Ollama/Llama3.1 محلياً، ثنائي اللغة FR/AR، ذاكرة محادثة. -90% من وقت المعالجة اليدوية.
⭐ مميزتجزئة صور الموجات فوق الصوتية لسرطان الثدي
معيار قياسي لـ 9 بنى تجزئة على 780 صورة BUSI. DeepLabV3+ في المقدمة بـ Dice 0.7863، IoU 0.6483. FCN → SimpleUNet → SegNet → Attention-UNet → TransUNet → ResNet34-UNet → EfficientNet-UNet → DeepLabV3+ → Swin-UNet.
⭐ مميزكشف الاحتيال على بلوكشين إيثيريوم
كشف احتيال بلوكشين على 9,841 عنوان إيثيريوم. XGBoost+LightGBM+CatBoost+Stacking مع Optuna HPO (40 تجربة) وSHAP. AUC 0.9973، F1 0.9658 عند العتبة المثلى 0.85.
⭐ مميزترجمة آلية عصبية من الإنجليزية إلى الفرنسية
ترجمة آلية عصبية فعّالة في الذاكرة على مجموعة بيانات 6 جيجابايت دون تعطل RAM. Seq2Seq مخصص + ضبط دقيق لـ HuggingFace mBART/Helsinki-NLP. إصلاح 5 أخطاء حرجة (GradientTape، تجاوز tokenizer، API منتهية الصلاحية).

تحليل مشاعر تويتر
خط أنابيب NLP بـ 6 نماذج على 74K تغريدة. DistilBERT يحقق دقة 96.6%. LR+TF-IDF عند 85%. LSTM/Bi-LSTM/CNN يصلون 87-88%. 4 فئات: إيجابي، سلبي، محايد، غير ذي صلة.

كشف الأخبار المزيفة
خط أنابيب NLP بـ 13 نموذجاً على 44,898 مقالة. Soft Voting Ensemble والتكدس يحققان 99.86% دقة، AUC=1.0. خطأين فقط على مجموعة الاختبار الكاملة. DistilBERT بـ 99.87% على مجموعة فرعية 6K.

التعرف على النشاط البشري (HAR)
معيار 14 نموذجاً على 9,299 قراءة من حساسات UCI. SVM الخطي يتصدر بـ 96.1%. t-SNE يُظهر مجموعات نشاط واضحة. PCA يحتفظ بـ 95% من التباين عند ~95 مكوناً. الخلط بين الجلوس/الوقوف هو المصدر الرئيسي للأخطاء.

التنبؤ بانسحاب عملاء الاتصالات
خط أنابيب تمييع بـ 3 مراحل على 7,043 عميل. XGBoost محسّن بـ Optuna: AUC 0.8484، F1 0.5947. المرحلة 1: 5 خطوط أساسية → المرحلة 2: مجموعات تعزيزية → المرحلة 3: 100 تجربة Optuna + SHAP. مدة العقد ونوعه يهيمنان.

احتيال مطالبات تأمين السيارات
خط أنابيب احتيال بـ 16 نموذجاً لـ 15,420 مطالبة (5.99% احتيال). AdaBoost يعظم الاسترجاع (89.2%). XGBoost RandomizedSearchCV: CV AUC 0.9847. SHAP: الخطأ (37.9%) هو المؤشر الرئيسي للاحتيال.

البحث عن الأشخاص بالتعرف على الوجه
تعرف على الوجه بدون تدريب باستخدام تضمينات ResNet-50 (VGGFace2) المدربة مسبقاً. البحث في 13,233 صورة LFW عبر المسافة الإقليدية 128D. 18/19 تطابقات صحيحة عند الحد 0.55. لا يتطلب تدريباً.

التعرف على المشاعر من الوجه
تعرف على 7 مشاعر على RAF-DB (12,271 صورة). مجموعة ResNet50+ViT-Small+EfficientNetB3 تحقق 86.57%. نقل تعلم بمرحلتين. GradCAM يؤكد التركيز على مناطق الفم والحاجب والعين لكل مشعر.

كشف مواقف السيارات الذكية بـ YOLOv8
كشف إشغال مواقف السيارات (حر مقابل محجوز) بـ YOLOv8n. Test mAP50=0.942، mAP50-95=0.798. توقف مبكر عند الحقبة 74. 30 صورة مُعلَّمة بـ CVAT (22/4/4). استدلال: 9 مجانية + 21 محجوزة لكل موقف @ 41.2ms.

كشف السرطان — YOLOv8 (n/s/m)
معيار 3 متغيرات YOLOv8 للكشف عن السرطان. YOLOv8m: test mAP50=0.6782، Precision=0.7633، F1=0.6941. 1,968 صورة تدريبية. تصدير ONNX (49.8 MB) + TorchScript (99.1 MB).

كشف الحيوانات بـ YOLOv8
كشف الحيوانات بـ 80 فئة مع YOLOv8n. mAP@0.5=0.668. الأفضل: النمر (0.967)، عصفور (0.953). الأصعب: الحبار (0.009). ONNX (12.3 MB). 29,071 صورة لـ 80 نوعاً.

تصنيف أمراض النباتات
معيار PlantVillage بـ 15 فئة. MobileNetV2 الأفضل فردياً: 92.86%. المجموعة (MobileNetV2+EfficientNetB3+ResNet50) على الاختبار: 83.43%. عدم توازن 42.5×. إصلاح خطأ إعادة ضبط المولّد الذي سبّب انهيار المجموعة.

تصنيف أنواع الفراشات
خط أنابيب متعدد النماذج من 4 مراحل لتصنيف 75 نوعاً. CNN أساسي → TL مدرب مسبقاً → بنية هجينة متوازية/تسلسلية → رؤوس مساعدة متعددة الخسائر. Grad-CAM يؤكد التركيز على أنماط الأجنحة.

تصنيف سرطان صورة CT للصدر
تصنيف سرطان الرئة بـ 4 فئات على 613 صورة CT. MobileNetV2 الأفضل: 66.03% دقة اختبار. 16 نموذجاً: HOG+8 كلاسيكية + شبكات CNN مخصصة + TL. MC-Dropout يُعلّم الحالات غير المؤكدة لمراجعة الطبيب.

كشف وتجزئة النفايات TACO
معيار 5 نماذج على 1,500 صورة نفايات (4,784 تعليق، 60 فئة). RT-DETR-L الأفضل: mAP50=0.2778، Precision=0.4833. خسارة Faster R-CNN تتقارب من 0.76→0.11. YOLOv8n/s/l + RT-DETR + Faster R-CNN.

تصنيف أرقام لغة الإشارة
شبكة CNN للتعرف على أرقام لغة الإشارة (0-9) على 2,062 صورة متوازنة. دقة تحقق 96.13% عند الحقبة 23، F1 التدريب=0.98. CNN بـ 3 طبقات مع BatchNorm + Dropout. تصدير H5 للنشر.

تصنيف سرطان الثدي (ويسكونسن)
معيار 14 نموذجاً على مجموعة بيانات ويسكونسن (569 عينة). Voting Ensemble: 99.12% دقة. CatBoost: AUC 0.9990. Extra Trees: 98.25%. RF + SVM مضبوطان عبر RandomizedSearchCV/GridSearchCV. SHAP: concave_points_worst يهيمن.

أنظمة توصية الكتب — تصنيف شامل
تصنيف شامل لأنظمة التوصية على BookCrossing (1.1M تقييم): User-CF، Item-CF، SVD/NMF/ALS، قائم على المحتوى، هجين، NCF، AutoRec، GRU4Rec. User-CF RMSE 1.6645.

التنبؤ باستهلاك الطاقة بالساعة
معيار 10 نماذج على 145,366 سجلاً ساعياً لـ PJM (2002-2018). LightGBM الأفضل: MAE=210.8 MW، RMSE=285.4 MW، MAPE=0.66%. Prophet يفشل (MAPE=10.25%). BiLSTM MAPE=2.17%. 26 ميزة lag/rolling/دورية.

التنبؤ بـ EURUSD — أكثر من 30 نموذجاً (كمومي · GNN · انتشار · خوارزمية جينية)
أشمل معيار لـ EURUSD: أكثر من 30 نموذجاً تشمل ML الكمومي (QSVM/QNN/QAE/VQC)، خوارزميات جينية (7 متغيرات + كروموسومات عصبية)، GNN، Neural SDE، Diffusion DDPM. منهجية delta-target. تحسين متعدد الأهداف NSGA-2.

التنبؤ بتفشي كوفيد-19
خط أنابيب بدون تسرب على 188 سجلاً يومياً (يناير-يوليو 2020). الهدف = الحالات اليومية الجديدة (ثابتة). CV Walk-forward TimeSeriesSplit. نموذج SEIR + ARIMA + XGBoost + LSTM + Transformer. يصحح تسرب البيانات التراكمية.

كشف أنماط الطقس
خط أنابيب بـ 9 طرق على 96,453 سجلاً ساعياً. K-Means (sil=0.45، K=3)، DBSCAN، Isolation Forest (1,930 شذوذاً)، LightGBM macro F1=0.74، 1D-CNN 94.85%، LSTM Autoencoder، Prophet (16 يوماً شاذاً).

تعلم آلة على سلسلة إمداد DataCo
ML بدون تسرب على 180,519 طلباً. LightGBM AUC 0.8563 (التسليم المتأخر). Gradient Boosting R²=0.9996 (انحدار الربح). إزالة الأعمدة التي تظهر بعد التنفيذ والتي ترفع AUC=1.0 في معظم الحلول المنشورة.

خط أنابيب ML على إعلانات وظائف LinkedIn
خط أنابيب ML كامل على 123,849 إعلان وظيفي من LinkedIn (2023-2024). التنبؤ بالراتب، تحليل الطلب على المهارات (213K زوجاً)، NLP على الأوصاف. 7 ملفات CSV مرتبطة. تطبيع فترات الدفع (ساعي→سنوي).

ألعاب متقدمة — التعلم التعزيزي العميق
Double Dueling DQN + PER (SumTree). CartPole-v1 محلول في الحلقة 300 (MA-100=441.1، أفضل تقييم 497.2/500). LunarLander-v3 محلول في الحلقة 207 (MA-100=202). شبكة بـ 134,275 معامل مع LayerNorm.

كشف شذوذات أمن شبكات إنترنت الأشياء
كشف اختراق الأنظمة المدمجة مع عدم توازن شديد (10% شذوذ). BiLSTM+Attention: PR-AUC=0.186، Recall=33.3%. تضخيم 5× (Gaussian/MixUp/masking). عدم يقين MC-Dropout. خسارة بؤرية.

توليد الشعر — BERT / GPT-2 / T5 مضبوط دقيقاً
ضبط دقيق لـ BERT وGPT-2 وT5 على مجموعة شعرية للتوليد الإبداعي. 10 نقاط تفتيش محفوظة. تحليل تنوع المفردات لكل شاعر. Beam search + عينات درجة الحرارة. لوحة تقارن جميع المعماريات الـ 3.

التعرف على الأسماء المكتوبة بخط اليد
معيار OCR على 66K صورة. TrOCR (ViT+GPT-2، 334M) الأفضل: CER=0.0481، 80% تطابق تام. CRNN-ResNet34: CER=0.0502. تحسينات AMP + torch.compile + تراكم التدرجات.

التنبؤ بوقت توصيل الطعام
معيار انحدار بـ 16 نموذجاً. الانحدار الخطي يفوز بشكل مفاجئ: RMSE=8.76 دقيقة، R²=0.829. XGBoost مضبوط: RMSE=9.19. المسافة والحركة المرورية تهيمنان. ميزات التفاعل تلتقط اللاخطية للنماذج الخطية.

التنبؤ باستهلاك الكهرباء المنزلية
سلاسل زمنية متعددة النماذج على 2.9M سجل UCI (2006-2010). ARIMA، SARIMA، Prophet، LSTM على Global_active_power. STL يكشف أنماطاً يومية وأسبوعية. مجموعة مع ترجيح inverse-RMSE.

التنبؤ التاريخي بطلب المنتجات
معيار 19 نموذجاً: TS كلاسيكي → ML → DL → مجموعة. CatBoost R²=0.7125 (الأفضل). ML يتفوق على TS الكلاسيكي (SMAPE 115-130% مقابل 35-40% لـ TS، لكن R² سالب لـ TS). CV walk-forward مع Optuna.

تصنيف أوامر الكلام الاصطناعية
CNN صوتي بـ 30 فئة يحقق دقة اختبار 100% على 41,849 عينة. Mel-spectrogram (64 bin) + SpecAugment. CNN بـ 4 كتل، 1.25M معامل. دقة التحقق تبلغ 100% في الحقبة 8. Label smoothing 0.1.

كشف الخطوط (رؤية الحاسوب)
معيار رؤية الحاسوب الكلاسيكية: Hough القياسي (2.53ms، 22 خطاً)، Hough الاحتمالي (4.29ms، 47 مقطعاً)، LSD (23.98ms، 422 مقطعاً). Hough أسرع 6-10 مرات. صور كاميرا Udacity + صور اصطناعية. خط أنابيب HSV+ROI.
توليد وجوه أنمي (DCGAN)
DCGAN مدرب لـ 100 حقبة على Tesla T4 على 43K صورة أنمي. مكدس ConvTranspose2d (100→512→256→128→64→3). β₁=0.5، تمهيد التسميات، StepLR. استيفاء slerp للانتقالات السلسة.
محرك توصيات التجارة الإلكترونية (n8n)
خلفية توصيات إنتاجية: n8n + PostgreSQL، 4 أوضاع (رائج/شراء مشترك/مخصص/إعادة شراء)، 74 عقدة، API webhook، جدولة يومية. لا حاجة لخادم مخصص.
نظام متعدد الوكلاء RAG (n8n + Pinecone)
n8n بـ 109 عقدة: PDF Google Drive → مخزن متجه Pinecone → تضمينات Cohere → وكيل ذكاء اصطناعي Ollama → تجريف Airtop → ممثلو Apify. 5 سير عمل فرعية. RAG كامل + ذاكرة محادثة.