كل المشاريع
رؤية الحاسوب

تصنيف أرقام لغة الإشارة

شبكة CNN للتعرف على أرقام لغة الإشارة (0-9) على 2,062 صورة متوازنة. دقة تحقق 96.13% عند الحقبة 23، F1 التدريب=0.98. CNN بـ 3 طبقات مع BatchNorm + Dropout. تصدير H5 للنشر.

96.13%
Validation accuracy
98%
Training accuracy
0.96
Validation F1
23
Epochs to converge
مجموعة البيانات

2,062 صورة رمادية 64×64 — 10 فئات أرقام متوازنة

المنهجية

CNN بـ 3 كتل مع BatchNorm + Dropout → توقف مبكر → تصدير H5 للنشر

المكدس التقني
PythonKeras/TensorFlowCNNBatchNormH5 export
الكلمات المفتاحية
CNNSign LanguageAccessibilityBatchNormKerasH5 Export
المرئيات5 مخططات
التعمق

التعرف على أرقام لغة الإشارة — من الصور الخام إلى نموذج H5 جاهز للنشر.

مجموعة البيانات

  • 2,062 صورة رمادية 64×64: 10 فئات (أرقام 0-9)
  • تدريب: 1,649 (163±17 لكل فئة) / تحقق: 413 (40±7 لكل فئة)
  • متوازن جيداً — لا حاجة لأوزان الفئات أو التضخيم

بنية CNN

Conv2D(32، 3×3) → BatchNorm → ReLU → MaxPool(2×2)
Conv2D(64، 3×3) → BatchNorm → ReLU → MaxPool(2×2)
Conv2D(128، 3×3) → BatchNorm → ReLU → MaxPool(2×2)
Dense(128) → Dropout(0.3) → Dense(10، softmax)

التدريب

  • المحسّن: Adam (lr=1e-3) | الخسارة: انتروبيا متقاطعة فئوية
  • توقف مبكر: عند الحقبة 23 (هدف val_acc ≥ 95%)

النتائج

الحقبةدقة التدريبدقة التحققخسارة التحقق
1089%88%0.45
2097%95%0.22
2398%96.13%0.165
  • F1 مرجح (تدريب): 0.98 | F1 مرجح (تحقق): 0.96
  • تصدير: my_cnn_model.h5

مسار النشر تجزئة اليد → اقتصاص 64×64 → تنبؤ CNN → مخرج الرقم. البنية البسيطة تضمن استدلالاً سريعاً حتى على المعالج.