كل المشاريع
رؤية الحاسوب

تصنيف أنواع الفراشات

خط أنابيب متعدد النماذج من 4 مراحل لتصنيف 75 نوعاً. CNN أساسي → TL مدرب مسبقاً → بنية هجينة متوازية/تسلسلية → رؤوس مساعدة متعددة الخسائر. Grad-CAM يؤكد التركيز على أنماط الأجنحة.

مجموعة البيانات

5,199 تدريب / 1,300 تحقق، 75 نوعاً من الفراشات

المنهجية

4 مراحل: CNN أساسي → TL مدرب مسبقاً → هجين متوازي → رؤوس مساعدة متعددة الخسائر

المكدس التقني
PythonTensorFlow/KerasVGG16ResNetGradCAMt-SNE
الكلمات المفتاحية
CNNTransfer LearningMulti-lossGrad-CAMt-SNESpecies Classification
المرئيات5 مخططات
التعمق

استراتيجية تدريب تقدمي من 4 مراحل لتصنيف دقيق لـ 75 نوعاً من الفراشات.

مجموعة البيانات

  • 5,199 صورة تدريب + 1,300 تحقق، 75 نوعاً
  • خلفيات طبيعية، إضاءة متنوعة، انسداد جزئي
  • تضخيم: دوران ±30°، قلب، تكبير 0.2، سطوع/تباين ±20%

التدريب التقدمي من 4 مراحل

المرحلةالبنيةالميزة الرئيسية
1CNN أساسيكتل conv قياسية، خط أساس التضخيم
2شبكات مدربة مسبقاًVGG16/ResNet مجمد → ضبط دقيق
3هجين متوازي/تسلسليفروع متعددة المقاييس مدموجة
4خسارة متعددة مساعدةرؤوس مساعدة في الطبقات المتوسطة

التدريب متعدد الخسائر تُوفّر الرؤوس المساعدة إشارات تدرج أعمق في الشبكة، مما يقلل من تلاشي التدرج ويجبر الميزات المتوسطة على أن تكون ذات معنى دلالي.

البنية الهجينة تلتقط الفروع المتوازية ميزات بأحجام مجالات استقبال مختلفة في آنٍ واحد — حيوي لأن أنماط الأجنحة موجودة على مقاييس دقيقة (عروق) وخشنة (بقع ألوان) معاً.

قابلية التفسير

  • Grad-CAM: النموذج يركز على أنماط الأجنحة، لا على الخلفية
  • t-SNE: تجميع واضح بين الأنواع رغم التشابه البصري

تحدي التصنيف الدقيق صعب بسبب: (1) تباين كبير داخل الفئة، (2) تشابه كبير بين الفئات، (3) خلفيات طبيعية. الاستراتيجية متعددة المقاييس + متعددة الخسائر تعالج الثلاثة مباشرة.