تصنيف سرطان صورة CT للصدر
تصنيف سرطان الرئة بـ 4 فئات على 613 صورة CT. MobileNetV2 الأفضل: 66.03% دقة اختبار. 16 نموذجاً: HOG+8 كلاسيكية + شبكات CNN مخصصة + TL. MC-Dropout يُعلّم الحالات غير المؤكدة لمراجعة الطبيب.
613 تدريب / 315 اختبار شرائح CT — 4 أنواع سرطان رئوي
HOG+كلاسيكي → شبكات CNN مخصصة → نقل تعلم بمرحلتين → عدم يقين MC-Dropout
خط أنابيب متعدد الأساليب لتصنيف 4 فئات من سرطان صور CT الصدر.
مجموعة البيانات
- ◂613 تدريب / 72 تحقق / 315 اختبار شرائح صور CT
- ◂4 فئات: سرطان الغدة (195)، سرطان الخلايا الكبيرة (115)، طبيعي (148)، سرطان الخلايا الحرشفية (155)
- ◂مجموعة بيانات صغيرة — القيد الرئيسي لأداء النماذج العميقة
المرحلة 1 — ML الكلاسيكي (HOG + 8 نماذج)
- ◂HOG: 9 اتجاهات، 8×8 بكسل/خلية، رمادي 64×64
- ◂PCA: 95% تباين عند 100 مكون
- ◂الأفضل: Extra Trees (56.83%)، SVM-RBF (55.56%)
المرحلة 2 — شبكات CNN مخصصة جميعها أداء ضعيف (28-34%) — 613 صورة غير كافية لتدريب من الصفر.
المرحلة 3 — نقل التعلم
| النموذج | دقة الاختبار |
|---|---|
| EfficientNetV2S | 22.86% |
| ResNet50 | 55.24% |
| المجموعة (MV2 + ResNet50) | 62.54% |
| VGG16 | 64.76% |
| MobileNetV2 | 66.03% |
تدريب مرحلتين: قاعدة مجمدة (10-12 حقبة) → ضبط دقيق (15-25 حقبة)، label smoothing 0.1، خسارة بؤرية γ=2
قياس عدم اليقين MC-Dropout 30 تمريرة للأمام مع Dropout → توزيع الثقة. التنبؤات عالية التباين مُعلَّمة لمراجعة الطبيب. الذكاء الاصطناعي الطبي يجب أن يُعبّر عن عدم اليقين بدلاً من إجبار تنبؤ على أدلة ضعيفة.
لماذا يفوز MobileNetV2 البنية الخفيفة تقلل التحيز الزائد على 613 مثالاً. النماذج الأثقل تُفرط في التحيز رغم التدريب بمرحلتين.