ذكاء اصطناعي طبي

تصنيف سرطان صورة CT للصدر

تصنيف سرطان الرئة بـ 4 فئات على 613 صورة CT. MobileNetV2 الأفضل: 66.03% دقة اختبار. 16 نموذجاً: HOG+8 كلاسيكية + شبكات CNN مخصصة + TL. MC-Dropout يُعلّم الحالات غير المؤكدة لمراجعة الطبيب.

عرض على كاغل

66.03%

MobileNetV2 test acc

64.76%

VGG16 test acc

56.83% (Extra Trees)

Best classical

MC-Dropout passes

مجموعة البيانات

613 تدريب / 315 اختبار شرائح CT — 4 أنواع سرطان رئوي

المنهجية

HOG+كلاسيكي → شبكات CNN مخصصة → نقل تعلم بمرحلتين → عدم يقين MC-Dropout

المكدس التقني

PythonTensorFlow 2.19MobileNetV2VGG16MC-DropoutHOGPCA

الكلمات المفتاحية

MobileNetV2CT ScanCancerMC-DropoutHOGTensorFlowUncertainty

المرئيات6 مخططات

التعمق

خط أنابيب متعدد الأساليب لتصنيف 4 فئات من سرطان صور CT الصدر.

مجموعة البيانات

◂613 تدريب / 72 تحقق / 315 اختبار شرائح صور CT
◂4 فئات: سرطان الغدة (195)، سرطان الخلايا الكبيرة (115)، طبيعي (148)، سرطان الخلايا الحرشفية (155)
◂مجموعة بيانات صغيرة — القيد الرئيسي لأداء النماذج العميقة

المرحلة 1 — ML الكلاسيكي (HOG + 8 نماذج)

◂HOG: 9 اتجاهات، 8×8 بكسل/خلية، رمادي 64×64
◂PCA: 95% تباين عند 100 مكون
◂الأفضل: Extra Trees (56.83%)، SVM-RBF (55.56%)

المرحلة 2 — شبكات CNN مخصصة جميعها أداء ضعيف (28-34%) — 613 صورة غير كافية لتدريب من الصفر.

المرحلة 3 — نقل التعلم

النموذج	دقة الاختبار
EfficientNetV2S	22.86%
ResNet50	55.24%
المجموعة (MV2 + ResNet50)	62.54%
VGG16	64.76%
MobileNetV2	66.03%

تدريب مرحلتين: قاعدة مجمدة (10-12 حقبة) → ضبط دقيق (15-25 حقبة)، label smoothing 0.1، خسارة بؤرية γ=2

قياس عدم اليقين MC-Dropout 30 تمريرة للأمام مع Dropout → توزيع الثقة. التنبؤات عالية التباين مُعلَّمة لمراجعة الطبيب. الذكاء الاصطناعي الطبي يجب أن يُعبّر عن عدم اليقين بدلاً من إجبار تنبؤ على أدلة ضعيفة.

لماذا يفوز MobileNetV2 البنية الخفيفة تقلل التحيز الزائد على 613 مثالاً. النماذج الأثقل تُفرط في التحيز رغم التدريب بمرحلتين.

العودة إلى المشاريع توظيفي