كل المشاريع
ذكاء اصطناعي طبيرؤية الحاسوب⭐ مميز

تجزئة صور الموجات فوق الصوتية لسرطان الثدي

معيار قياسي لـ 9 بنى تجزئة على 780 صورة BUSI. DeepLabV3+ في المقدمة بـ Dice 0.7863، IoU 0.6483. FCN → SimpleUNet → SegNet → Attention-UNet → TransUNet → ResNet34-UNet → EfficientNet-UNet → DeepLabV3+ → Swin-UNet.

0.7863
Best Dice (DeepLabV3+)
0.6483
Best IoU
9
Architectures tested
780 images
Dataset size
مجموعة البيانات

780 صورة موجات فوق صوتية للثدي (437 حميدة، 210 خبيثة، 133 طبيعية)

المنهجية

معيار قياسي لـ 9 بنى: مشفرات كلاسيكية → محول (TransUNet) → ASPP (DeepLabV3+)

المكدس التقني
PythonPyTorchsegmentation_models_pytorchtimmAlbumentationsCUDA Tesla T4
الكلمات المفتاحية
U-NetDeepLabV3+ASPPSegmentationPyTorchMedical Imaging
المرئيات7 مخططات
التعمق

معيار قياسي شامل لـ 9 بنى تجزئة على مجموعة بيانات BUSI (صور الموجات فوق الصوتية للثدي).

مجموعة البيانات

  • 780 صورة: 437 حميدة / 210 خبيثة / 133 طبيعية (طبقية حسب الفئة)
  • التقسيم: 585 تدريب / 117 تحقق / 78 اختبار
  • المعالجة المسبقة: تغيير الحجم 256×256، تضخيم Albumentations (مرونة، إضاءة، قلب أفقي)
  • الخسارة: 50/50 BCE + Dice مدمجتان

معيار البنى

النموذجالمعاملاتDiceIoUالنوع
FCN0.4822خط أساس دلالي
SimpleUNet31M0.70300.5424مشفر-فك تشفير معياري
SegNet7M0.6725فك تشفير pooling-index
Attention UNet31M0.6964بوابات انتباه على skip
TransUNet124M0.6663مشفر ViT + فك تشفير CNN
EfficientNet-UNet20M0.72410.5683مشفر EfficientNet-B4
ResNet34-UNet24M0.78370.6440مشفر ResNet مدرب مسبقاً
DeepLabV3+27M0.78630.6483ASPP متعدد المقاييس
Swin-UNetمرتفعقائم على المحول

إعداد التدريب

  • 30 حقبة، AdamW + cosine annealing LR
  • دقة مختلطة (AMP)، توقف مبكر
  • المقاييس: Dice، IoU، F1، الدقة، الاسترجاع (TorchMetrics)

لماذا يتفوق DeepLabV3+ يستخرج ASPP (Atrous Spatial Pyramid Pooling) بـ output_stride=16 السياق متعدد المقاييس دون انهيار مكاني — أمر بالغ الأهمية للأورام الثديية التي تتراوح بين 2-30 ملم. هذا يمنع فقدان الدقة المكانية الذي يضر المشفرات القياسية على الآفات الصغيرة.