Segmentation d'Échographies du Cancer du Sein
Benchmark de 9 architectures de segmentation sur 780 images BUSI. DeepLabV3+ en tête avec Dice 0,7863, IoU 0,6483. FCN → SimpleUNet → SegNet → Attention-UNet → TransUNet → ResNet34-UNet → EfficientNet-UNet → DeepLabV3+ → Swin-UNet.
780 images d'échographie mammaire (437 bénignes, 210 malignes, 133 normales)
Benchmark de 9 architectures : encodeurs classiques → transformeur (TransUNet) → ASPP (DeepLabV3+)
Benchmark complet de 9 architectures de segmentation sur le dataset BUSI (Breast Ultrasound Images).
Données
- ▸780 images : 437 bénignes / 210 malignes / 133 normales (stratification par classe)
- ▸Division : 585 entraînement / 117 validation / 78 test
- ▸Prétraitement : redimensionnement 256×256, augmentation Albumentations (élastique, luminosité, flip horizontal)
- ▸Perte : 50/50 BCE + Dice combinées
Benchmark des architectures
| Modèle | Params | Dice | IoU | Type |
|---|---|---|---|---|
| FCN | — | 0.4822 | — | Baseline sémantique |
| SimpleUNet | 31M | 0.7030 | 0.5424 | Encodeur-décodeur standard |
| SegNet | 7M | 0.6725 | — | Décodeur pooling-index |
| Attention UNet | 31M | 0.6964 | — | Portes d'attention sur skip |
| TransUNet | 124M | 0.6663 | — | Encodeur ViT + décodeur CNN |
| EfficientNet-UNet | 20M | 0.7241 | 0.5683 | Encodeur EfficientNet-B4 |
| ResNet34-UNet | 24M | 0.7837 | 0.6440 | Encodeur ResNet préentraîné |
| DeepLabV3+ | 27M | 0.7863 | 0.6483 | ASPP multi-échelle |
| Swin-UNet | Élevé | — | — | Basé transformeur |
Configuration d'entraînement
- ▸30 époques, AdamW + cosine annealing LR
- ▸Précision mixte (AMP), arrêt anticipé
- ▸Métriques : Dice, IoU, F1, Précision, Rappel (TorchMetrics)
Pourquoi DeepLabV3+ gagne L'ASPP (Atrous Spatial Pyramid Pooling) avec output_stride=16 extrait le contexte multi-échelle sans effondrement spatial — crucial pour les tumeurs mammaires allant de 2mm à 30mm. Cela évite la perte de résolution spatiale qui affecte les encodeurs standard sur les petites lésions.