Classification du Cancer sur Scanner CT Thoracique
Classification du cancer pulmonaire en 4 classes sur 613 images CT. MobileNetV2 meilleur : 66,03% de précision test. 16 modèles : HOG+8 classiques + CNN personnalisés + TL. MC-Dropout signale les cas incertains pour révision par radiologue.
613 train / 315 test tranches CT — 4 types de cancer pulmonaire
HOG+classique → CNN personnalisés → TL en 2 phases → incertitude MC-Dropout
Pipeline multi-méthodes pour la classification CT thoracique en 4 classes de cancer.
Jeu de données
- ▸613 entraînement / 72 val / 315 test tranches de scanner CT
- ▸4 classes : adénocarcinome (195), carcinome à grandes cellules (115), normal (148), carcinome épidermoïde (155)
- ▸Petit dataset — contrainte principale limitant les modèles profonds
Phase 1 — ML Classique (HOG + 8 modèles)
- ▸HOG : 9 orientations, 8×8 pixels/cellule, niveaux de gris 64×64
- ▸PCA : 95% de variance à 100 composantes
- ▸Meilleur : Extra Trees (56,83%), SVM-RBF (55,56%)
Phase 2 — CNN Personnalisés Tous ont mal performé (28–34%) — 613 images insuffisantes pour entraîner des CNNs de zéro.
Phase 3 — Apprentissage par transfert
| Modèle | Précision Test |
|---|---|
| EfficientNetV2S | 22,86% |
| ResNet50 | 55,24% |
| Ensemble (MV2 + ResNet50) | 62,54% |
| VGG16 | 64,76% |
| MobileNetV2 | 66,03% |
Entraînement 2 phases : base gelée (10–12 ép.) → fine-tuning (15–25 ép.), label smoothing 0,1, perte focale γ=2
Quantification d'Incertitude MC-Dropout 30 passes forward avec dropout actif → distribution de confiance. Prédictions à forte variance → signalées pour révision radiologique. L'IA médicale doit exprimer l'incertitude plutôt que forcer une prédiction sur des données probantes faibles.
Pourquoi MobileNetV2 Gagne L'architecture légère réduit le surapprentissage sur 613 exemples. Les modèles plus lourds surapprennent malgré l'entraînement en 2 phases.