IA Médicale

Classification du Cancer sur Scanner CT Thoracique

Classification du cancer pulmonaire en 4 classes sur 613 images CT. MobileNetV2 meilleur : 66,03% de précision test. 16 modèles : HOG+8 classiques + CNN personnalisés + TL. MC-Dropout signale les cas incertains pour révision par radiologue.

Voir sur Kaggle

66.03%

MobileNetV2 test acc

64.76%

VGG16 test acc

56.83% (Extra Trees)

Best classical

MC-Dropout passes

Jeu de Données

613 train / 315 test tranches CT — 4 types de cancer pulmonaire

Approche

HOG+classique → CNN personnalisés → TL en 2 phases → incertitude MC-Dropout

Stack Technique

PythonTensorFlow 2.19MobileNetV2VGG16MC-DropoutHOGPCA

Mots-clés

MobileNetV2CT ScanCancerMC-DropoutHOGTensorFlowUncertainty

Visualisations6 Graphiques

Analyse Approfondie

Pipeline multi-méthodes pour la classification CT thoracique en 4 classes de cancer.

Jeu de données

▸613 entraînement / 72 val / 315 test tranches de scanner CT
▸4 classes : adénocarcinome (195), carcinome à grandes cellules (115), normal (148), carcinome épidermoïde (155)
▸Petit dataset — contrainte principale limitant les modèles profonds

Phase 1 — ML Classique (HOG + 8 modèles)

▸HOG : 9 orientations, 8×8 pixels/cellule, niveaux de gris 64×64
▸PCA : 95% de variance à 100 composantes
▸Meilleur : Extra Trees (56,83%), SVM-RBF (55,56%)

Phase 2 — CNN Personnalisés Tous ont mal performé (28–34%) — 613 images insuffisantes pour entraîner des CNNs de zéro.

Phase 3 — Apprentissage par transfert

Modèle	Précision Test
EfficientNetV2S	22,86%
ResNet50	55,24%
Ensemble (MV2 + ResNet50)	62,54%
VGG16	64,76%
MobileNetV2	66,03%

Entraînement 2 phases : base gelée (10–12 ép.) → fine-tuning (15–25 ép.), label smoothing 0,1, perte focale γ=2

Quantification d'Incertitude MC-Dropout 30 passes forward avec dropout actif → distribution de confiance. Prédictions à forte variance → signalées pour révision radiologique. L'IA médicale doit exprimer l'incertitude plutôt que forcer une prédiction sur des données probantes faibles.

Pourquoi MobileNetV2 Gagne L'architecture légère réduit le surapprentissage sur 613 exemples. Les modèles plus lourds surapprennent malgré l'entraînement en 2 phases.

Retour aux Projets Me Recruter