Tous les Projets
IA Médicale

Classification du Cancer sur Scanner CT Thoracique

Classification du cancer pulmonaire en 4 classes sur 613 images CT. MobileNetV2 meilleur : 66,03% de précision test. 16 modèles : HOG+8 classiques + CNN personnalisés + TL. MC-Dropout signale les cas incertains pour révision par radiologue.

66.03%
MobileNetV2 test acc
64.76%
VGG16 test acc
56.83% (Extra Trees)
Best classical
30
MC-Dropout passes
Jeu de Données

613 train / 315 test tranches CT — 4 types de cancer pulmonaire

Approche

HOG+classique → CNN personnalisés → TL en 2 phases → incertitude MC-Dropout

Stack Technique
PythonTensorFlow 2.19MobileNetV2VGG16MC-DropoutHOGPCA
Mots-clés
MobileNetV2CT ScanCancerMC-DropoutHOGTensorFlowUncertainty
Visualisations6 Graphiques
Analyse Approfondie

Pipeline multi-méthodes pour la classification CT thoracique en 4 classes de cancer.

Jeu de données

  • 613 entraînement / 72 val / 315 test tranches de scanner CT
  • 4 classes : adénocarcinome (195), carcinome à grandes cellules (115), normal (148), carcinome épidermoïde (155)
  • Petit dataset — contrainte principale limitant les modèles profonds

Phase 1 — ML Classique (HOG + 8 modèles)

  • HOG : 9 orientations, 8×8 pixels/cellule, niveaux de gris 64×64
  • PCA : 95% de variance à 100 composantes
  • Meilleur : Extra Trees (56,83%), SVM-RBF (55,56%)

Phase 2 — CNN Personnalisés Tous ont mal performé (28–34%) — 613 images insuffisantes pour entraîner des CNNs de zéro.

Phase 3 — Apprentissage par transfert

ModèlePrécision Test
EfficientNetV2S22,86%
ResNet5055,24%
Ensemble (MV2 + ResNet50)62,54%
VGG1664,76%
MobileNetV266,03%

Entraînement 2 phases : base gelée (10–12 ép.) → fine-tuning (15–25 ép.), label smoothing 0,1, perte focale γ=2

Quantification d'Incertitude MC-Dropout 30 passes forward avec dropout actif → distribution de confiance. Prédictions à forte variance → signalées pour révision radiologique. L'IA médicale doit exprimer l'incertitude plutôt que forcer une prédiction sur des données probantes faibles.

Pourquoi MobileNetV2 Gagne L'architecture légère réduit le surapprentissage sur 613 exemples. Les modèles plus lourds surapprennent malgré l'entraînement en 2 phases.