Classification d'Espèces de Papillons
Pipeline multi-modèle en 4 phases pour la classification de 75 espèces. CNN vanille → TL préentraîné → architecture hybride parallèle/séquentielle → têtes auxiliaires multi-perte. Grad-CAM confirme la focalisation sur les motifs d'ailes.
5 199 train / 1 300 val, 75 espèces de papillons
4 phases : CNN vanille → TL préentraîné → hybride parallèle → têtes auxiliaires multi-perte
Stratégie d'entraînement progressive en 4 phases pour la classification fine-grained de 75 espèces de papillons.
Jeu de données
- ▸5 199 images entraînement + 1 300 validation, 75 espèces
- ▸Arrière-plans naturels, éclairage variable, occlusion
- ▸Augmentation : rotation ±30°, flip, zoom 0,2, luminosité/contraste ±20%
Entraînement Progressif en 4 Phases
| Phase | Architecture | Caractéristique Clé |
|---|---|---|
| 1 | CNN Vanille | Blocs conv standards, baseline augmentation |
| 2 | CNN Préentraînés | VGG16/ResNet gelé → fine-tuné |
| 3 | Hybride parallèle/séquentiel | Branches multi-échelles fusionnées |
| 4 | Perte multi-auxiliaire | Têtes auxiliaires aux couches intermédiaires |
Entraînement Multi-Perte Les têtes auxiliaires fournissent des signaux de gradient plus profondément dans le réseau. Pour 75 classes, cela réduit le gradient évanescent et force les features intermédiaires à être sémantiquement significatives.
Architecture Hybride Les branches parallèles capturent des features à différentes tailles de champs récepteurs — crucial car les motifs d'ailes existent à la fois à des échelles fines (nervures) et grossières (patches de couleur).
Interprétabilité
- ▸Grad-CAM : Le modèle se concentre correctement sur les motifs d'ailes, pas sur l'arrière-plan
- ▸t-SNE : Clustering inter-espèces clair malgré la similarité visuelle
Défi Fine-Grained Identifier 75 espèces est difficile à cause : (1) forte variation intra-classe, (2) forte similarité inter-classes, (3) arrière-plans naturels. La stratégie multi-échelles + multi-perte adresse les trois directement.