Tous les Projets
Vision par Ordinateur

Classification des Chiffres en Langue des Signes

CNN pour la reconnaissance de chiffres en langue des signes (0–9) sur 2 062 images équilibrées. 96,13% de précision de validation à l'époque 23, F1 entraînement=0,98. CNN à 3 couches avec BatchNorm + Dropout. Exporté en H5 pour déploiement.

96.13%
Validation accuracy
98%
Training accuracy
0.96
Validation F1
23
Epochs to converge
Jeu de Données

2 062 images en niveaux de gris 64×64 — 10 classes de chiffres équilibrées

Approche

CNN à 3 blocs avec BatchNorm + Dropout → arrêt anticipé → export H5 pour déploiement

Stack Technique
PythonKeras/TensorFlowCNNBatchNormH5 export
Mots-clés
CNNSign LanguageAccessibilityBatchNormKerasH5 Export
Visualisations5 Graphiques
Analyse Approfondie

Reconnaissance de chiffres en langue des signes — des images brutes à un modèle H5 prêt pour le déploiement.

Jeu de données

  • 2 062 images en niveaux de gris 64×64 : 10 classes (chiffres 0–9)
  • Entraînement : 1 649 (163±17 par classe) / Val : 413 (40±7 par classe)
  • Bien équilibré — pas de pondération de classes ni d'augmentation nécessaire

Architecture CNN

Conv2D(32, 3×3) → BatchNorm → ReLU → MaxPool(2×2)
Conv2D(64, 3×3) → BatchNorm → ReLU → MaxPool(2×2)
Conv2D(128, 3×3) → BatchNorm → ReLU → MaxPool(2×2)
Dense(128) → Dropout(0,3) → Dense(10, softmax)

Entraînement

  • Optimiseur : Adam (lr=1e-3) | Perte : entropie croisée catégorielle
  • Arrêt anticipé : déclenché à l'époque 23 (cible val_acc ≥ 95%)

Résultats

ÉpoquePrécision TrainPrécision ValPerte Val
1089%88%0,45
2097%95%0,22
2398%96,13%0,165
  • F1 pondéré (entraînement) : 0,98 | F1 pondéré (val) : 0,96
  • Exporté : my_cnn_model.h5

Chemin de Déploiement Segmentation de la main → crop 64×64 → prédiction CNN → sortie chiffre. L'architecture simple garantit une inférence rapide même sur CPU.