Vision par Ordinateur

Classification des Chiffres en Langue des Signes

CNN pour la reconnaissance de chiffres en langue des signes (0–9) sur 2 062 images équilibrées. 96,13% de précision de validation à l'époque 23, F1 entraînement=0,98. CNN à 3 couches avec BatchNorm + Dropout. Exporté en H5 pour déploiement.

Voir sur Kaggle

96.13%

Validation accuracy

98%

Training accuracy

0.96

Validation F1

Epochs to converge

Jeu de Données

2 062 images en niveaux de gris 64×64 — 10 classes de chiffres équilibrées

Approche

CNN à 3 blocs avec BatchNorm + Dropout → arrêt anticipé → export H5 pour déploiement

Stack Technique

PythonKeras/TensorFlowCNNBatchNormH5 export

Mots-clés

CNNSign LanguageAccessibilityBatchNormKerasH5 Export

Visualisations5 Graphiques

Analyse Approfondie

Reconnaissance de chiffres en langue des signes — des images brutes à un modèle H5 prêt pour le déploiement.

Jeu de données

▸2 062 images en niveaux de gris 64×64 : 10 classes (chiffres 0–9)
▸Entraînement : 1 649 (163±17 par classe) / Val : 413 (40±7 par classe)
▸Bien équilibré — pas de pondération de classes ni d'augmentation nécessaire

Architecture CNN

Conv2D(32, 3×3) → BatchNorm → ReLU → MaxPool(2×2)
Conv2D(64, 3×3) → BatchNorm → ReLU → MaxPool(2×2)
Conv2D(128, 3×3) → BatchNorm → ReLU → MaxPool(2×2)
Dense(128) → Dropout(0,3) → Dense(10, softmax)

Entraînement

▸Optimiseur : Adam (lr=1e-3) | Perte : entropie croisée catégorielle
▸Arrêt anticipé : déclenché à l'époque 23 (cible val_acc ≥ 95%)

Résultats

Époque	Précision Train	Précision Val	Perte Val
10	89%	88%	0,45
20	97%	95%	0,22
23	98%	96,13%	0,165

▸F1 pondéré (entraînement) : 0,98 | F1 pondéré (val) : 0,96
▸Exporté : my_cnn_model.h5

Chemin de Déploiement Segmentation de la main → crop 64×64 → prédiction CNN → sortie chiffre. L'architecture simple garantit une inférence rapide même sur CPU.

Retour aux Projets Me Recruter