Recherche de Personnes par Reconnaissance Faciale
Reconnaissance faciale zero-shot avec embeddings ResNet-50 (VGGFace2) préentraînés. Recherche de 13 233 images LFW via distance euclidienne 128D. 18/19 correspondances correctes au seuil 0,55. Aucun entraînement requis.
LFW : 13 233 images, 5 749 identités (variante deep-funneled)
Embeddings VGGFace2 préentraînés + recherche par distance euclidienne — zero-shot
Reconnaissance faciale zero-shot — ResNet-50 (VGGFace2) préentraîné avec recherche par distance euclidienne.
Données
- ▸LFW (Labeled Faces in the Wild) : 13 233 images, 5 749 identités
- ▸Variante deep-funneled pré-alignée
- ▸Sélection de la requête : identités avec ≥10 photos (graine aléatoire 42)
Pipeline en 3 étapes
- ▸Sélection automatique de la personne requête (≥10 photos disponibles)
- ▸Extraction d'un embedding ResNet-50 128-d pour l'image d'ancrage
- ▸Recherche dans tout le dossier de la personne : distance euclidienne → seuil @ 0,55
Résultats (Requête : Abdullah_Gul)
| Métrique | Valeur |
|---|---|
| Photos disponibles | 19 |
| Correctement appariées | 18 / 19 (rappel 94,7%) |
| Plage de distance | 0,000 → 0,493 |
| Seuil | 0,55 |
| Mode d'inférence | HOG (CPU, rapide) |
Pourquoi le zero-shot fonctionne ResNet-50 entraîné sur VGGFace2 (3M+ images de visages, 9K identités) apprend un espace d'embedding facial où la même personne se regroupe étroitement indépendamment de l'éclairage, de la pose ou du vieillissement. L'objectif de metric learning garantit que les distances inter-identités sont plus grandes que les distances intra-identités — même pour les identités jamais vues à l'entraînement.
Amélioration (optionnel) Moyenne des embeddings de plusieurs photos requête → représentation d'ancrage plus robuste. Réduit la sensibilité à une seule pose/condition d'éclairage.