رؤية الحاسوب

البحث عن الأشخاص بالتعرف على الوجه

تعرف على الوجه بدون تدريب باستخدام تضمينات ResNet-50 (VGGFace2) المدربة مسبقاً. البحث في 13,233 صورة LFW عبر المسافة الإقليدية 128D. 18/19 تطابقات صحيحة عند الحد 0.55. لا يتطلب تدريباً.

عرض على كاغل

94.7% (18/19)

Recall (query folder)

128-d

Embedding dimension

0.55

Threshold

None

Training required

مجموعة البيانات

LFW: 13,233 صورة، 5,749 هوية (نسخة deep-funneled)

المنهجية

تضمينات VGGFace2 المدربة مسبقاً + بحث بالمسافة الإقليدية — بدون تدريب

المكدس التقني

Pythondlib (ResNet-50)face_recognitionOpenCVLFW dataset

الكلمات المفتاحية

Face RecognitiondlibResNet-50VGGFace2LFWZero-shotMetric Learning

المرئيات6 مخططات

التعمق

تعرف على الوجه بدون تدريب — ResNet-50 (VGGFace2) مدرب مسبقاً مع بحث بالمسافة الإقليدية.

مجموعة البيانات

◂LFW (Labeled Faces in the Wild): 13,233 صورة، 5,749 هوية
◂نسخة deep-funneled محاذاة مسبقاً
◂اختيار الاستعلام: هويات بـ ≥10 صور (بذرة عشوائية 42)

خط أنابيب من 3 خطوات

◂اختيار الشخص المستعلَم تلقائياً (≥10 صور متاحة)
◂استخراج تضمين ResNet-50 بـ 128-d لصورة المرساة
◂البحث في مجلد الشخص كاملاً: مسافة إقليدية → عتبة @ 0.55

النتائج (الاستعلام: Abdullah_Gul)

المقياس	القيمة
الصور المتاحة	19
تطابق صحيح	18 / 19 (استرجاع 94.7%)
نطاق المسافة	0.000 → 0.493
العتبة	0.55
وضع الاستدلال	HOG (CPU، سريع)

لماذا يعمل الأسلوب بدون تدريب ResNet-50 المدرب على VGGFace2 (3M+ صورة وجه، 9K هوية) يتعلم فضاء تضمين وجه حيث يتجمع نفس الشخص بإحكام بغض النظر عن الإضاءة أو الوضع أو التقدم في العمر. هدف metric learning يضمن أن المسافات بين الهويات أكبر من المسافات داخل نفس الهوية.

تحسين (اختياري) متوسط التضمينات من صور استعلام متعددة → تمثيل مرساة أكثر قوة. يقلل الحساسية لوضع واحد أو ظرف إضاءة.

العودة إلى المشاريع توظيفي