كل المشاريع
رؤية الحاسوب

البحث عن الأشخاص بالتعرف على الوجه

تعرف على الوجه بدون تدريب باستخدام تضمينات ResNet-50 (VGGFace2) المدربة مسبقاً. البحث في 13,233 صورة LFW عبر المسافة الإقليدية 128D. 18/19 تطابقات صحيحة عند الحد 0.55. لا يتطلب تدريباً.

94.7% (18/19)
Recall (query folder)
128-d
Embedding dimension
0.55
Threshold
None
Training required
مجموعة البيانات

LFW: 13,233 صورة، 5,749 هوية (نسخة deep-funneled)

المنهجية

تضمينات VGGFace2 المدربة مسبقاً + بحث بالمسافة الإقليدية — بدون تدريب

المكدس التقني
Pythondlib (ResNet-50)face_recognitionOpenCVLFW dataset
الكلمات المفتاحية
Face RecognitiondlibResNet-50VGGFace2LFWZero-shotMetric Learning
المرئيات6 مخططات
التعمق

تعرف على الوجه بدون تدريب — ResNet-50 (VGGFace2) مدرب مسبقاً مع بحث بالمسافة الإقليدية.

مجموعة البيانات

  • LFW (Labeled Faces in the Wild): 13,233 صورة، 5,749 هوية
  • نسخة deep-funneled محاذاة مسبقاً
  • اختيار الاستعلام: هويات بـ ≥10 صور (بذرة عشوائية 42)

خط أنابيب من 3 خطوات

  1. اختيار الشخص المستعلَم تلقائياً (≥10 صور متاحة)
  2. استخراج تضمين ResNet-50 بـ 128-d لصورة المرساة
  3. البحث في مجلد الشخص كاملاً: مسافة إقليدية → عتبة @ 0.55

النتائج (الاستعلام: Abdullah_Gul)

المقياسالقيمة
الصور المتاحة19
تطابق صحيح18 / 19 (استرجاع 94.7%)
نطاق المسافة0.000 → 0.493
العتبة0.55
وضع الاستدلالHOG (CPU، سريع)

لماذا يعمل الأسلوب بدون تدريب ResNet-50 المدرب على VGGFace2 (3M+ صورة وجه، 9K هوية) يتعلم فضاء تضمين وجه حيث يتجمع نفس الشخص بإحكام بغض النظر عن الإضاءة أو الوضع أو التقدم في العمر. هدف metric learning يضمن أن المسافات بين الهويات أكبر من المسافات داخل نفس الهوية.

تحسين (اختياري) متوسط التضمينات من صور استعلام متعددة → تمثيل مرساة أكثر قوة. يقلل الحساسية لوضع واحد أو ظرف إضاءة.