كل المشاريع
ذكاء اصطناعي توليدي

توليد وجوه أنمي (DCGAN)

DCGAN مدرب لـ 100 حقبة على Tesla T4 على 43K صورة أنمي. مكدس ConvTranspose2d (100→512→256→128→64→3). β₁=0.5، تمهيد التسميات، StepLR. استيفاء slerp للانتقالات السلسة.

100
Training epochs
~58s (T4)
Time per epoch
200
Generated samples
100
Latent dimension
مجموعة البيانات

43,102 صورة وجوه أنمي (64×64 بكسل)

المنهجية

DCGAN + استيفاء slerp + 4 تقنيات استقرار (β₁=0.5، label smooth، StepLR، تهيئة)

المكدس التقني
PythonPyTorchDCGANConvTranspose2dCUDA Tesla T4
الكلمات المفتاحية
DCGANGANPyTorchGenerative AISlerpConvTranspose2dTesla T4
التعمق

DCGAN مدرب من الصفر على 43,102 صورة وجوه أنمي (64×64 بكسل).

البنية

المولّد: z(100) → ConvTranspose2d×4 [512→256→128→64→3] → Tanh
المُميِّز: Conv2d×4 [64→128→256→512] → Sigmoid

4 تقنيات استقرار التدريب

التقنيةلماذا مهمة
Adam β₁=0.5 (لا 0.9)تتجنب تذبذبات الزخم في التدريب التنافسي
تهيئة الأوزان N(0,0.02) Conv، N(1,0.02) BNتتجنب قفل المُميِّز عند التهيئة
StepLR ×0.5 عند الحقبة 50تمنع تباعد LR في التدريب المتأخر
تمهيد التسميات حقيقي→0.9يُليِّن أهداف المُميِّز، يمنع الإفراط بالثقة

نتائج التدريب

  • 100 حقبة، ~58 ثانية/حقبة على Tesla T4
  • 200 عينة مولّدة
  • تجنّب انهيار النمط وعيوب رقعة الشطرنج

استيفاء Slerp

def slerp(z1, z2, t):
    omega = arccos(clip(dot(z1/||z1||, z2/||z2||), -1, 1))
    return sin((1-t)*omega)/sin(omega)*z1 + sin(t*omega)/sin(omega)*z2

Slerp يحترم الهندسة الكروية للفضاء الكامن. الاستيفاء الخطي يمر عبر مناطق منخفضة الكثافة وينتج نتائج ضبابية. Slerp يبقى على المتشعّب.