ذكاء اصطناعي توليدي

توليد وجوه أنمي (DCGAN)

DCGAN مدرب لـ 100 حقبة على Tesla T4 على 43K صورة أنمي. مكدس ConvTranspose2d (100→512→256→128→64→3). β₁=0.5، تمهيد التسميات، StepLR. استيفاء slerp للانتقالات السلسة.

عرض على كاغل

100

Training epochs

~58s (T4)

Time per epoch

200

Generated samples

100

Latent dimension

مجموعة البيانات

43,102 صورة وجوه أنمي (64×64 بكسل)

المنهجية

DCGAN + استيفاء slerp + 4 تقنيات استقرار (β₁=0.5، label smooth، StepLR، تهيئة)

المكدس التقني

PythonPyTorchDCGANConvTranspose2dCUDA Tesla T4

الكلمات المفتاحية

DCGANGANPyTorchGenerative AISlerpConvTranspose2dTesla T4

التعمق

DCGAN مدرب من الصفر على 43,102 صورة وجوه أنمي (64×64 بكسل).

البنية

المولّد: z(100) → ConvTranspose2d×4 [512→256→128→64→3] → Tanh
المُميِّز: Conv2d×4 [64→128→256→512] → Sigmoid

4 تقنيات استقرار التدريب

التقنية	لماذا مهمة
Adam β₁=0.5 (لا 0.9)	تتجنب تذبذبات الزخم في التدريب التنافسي
تهيئة الأوزان N(0,0.02) Conv، N(1,0.02) BN	تتجنب قفل المُميِّز عند التهيئة
StepLR ×0.5 عند الحقبة 50	تمنع تباعد LR في التدريب المتأخر
تمهيد التسميات حقيقي→0.9	يُليِّن أهداف المُميِّز، يمنع الإفراط بالثقة

نتائج التدريب

◂100 حقبة، ~58 ثانية/حقبة على Tesla T4
◂200 عينة مولّدة
◂تجنّب انهيار النمط وعيوب رقعة الشطرنج

استيفاء Slerp

def slerp(z1, z2, t):
    omega = arccos(clip(dot(z1/||z1||, z2/||z2||), -1, 1))
    return sin((1-t)*omega)/sin(omega)*z1 + sin(t*omega)/sin(omega)*z2

Slerp يحترم الهندسة الكروية للفضاء الكامن. الاستيفاء الخطي يمر عبر مناطق منخفضة الكثافة وينتج نتائج ضبابية. Slerp يبقى على المتشعّب.

العودة إلى المشاريع توظيفي