كل المشاريع
ذكاء اصطناعي توليدي
توليد وجوه أنمي (DCGAN)
DCGAN مدرب لـ 100 حقبة على Tesla T4 على 43K صورة أنمي. مكدس ConvTranspose2d (100→512→256→128→64→3). β₁=0.5، تمهيد التسميات، StepLR. استيفاء slerp للانتقالات السلسة.
100
Training epochs
~58s (T4)
Time per epoch
200
Generated samples
100
Latent dimension
مجموعة البيانات
43,102 صورة وجوه أنمي (64×64 بكسل)
المنهجية
DCGAN + استيفاء slerp + 4 تقنيات استقرار (β₁=0.5، label smooth، StepLR، تهيئة)
المكدس التقني
PythonPyTorchDCGANConvTranspose2dCUDA Tesla T4
الكلمات المفتاحية
DCGANGANPyTorchGenerative AISlerpConvTranspose2dTesla T4
التعمق
DCGAN مدرب من الصفر على 43,102 صورة وجوه أنمي (64×64 بكسل).
البنية
المولّد: z(100) → ConvTranspose2d×4 [512→256→128→64→3] → Tanh
المُميِّز: Conv2d×4 [64→128→256→512] → Sigmoid
4 تقنيات استقرار التدريب
| التقنية | لماذا مهمة |
|---|---|
| Adam β₁=0.5 (لا 0.9) | تتجنب تذبذبات الزخم في التدريب التنافسي |
| تهيئة الأوزان N(0,0.02) Conv، N(1,0.02) BN | تتجنب قفل المُميِّز عند التهيئة |
| StepLR ×0.5 عند الحقبة 50 | تمنع تباعد LR في التدريب المتأخر |
| تمهيد التسميات حقيقي→0.9 | يُليِّن أهداف المُميِّز، يمنع الإفراط بالثقة |
نتائج التدريب
- ◂100 حقبة، ~58 ثانية/حقبة على Tesla T4
- ◂200 عينة مولّدة
- ◂تجنّب انهيار النمط وعيوب رقعة الشطرنج
استيفاء Slerp
def slerp(z1, z2, t):
omega = arccos(clip(dot(z1/||z1||, z2/||z2||), -1, 1))
return sin((1-t)*omega)/sin(omega)*z1 + sin(t*omega)/sin(omega)*z2
Slerp يحترم الهندسة الكروية للفضاء الكامن. الاستيفاء الخطي يمر عبر مناطق منخفضة الكثافة وينتج نتائج ضبابية. Slerp يبقى على المتشعّب.