كشف أنماط الطقس
خط أنابيب بـ 9 طرق على 96,453 سجلاً ساعياً. K-Means (sil=0.45، K=3)، DBSCAN، Isolation Forest (1,930 شذوذاً)، LightGBM macro F1=0.74، 1D-CNN 94.85%، LSTM Autoencoder، Prophet (16 يوماً شاذاً).
96,453 سجلاً طقسياً ساعياً — 7 مميزات جوية
التجميع → كشف الشذوذ → تصنيف مُشرف → 1D-CNN → توقع Prophet
تحليل متعدد النماذج لـ 96,453 سجلاً طقسياً ساعياً.
مجموعة البيانات
- ◂96,453 سجلاً ساعياً: درجة الحرارة، الرطوبة، سرعة الرياح، الضغط، الرؤية
- ◂نوع الهطول: 88.4% مطر، 11.1% ثلج، 0.5% لا شيء (عدم توازن حاد)
التجميع (المرحلة 1) K-Means: K=3، Silhouette=0.45 | DBSCAN: مجموعتان + 1,107 ضجيج | GMM: اختيار النموذج بـ BIC/AIC 3 أنظمة طقسية: دافئ/صافٍ، بارد/غائم، انتقالي.
كشف الشذوذ (المرحلة 2) Isolation Forest: 1,930 (2.0%) | LSTM Autoencoder: 90 تسلسلاً | STL + بواقٍ
التصنيف (المرحلة 3) LightGBM Macro F1: 0.74 | 1D-CNN: 94.85% دقة
التنبؤ (المرحلة 4) Prophet: 16 يوماً شاذاً على 180 يوم اختبار.
الاستنتاج الرئيسي فئة "بلا هطول" بنسبة 0.5% تجعل Macro F1 مضللاً. الدقة العالية (98%+) تخفي استرجاعاً ضعيفاً للفئة النادرة.