كل المشاريع
سلاسل زمنية

كشف أنماط الطقس

خط أنابيب بـ 9 طرق على 96,453 سجلاً ساعياً. K-Means (sil=0.45، K=3)، DBSCAN، Isolation Forest (1,930 شذوذاً)، LightGBM macro F1=0.74، 1D-CNN 94.85%، LSTM Autoencoder، Prophet (16 يوماً شاذاً).

0.45 (K=3)
K-Means Silhouette
1,930 anomalies (2%)
Isolation Forest
0.74
LightGBM macro F1
94.85%
1D-CNN accuracy
مجموعة البيانات

96,453 سجلاً طقسياً ساعياً — 7 مميزات جوية

المنهجية

التجميع → كشف الشذوذ → تصنيف مُشرف → 1D-CNN → توقع Prophet

المكدس التقني
PythonScikit-learnTensorFlow/LSTMXGBoostLightGBMProphet
الكلمات المفتاحية
K-MeansDBSCANIsolation ForestLightGBM1D-CNNLSTM AutoencoderProphet
المرئيات6 مخططات
التعمق

تحليل متعدد النماذج لـ 96,453 سجلاً طقسياً ساعياً.

مجموعة البيانات

  • 96,453 سجلاً ساعياً: درجة الحرارة، الرطوبة، سرعة الرياح، الضغط، الرؤية
  • نوع الهطول: 88.4% مطر، 11.1% ثلج، 0.5% لا شيء (عدم توازن حاد)

التجميع (المرحلة 1) K-Means: K=3، Silhouette=0.45 | DBSCAN: مجموعتان + 1,107 ضجيج | GMM: اختيار النموذج بـ BIC/AIC 3 أنظمة طقسية: دافئ/صافٍ، بارد/غائم، انتقالي.

كشف الشذوذ (المرحلة 2) Isolation Forest: 1,930 (2.0%) | LSTM Autoencoder: 90 تسلسلاً | STL + بواقٍ

التصنيف (المرحلة 3) LightGBM Macro F1: 0.74 | 1D-CNN: 94.85% دقة

التنبؤ (المرحلة 4) Prophet: 16 يوماً شاذاً على 180 يوم اختبار.

الاستنتاج الرئيسي فئة "بلا هطول" بنسبة 0.5% تجعل Macro F1 مضللاً. الدقة العالية (98%+) تخفي استرجاعاً ضعيفاً للفئة النادرة.