Détection de Motifs Météorologiques
Pipeline à 9 méthodes sur 96 453 enregistrements horaires. K-Means (sil=0,45, K=3), DBSCAN, Isolation Forest (1 930 anomalies), LightGBM macro F1=0,74, 1D-CNN 94,85%, LSTM Autoencoder, Prophet (16 jours d'anomalies).
96 453 enregistrements météorologiques horaires — 7 caractéristiques météorologiques
Clustering → détection d'anomalies → classification supervisée → 1D-CNN → prévision Prophet
Analyse multi-paradigme de 96 453 enregistrements météorologiques horaires.
Jeu de données
- ▸96 453 enregistrements horaires : température, température apparente, humidité, vitesse du vent, direction du vent, visibilité, pression
- ▸Type de précipitation : 88,4% pluie, 11,1% neige, 0,5% aucune (déséquilibre sévère)
Clustering (Phase 1)
| Méthode | Résultat |
|---|---|
| K-Means | K=3, Silhouette=0,45, Davies-Bouldin=1,10 |
| DBSCAN | 2 clusters + 1 107 bruit (échantillon 10K) |
| GMM | Sélection de modèle par BIC/AIC |
3 régimes météo : chaud/clair, froid/nuageux, transition.
Détection d'Anomalies (Phase 2)
| Méthode | Anomalies |
|---|---|
| Isolation Forest | 1 930 (2,0%) |
| LSTM Autoencoder | 90 séquences (seuil : reconstruction > 0,0061) |
| STL + résidus | Flags d'anomalie sur la composante résiduelle |
Les 3 méthodes concordent sur un taux d'anomalie de ~2%.
Classification (Phase 3 — Type de Précipitation)
| Modèle | Macro F1 |
|---|---|
| Random Forest | 0,51 |
| XGBoost | 0,70 |
| LightGBM | 0,74 |
| 1D-CNN (saison) | 94,85% de précision |
Prévision (Phase 4) Prophet sur la température : 16 jours d'anomalies détectés par dépassement de l'IC sur 180 jours de test.
Insight Clé La classe "aucune précipitation" à 0,5% rend le Macro F1 trompeur. Une haute précision (98%+) masque un mauvais rappel sur la classe rare. L'IA météo réelle nécessite une quantification d'incertitude au-delà des métriques de précision.