Prévision de la Consommation Électrique des Ménages
Séries temporelles multi-modèles sur 2,9M enregistrements UCI (2006–2010). ARIMA, SARIMA, Prophet, LSTM sur Global_active_power. STL révèle des motifs quotidiens+hebdomadaires. Ensemble avec pondération inverse-RMSE.
UCI Household Power : 2,9M mesures, résolution 1 min, 4 ans
Décomposition STL → stationnarité → ARIMA/SARIMA/Prophet/LSTM → ensemble
Prévision de séries temporelles pour la consommation électrique des ménages sur le dataset UCI.
Jeu de données
- ▸2 075 259 mesures (déc. 2006 → nov. 2010), résolution 1 minute → rééchantillonné horaire
- ▸1,25% de valeurs manquantes → interpolation linéaire
- ▸Cible : Global_active_power (kW)
Analyse des Séries Temporelles
- ▸Test ADF : stationnaire après différenciation
- ▸Décomposition STL : motif quotidien (pics matin/soir) + cycle hebdomadaire (creux week-end)
- ▸ACF/PACF : autocorrélations claires à lag-24h et lag-168h
Modèles Évalués
| Modèle | Points Forts |
|---|---|
| ARIMA | Sélection auto p,d,q, AIC |
| SARIMA | Période saisonnière=24h |
| Prophet | Tendance + saisonnalités annuelle + hebdomadaire + quotidienne |
| LSTM (encodeur-décodeur) | Prédiction séquentielle 24 pas en avant |
| Ensemble | Combinaison pondérée inverse-RMSE |
Insight Clé La composante saisonnière explique ~60% de la variance. Les gens suivent des routines — une baseline "même heure hier" est difficile à battre. Les modèles avancés ciblent la composante résiduelle irrégulière (vacances, invités, pannes d'appareils).
Résultats de la Décomposition STL Tendance : légèrement déclinante sur 4 ans (améliorations d'efficacité). Saisonnier : double pic quotidien fort (7–9h + 18–21h) + hebdomadaire (week-ends 15% plus bas). Résiduel : 1,25% d'anomalies corrélées aux jours fériés.