Semaine 1 : fondations
- EDA (2 jours) : analyse des distributions, valeurs manquantes, vérification de la fuite de cible
- Baseline (1 jour) : modèle simple, établir le score CV
- Reproductibilité (1 jour) : fixer les graines, mettre en place le pipeline CV
Semaines 2-3 : feature engineering
Travaillez par sprints de 2-3 caractéristiques, ne committez que si la CV s'améliore :
- Commencez par les caractéristiques évidentes du domaine
- Ajoutez des agrégations par colonnes d'entité clés
- Extrayez les composants date/heure
- Calculez les interactions par paires
Semaine 4 : ensemble
- Entraînez 5-10 modèles de base variés
- Réservez 20 % comme jeu de validation d'ensemble
- Utilisez une moyenne pondérée simple réglée avec Optuna
- Le stacking seulement si vous avez le temps pour une CV correcte
3 derniers jours : sprint final
- Soumettez 3-4 variantes d'ensemble
- Choisissez la finale selon l'équilibre CV+LB
- Ne surajustez pas au leaderboard (gardez 2 soumissions en réserve)