Retour au Blog
Machine Learning 20 février 2025 9 min de lecture

Ma stratégie de compétition Kaggle : du bronze à l'or

Le workflow exact que je suis dans chaque compétition Kaggle — EDA, baseline, sprints de feature engineering.

Semaine 1 : fondations

  1. EDA (2 jours) : analyse des distributions, valeurs manquantes, vérification de la fuite de cible
  2. Baseline (1 jour) : modèle simple, établir le score CV
  3. Reproductibilité (1 jour) : fixer les graines, mettre en place le pipeline CV

Semaines 2-3 : feature engineering

Travaillez par sprints de 2-3 caractéristiques, ne committez que si la CV s'améliore :

  • Commencez par les caractéristiques évidentes du domaine
  • Ajoutez des agrégations par colonnes d'entité clés
  • Extrayez les composants date/heure
  • Calculez les interactions par paires

Semaine 4 : ensemble

  1. Entraînez 5-10 modèles de base variés
  2. Réservez 20 % comme jeu de validation d'ensemble
  3. Utilisez une moyenne pondérée simple réglée avec Optuna
  4. Le stacking seulement si vous avez le temps pour une CV correcte

3 derniers jours : sprint final

  • Soumettez 3-4 variantes d'ensemble
  • Choisissez la finale selon l'équilibre CV+LB
  • Ne surajustez pas au leaderboard (gardez 2 soumissions en réserve)
KaggleCompetitionStrategyEnsembleFeature Engineering
O

Ossama Elhakki

Ingénieur IA & Systèmes ML — Maroc