Retour au Blog
MLOps 22 mars 2025 11 min de lecture

Pipeline MLOps from scratch : CI/CD pour les modèles ML

Comment construire un pipeline MLOps complet — versioning des données avec DVC, tracking des expériences avec MLflow.

La stack MLOps complète

Git + DVC (code + data versioning)
      ↓
GitHub Actions (CI: tests, linting)
      ↓
MLflow (experiment tracking)
      ↓
MLflow Model Registry (staging → production)
      ↓
FastAPI + Docker (serving)
      ↓
Prometheus + Grafana (monitoring)

Versioning des données avec DVC

dvc init
dvc add data/train.csv
dvc push  # to S3/GCS
git add data/train.csv.dvc
git commit -m "add training data v2"

Suivi des expériences avec MLflow

import mlflow

with mlflow.start_run():
    mlflow.log_params(params)
    mlflow.log_metrics({'auc': auc, 'f1': f1})
    mlflow.sklearn.log_model(model, 'model')

Porte de réentraînement automatique

Si l'AUC en production chute de >2 % → déclenche automatiquement le pipeline de réentraînement.

MLOpsDVCMLflowCI/CDDocker
O

Ossama Elhakki

Ingénieur IA & Systèmes ML — Maroc