Nobody → ML Engineer · 33 topics

Hub d'Apprentissage ML

Explications visuelles des concepts de machine learning — séries de diagrammes artisanaux

🛠️Phase 0
35 min·1 topic

Outils & Configuration

Your Python ML environment

0/1
0.1
📐
6 diagrams · 35 min
Fondationsdébutant35 min

Stack Python ML : NumPy, Pandas & Matplotlib

Maîtrisez les outils quotidiens — NumPy, Pandas DataFrames et Matplotlib/Seaborn. La fondation sur laquelle tout le reste repose.

NumPy ArraysBroadcastingPandas DataFrameEDA+3
No prereqs
Exploration
1
📐Phase 1
2h 55min·4 topics

Fondations Mathématiques

Linear algebra, calculus, probability & information theory

0/4
1.1
📐
10 diagrams · 45 min
Fondationsdébutant45 min

Algèbre Linéaire pour le ML

Vecteurs, produits scalaires, multiplication matricielle, décomposition propre et SVD — avec l'intuition visuelle de la transformation de l'espace.

Dot ProductMatrix MultiplyEigenvaluesEigenvectors+4
1 prereq
Exploration
1.2
📐
8 diagrams · 45 min
Fondationsdébutant45 min

Calcul & Optimisation

Dérivées, dérivées partielles, règle de la chaîne (= rétropropagation) et descente de gradient. Puis Adam, momentum, scheduling — comment les réseaux apprennent vraiment.

DerivativesChain RuleGradientGradient Descent+4
1 prereq
Exploration
1.3
📐
9 diagrams · 50 min
Fondationsdébutant50 min

Probabilités & Statistiques

Distributions de probabilité, MLE, théorème de Bayes, tests d'hypothèse et théorème de la limite centrale — le langage de l'incertitude.

Normal DistributionMLEBayes Theoremp-values+3
1 prereq
Exploration
1.4
📐
7 diagrams · 35 min
Fondationsintermédiaire35 min

Théorie de l'Information

Entropie, perte d'entropie croisée, divergence KL, information mutuelle — pourquoi la cross-entropy fonctionne comme fonction de perte.

EntropyCross-EntropyKL DivergenceMutual Information+3
1 prereq
Exploration
1
2
3
4
📈Phase 2
11h 30min·17 topics

ML Classique

Supervised, unsupervised, ensemble — the full sklearn toolkit

0/17
2.1
📈
15 diagrams · 45 min
Régressiondébutant45 min

Régression Linéaire & Logistique

Exploration visuelle des moindres carrés au gradient descent, puis régression logistique : sigmoid, log loss, L1/L2 et frontières de décision.

Least SquaresGradient DescentSigmoid+4
2 prereqs
Exploration
2.2
📊
8 diagrams · 35 min
Évaluationdébutant35 min

Évaluation des Modèles & Métriques

Guide complet : précision, rappel, F1, ROC-AUC, matrice de confusion, validation croisée et choix de métrique.

ROC-AUCF1 ScoreConfusion MatrixCross-validation+2
1 prereq
Exploration
2.3
📊
5 diagrams · 25 min
Évaluationdébutant25 min

Compromis Biais-Variance & Analyse des Erreurs

Intuition visuelle pour sous/surapprentissage, décomposition biais-variance, courbes d'apprentissage et diagnostic de modèle.

BiasVarianceUnderfittingOverfitting+2
1 prereq
Exploration
2.4
⚙️
14 diagrams · 45 min
ML Appliquédébutant45 min

Feature Engineering & Pipelines

Pipeline complet : imputation, encodage catégoriel (OHE, Target, Ordinal), mise à l'échelle, création de features et sklearn Pipelines pour éviter le data leakage.

ImputationOneHotEncoderStandardScalerRobustScaler+3
2 prereqs
Exploration
2.5
⚙️
7 diagrams · 30 min
ML Appliquédébutant30 min

Classifieurs Naïfs Bayésiens

Théorème de Bayes, hypothèse d'indépendance conditionnelle, variantes Gaussian/Multinomial/Complement, lissage de Laplace et classification de texte.

Bayes TheoremMAP DecisionLaplace SmoothingGaussianNB+3
1 prereq
Exploration
2.6
📈
14 diagrams · 40 min
Régressiondébutant40 min

Arbres de Décision & Forêt Aléatoire

Comment les arbres de décision divisent les données (Gini, entropie), élagage, puis Random Forest comme ensemble baggé.

Gini ImpurityEntropyInformation GainPruning+3
2 prereqs
Exploration
2.7
📈
14 diagrams · 50 min
Régressionintermédiaire50 min

SVM, SVR & KNN

SVM : hyperplan à marge maximale, trick du noyau (RBF), SVR avec tube ε. KNN : métriques de distance, choix de k.

Maximum MarginKernel TrickRBF Kernelε-tube+3
2 prereqs
Exploration
2.8
🔮
12 diagrams · 40 min
Non superviséintermédiaire40 min

Clustering : K-Means & DBSCAN

Groupement non supervisé — K-Means (algorithme de Lloyd, inertie, sélection K), DBSCAN (points core/border/noise, voisinage ε, formes arbitraires) et clustering hiérarchique.

K-MeansDBSCANSilhouette ScoreInertia+3
2 prereqs
Exploration
2.9
🔮
10 diagrams · 45 min
Non superviséintermédiaire45 min

ACP & Réduction de Dimensionnalité

ACP de zéro : décomposition propre de la matrice de covariance, variance expliquée, choix de k, blanchiment et comparaison t-SNE/UMAP.

EigendecompositionVariance ExplainedCovariance MatrixWhitening+3
2 prereqs
Exploration
2.10
🔮
8 diagrams · 35 min
Non superviséintermédiaire35 min

Détection d'Anomalies & Valeurs Aberrantes

Approches statistiques (Z-Score, IQR) et algorithmiques (Isolation Forest, LOF) pour détecter les observations anormales rares.

Z-ScoreIQRIsolation ForestLOF+3
2 prereqs
Exploration
2.11
🌲
18 diagrams · 60 min
Ensemblesintermédiaire60 min

Gradient Boosting : XGBoost, LightGBM, CatBoost

Du Gradient Boosting vanilla à XGBoost (Tree Score = SSR + λT), LightGBM (histogram, leaf-wise) et CatBoost (ordered boosting).

ResidualsTree Score (SSR+λT)Histogram BinningLeaf-wise Growth+2
2 prereqs
Exploration
2.12
🌲
11 diagrams · 45 min
Ensemblesintermédiaire45 min

Bagging, Boosting & Stacking

Explication visuelle de tous les paradigmes d'ensemble — bagging réduit la variance, boosting réduit le biais, stacking combine via méta-apprenant.

Variance ReductionBias ReductionAdaBoostSAMME+2
2 prereqs
Exploration
2.13
🏷️
6 diagrams · 30 min
Classificationintermédiaire30 min

Classification Multi-classe OvA vs OvO

Stratégies One-vs-All et One-vs-One pour la classification multi-classe — frontières, scalabilité, SVM et Softmax.

Multi-classDecision BoundariesOvAOvO+2
2 prereqs
Exploration
2.14
⚙️
9 diagrams · 40 min
ML Appliquéintermédiaire40 min

Optimisation des Hyperparamètres

Grid Search, Random Search, Optimisation Bayésienne (TPE/GP), Successive Halving et Optuna — avec heatmap interactive C × max_depth.

GridSearchCVRandomizedSearchCVBayesian OptimisationOptuna+3
2 prereqs
Exploration
2.15
⚙️
6 diagrams · 35 min
ML Appliquéintermédiaire35 min

Importance des Features & Sélection

Importance par permutation vs impureté (Gini), attribution unifiée SHAP, importance drop-colonne, et comment les features corrélées divisent les scores — avec graphique interactif.

Permutation ImportanceGini ImportanceSHAPDrop-Column+2
2 prereqs
Exploration
2.16
⚙️
8 diagrams · 40 min
ML Appliquéavancé40 min

Dépendance Partielle & Courbes ICE

Les PDP marginalisent sur les autres features pour montrer l'effet moyen. Les courbes ICE exposent l'hétérogénéité par échantillon. Les ALE corrigent le problème d'extrapolation.

PDPICE Curvesc-ICEALE Plots+3
1 prereq
Exploration
2.17
⚙️
11 diagrams · 50 min
ML Appliquéintermédiaire50 min

Prévision de Séries Temporelles

Décomposition tendance-saisonnalité-résidu, features de lag, statistiques glissantes, TimeSeriesSplit, ARIMA et gradient boosting pour la prévision tabulaire.

DecompositionLag FeaturesRolling StatisticsTimeSeriesSplit+3
2 prereqs
Exploration
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
🧠Phase 3
3h 45min·4 topics

Apprentissage Profond

Neural networks, CNNs, RNNs and training techniques

0/4
3.1
🧠
10 diagrams · 60 min
Apprentissage Profondintermédiaire60 min

Réseaux de Neurones — Propagation Avant & Rétro

Du perceptron aux réseaux profonds : passe avant, fonctions d'activation, rétropropagation, gradient vanishing et initialisation.

PerceptronBackpropagationReLUVanishing Gradient+2
3 prereqs
Exploration
3.2
🧠
10 diagrams · 40 min
Apprentissage Profondintermédiaire40 min

Optimisation en Apprentissage Profond

SGD vs Momentum vs Adam vs AdamW, warmup et scheduling cosinus, batch normalization, dropout, gradient clipping, entraînement précision mixte.

AdamAdamWMomentumBatch Normalization+4
1 prereq
Exploration
3.3
🧠
14 diagrams · 55 min
Apprentissage Profondintermédiaire55 min

Architectures CNN : Classic → ResNet → ViT

CNN de zéro : convolution, pooling, champ réceptif, puis classic, Inception, ResNet (skip connections) et Vision Transformer (ViT).

ConvolutionPoolingSkip ConnectionsInception+3
2 prereqs
Exploration
3.4
🧠
8 diagrams · 70 min
Apprentissage Profondavancé70 min

RNN, LSTM & GRU — Modélisation de Séquences

RNN pour séquences : BPTT, gradient explosif/vanissant, LSTM (portes, état cellulaire), GRU (portes simplifiées), Bi-LSTM.

BPTTVanishing GradientLSTM GatesCell State+3
2 prereqs
Exploration
1
2
3
4
👁️Phase 4
1h 25min·2 topics

Vision par Ordinateur

Detection, segmentation and visual understanding

0/2
4.1
👁️
11 diagrams · 45 min
Vision par Ordinateurintermédiaire45 min

Détection d'Objets : YOLO & Faster-RCNN

Des fenêtres glissantes aux détecteurs single-shot — IoU, boîtes d'ancrage, NMS, mAP et le compromis architectures deux-étapes vs une-étape.

IoUAnchor BoxesNMSmAP+4
1 prereq
Exploration
4.2
👁️
9 diagrams · 40 min
Vision par Ordinateuravancé40 min

Segmentation d'Image : UNet & DeepLab

Classification au niveau pixel — segmentation sémantique, instance, panoptique, connexions skip dans UNet, convolutions dilatées dans DeepLab.

Semantic SegmentationInstance SegmentationUNetSkip Connections+3
1 prereq
Exploration
1
2
💬Phase 5
2h 15min·2 topics

NLP & Transformers

Text, attention mechanisms and large language models

0/2
5.1
⚙️
10 diagrams · 45 min
ML Appliquéintermédiaire45 min

NLP : Pipeline de Classification de Texte

Pipeline NLP complet : tokenisation, vectorisation TF-IDF, classification (NB/LR/SVM), évaluation F1, embeddings de mots et sentence-transformers.

TokenizationTF-IDFBag of WordsN-grams+3
2 prereqs
Exploration
5.2
🧠
9 diagrams · 90 min
Apprentissage Profondavancé90 min

Transformers & Auto-Attention

Plongée dans l'attention : dot-product scalé, multi-têtes, encodage positionnel, FFN, sampling (température/top-k/top-p), BERT vs GPT.

Scaled Dot-ProductMulti-head AttentionPositional EncodingFFN+3
2 prereqs
Exploration
1
2
🎵Phase 6
40 min·1 topic

Audio & Parole

Spectrograms, ASR and audio classification

0/1
6.1
🎵
8 diagrams · 40 min
Audio & Paroleintermédiaire40 min

Audio & Reconnaissance Vocale ML

Des formes d'ondes aux MFCC — STFT spectrogrammes, filterbanks Mel, CNN audio, perte CTC, SpecAugment et Whisper d'OpenAI.

STFTMel SpectrogramMFCCAudio CNN+4
2 prereqs
Exploration
1
🎨Phase 7
1h 20min·1 topic

IA Générative

VAEs, GANs and diffusion-style generation

0/1
7.1
🧠
10 diagrams · 80 min
Apprentissage Profondavancé80 min

Modèles Génératifs : VAE & GAN

Autoencoder → VAE (ELBO, astuce de reparamétrage) → GAN (entraînement adversarial, DCGAN, collapse de mode).

AutoencoderELBOReparameterizationLatent Space+3
3 prereqs
Exploration
1
🎮Phase 8
55 min·1 topic

Apprentissage par Renforcement

MDPs, Q-learning, policy gradients and PPO

0/1
8.1
🎮
12 diagrams · 55 min
Apprentissage par Renforcementavancé55 min

Apprentissage par Renforcement

Formalisme MDP, équations de Bellman, Q-learning, DQN, gradients de politique (REINFORCE) et PPO — avec visualisation interactive de la convergence Q.

MDPBellman EquationQ-LearningDQN+4
3 prereqs
Exploration
1
🚀

Plus de diagrammes bientôt

Diffusion Models · Graph Neural Networks · MLOps · LLM Fine-tuning · Causal ML

Besoin d'un ingénieur IA ou data scientist ?

Je conçois des modèles ML sur mesure, des agents IA, de la vision par ordinateur et de l'automatisation — de l'idée à la production.