Hub d'Apprentissage ML
Explications visuelles des concepts de machine learning — séries de diagrammes artisanaux
Outils & Configuration
Your Python ML environment
Stack Python ML : NumPy, Pandas & Matplotlib
Maîtrisez les outils quotidiens — NumPy, Pandas DataFrames et Matplotlib/Seaborn. La fondation sur laquelle tout le reste repose.
Fondations Mathématiques
Linear algebra, calculus, probability & information theory
Algèbre Linéaire pour le ML
Vecteurs, produits scalaires, multiplication matricielle, décomposition propre et SVD — avec l'intuition visuelle de la transformation de l'espace.
Calcul & Optimisation
Dérivées, dérivées partielles, règle de la chaîne (= rétropropagation) et descente de gradient. Puis Adam, momentum, scheduling — comment les réseaux apprennent vraiment.
Probabilités & Statistiques
Distributions de probabilité, MLE, théorème de Bayes, tests d'hypothèse et théorème de la limite centrale — le langage de l'incertitude.
Théorie de l'Information
Entropie, perte d'entropie croisée, divergence KL, information mutuelle — pourquoi la cross-entropy fonctionne comme fonction de perte.
ML Classique
Supervised, unsupervised, ensemble — the full sklearn toolkit
Régression Linéaire & Logistique
Exploration visuelle des moindres carrés au gradient descent, puis régression logistique : sigmoid, log loss, L1/L2 et frontières de décision.
Évaluation des Modèles & Métriques
Guide complet : précision, rappel, F1, ROC-AUC, matrice de confusion, validation croisée et choix de métrique.
Compromis Biais-Variance & Analyse des Erreurs
Intuition visuelle pour sous/surapprentissage, décomposition biais-variance, courbes d'apprentissage et diagnostic de modèle.
Feature Engineering & Pipelines
Pipeline complet : imputation, encodage catégoriel (OHE, Target, Ordinal), mise à l'échelle, création de features et sklearn Pipelines pour éviter le data leakage.
Classifieurs Naïfs Bayésiens
Théorème de Bayes, hypothèse d'indépendance conditionnelle, variantes Gaussian/Multinomial/Complement, lissage de Laplace et classification de texte.
Arbres de Décision & Forêt Aléatoire
Comment les arbres de décision divisent les données (Gini, entropie), élagage, puis Random Forest comme ensemble baggé.
SVM, SVR & KNN
SVM : hyperplan à marge maximale, trick du noyau (RBF), SVR avec tube ε. KNN : métriques de distance, choix de k.
Clustering : K-Means & DBSCAN
Groupement non supervisé — K-Means (algorithme de Lloyd, inertie, sélection K), DBSCAN (points core/border/noise, voisinage ε, formes arbitraires) et clustering hiérarchique.
ACP & Réduction de Dimensionnalité
ACP de zéro : décomposition propre de la matrice de covariance, variance expliquée, choix de k, blanchiment et comparaison t-SNE/UMAP.
Détection d'Anomalies & Valeurs Aberrantes
Approches statistiques (Z-Score, IQR) et algorithmiques (Isolation Forest, LOF) pour détecter les observations anormales rares.
Gradient Boosting : XGBoost, LightGBM, CatBoost
Du Gradient Boosting vanilla à XGBoost (Tree Score = SSR + λT), LightGBM (histogram, leaf-wise) et CatBoost (ordered boosting).
Bagging, Boosting & Stacking
Explication visuelle de tous les paradigmes d'ensemble — bagging réduit la variance, boosting réduit le biais, stacking combine via méta-apprenant.
Classification Multi-classe OvA vs OvO
Stratégies One-vs-All et One-vs-One pour la classification multi-classe — frontières, scalabilité, SVM et Softmax.
Optimisation des Hyperparamètres
Grid Search, Random Search, Optimisation Bayésienne (TPE/GP), Successive Halving et Optuna — avec heatmap interactive C × max_depth.
Importance des Features & Sélection
Importance par permutation vs impureté (Gini), attribution unifiée SHAP, importance drop-colonne, et comment les features corrélées divisent les scores — avec graphique interactif.
Dépendance Partielle & Courbes ICE
Les PDP marginalisent sur les autres features pour montrer l'effet moyen. Les courbes ICE exposent l'hétérogénéité par échantillon. Les ALE corrigent le problème d'extrapolation.
Prévision de Séries Temporelles
Décomposition tendance-saisonnalité-résidu, features de lag, statistiques glissantes, TimeSeriesSplit, ARIMA et gradient boosting pour la prévision tabulaire.
Apprentissage Profond
Neural networks, CNNs, RNNs and training techniques
Réseaux de Neurones — Propagation Avant & Rétro
Du perceptron aux réseaux profonds : passe avant, fonctions d'activation, rétropropagation, gradient vanishing et initialisation.
Optimisation en Apprentissage Profond
SGD vs Momentum vs Adam vs AdamW, warmup et scheduling cosinus, batch normalization, dropout, gradient clipping, entraînement précision mixte.
Architectures CNN : Classic → ResNet → ViT
CNN de zéro : convolution, pooling, champ réceptif, puis classic, Inception, ResNet (skip connections) et Vision Transformer (ViT).
RNN, LSTM & GRU — Modélisation de Séquences
RNN pour séquences : BPTT, gradient explosif/vanissant, LSTM (portes, état cellulaire), GRU (portes simplifiées), Bi-LSTM.
Vision par Ordinateur
Detection, segmentation and visual understanding
Détection d'Objets : YOLO & Faster-RCNN
Des fenêtres glissantes aux détecteurs single-shot — IoU, boîtes d'ancrage, NMS, mAP et le compromis architectures deux-étapes vs une-étape.
Segmentation d'Image : UNet & DeepLab
Classification au niveau pixel — segmentation sémantique, instance, panoptique, connexions skip dans UNet, convolutions dilatées dans DeepLab.
NLP & Transformers
Text, attention mechanisms and large language models
NLP : Pipeline de Classification de Texte
Pipeline NLP complet : tokenisation, vectorisation TF-IDF, classification (NB/LR/SVM), évaluation F1, embeddings de mots et sentence-transformers.
Transformers & Auto-Attention
Plongée dans l'attention : dot-product scalé, multi-têtes, encodage positionnel, FFN, sampling (température/top-k/top-p), BERT vs GPT.
Audio & Parole
Spectrograms, ASR and audio classification
Audio & Reconnaissance Vocale ML
Des formes d'ondes aux MFCC — STFT spectrogrammes, filterbanks Mel, CNN audio, perte CTC, SpecAugment et Whisper d'OpenAI.
IA Générative
VAEs, GANs and diffusion-style generation
Modèles Génératifs : VAE & GAN
Autoencoder → VAE (ELBO, astuce de reparamétrage) → GAN (entraînement adversarial, DCGAN, collapse de mode).
Apprentissage par Renforcement
MDPs, Q-learning, policy gradients and PPO
Apprentissage par Renforcement
Formalisme MDP, équations de Bellman, Q-learning, DQN, gradients de politique (REINFORCE) et PPO — avec visualisation interactive de la convergence Q.
Plus de diagrammes bientôt
Diffusion Models · Graph Neural Networks · MLOps · LLM Fine-tuning · Causal ML
Besoin d'un ingénieur IA ou data scientist ?
Je conçois des modèles ML sur mesure, des agents IA, de la vision par ordinateur et de l'automatisation — de l'idée à la production.