What topics does Ossama Elhakki write about?

Machine learning, deep learning, computer vision, NLP, AI automation with n8n, production MLOps, and Kaggle competition strategies.

How often does Ossama publish new articles?

New technical articles are published regularly, covering hands-on ML projects, tutorial walkthroughs, and AI engineering insights.

Blog & Insights

Articles approfondis sur le machine learning, l'ingénierie IA et les systèmes ML en production

Tous48 Machine Learning18 Computer Vision5 Generative AI2 Deep Learning3 NLP6 AI Agents6 Automation1 MLOps5 Data Engineering2

Articles Mis en Avant

Machine LearningEn Vedette8 min de lecture

AUC 0,9648 sur IEEE-CIS Fraud Detection avec LightGBM Stacking

Guide complet pour construire un ensemble stacking atteignant AUC 0,9648 — feature engineering, sélection de modèles et méta-apprenant.

LightGBMFraud DetectionFeature EngineeringKaggle

Machine LearningEn Vedette10 min de lecture

Playbook de Feature Engineering pour les compétitions ML tabulaires

Les 15 techniques de feature engineering que j'utilise dans chaque compétition Kaggle tabulaire.

Feature EngineeringTabular DataKaggleTarget Encoding

Computer VisionEn Vedette9 min de lecture

Segmentation d'images médicales avec U-Net : atteindre Dice 0,7964

Comment j'ai construit un pipeline U-Net pour la segmentation des lésions cutanées sur ISIC 2018.

U-NetMedical ImagingSegmentationPyTorch

Generative AIEn Vedette10 min de lecture

ControlNet + Stable Diffusion : génération d'images en production

Comment j'ai déployé Stable Diffusion avec ControlNet chez Ofoto — décisions d'architecture, API et prompt engineering.

Stable DiffusionControlNetDiffusersProduction

NLPEn Vedette9 min de lecture

Fine-tuning de BERT pour la NLP en production : guide éprouvé

Tout ce que j'ai appris en fine-tunant BERT sur 10+ projets NLP — tokenisation, planning des LR, gel des couches.

BERTFine-TuningHuggingFaceTransformers

AI AgentsEn Vedette11 min de lecture

Construire un système RAG en production avec LangChain et Pinecone

Architecture et code pour un système RAG en production — stratégies de chunking, modèles d'embedding, recherche hybride.

RAGLangChainPineconeLLM

AI AgentsEn Vedette12 min de lecture

Construire un agent commercial IA WhatsApp avec n8n et Ollama

Comment j'ai construit un agent IA WhatsApp pour un e-commerce marocain — architecture, mémoire conversationnelle, Q&A catalogue.

n8nWhatsAppOllamaLLM Agents

Tous les Articles

Machine Learning6 min de lecture

XGBoost vs LightGBM : Quand utiliser lequel en production

Comparaison pratique et benchmarkée de XGBoost et LightGBM — avec des recommandations concrètes pour le ML tabulaire en production.

XGBoostLightGBMGradient BoostingBenchmarks

20 mars 2025

Machine Learning5 min de lecture

L'arme secrète de CatBoost : l'encodage target ordonné expliqué

Comment CatBoost gère les features catégorielles sans fuite de données avec l'encodage target ordonné.

CatBoostCategorical FeaturesTarget EncodingGradient Boosting

18 février 2025

Machine Learning7 min de lecture

Déséquilibre de classes en production : ce qui fonctionne vraiment

Après 20+ projets de classification déséquilibrée, voici ce qui fait vraiment la différence.

Class ImbalanceSMOTEFraud DetectionClassification

1 février 2025

Machine Learning6 min de lecture

Optuna en production : optimisation intelligente des hyperparamètres

Comment utiliser Optuna au-delà de la recherche aléatoire — élagage, optimisation multi-objectif, bases de données d'études persistantes.

OptunaHyperparameter TuningBayesian OptimizationLightGBM

22 janvier 2025

Machine Learning7 min de lecture

SHAP pour le ML en production : expliquer les modèles aux parties prenantes

Guide pratique des valeurs SHAP — importance globale, explications locales, graphiques en cascade.

SHAPExplainabilityXAIFeature Importance

10 janvier 2025

Machine Learning5 min de lecture

Stratégies de validation croisée : laquelle utiliser et quand

K-Fold, Stratifié, GroupKFold, TimeSeriesSplit — guide pratique pour choisir la bonne stratégie CV.

Cross-ValidationModel EvaluationTime SeriesKaggle

15 décembre 2024

Computer Vision8 min de lecture

YOLOv8 entraînement personnalisé : du dataset à l'API de production

Guide de bout en bout pour entraîner YOLOv8 sur un dataset personnalisé — annotation, entraînement, évaluation et déploiement FastAPI.

YOLOv8Object DetectionFastAPIONNX

12 mars 2025

Deep Learning12 min de lecture

Construire un Transformer from scratch en PyTorch

Implémentation pas à pas de l'architecture Attention is All You Need originale.

TransformerPyTorchAttentionNLP

28 janvier 2025

Deep Learning8 min de lecture

10 astuces d'entraînement PyTorch qui ont réduit mon temps de moitié

Précision mixte, gradient checkpointing, optimisation DataLoader, torch.compile, et 6 autres astuces avec des accélérations mesurées.

PyTorchTrainingMixed PrecisionPerformance

15 janvier 2025

NLP8 min de lecture

NLP arabe en 2025 : AraBERT, CAMeL Tools et pipelines de production

Guide pratique pour la NLP arabe — les meilleurs modèles, défis de prétraitement, gestion des dialectes.

Arabic NLPAraBERTHuggingFaceText Classification

1 mars 2025

AI Agents7 min de lecture

Patterns de prompt engineering qui fonctionnent vraiment en 2025

Chain-of-thought, few-shot, prompts système, mode JSON et 5 autres patterns avec des exemples réels.

Prompt EngineeringLLMGPT-4Chain-of-Thought

20 avril 2025

Automation10 min de lecture

5 workflows d'automatisation IA n8n que j'ai construits pour de vraies entreprises

Qualification de leads, traitement de documents, automatisation des réseaux sociaux — workflows réels avec ROI réel.

n8nAutomationAI AgentsGPT-4

5 avril 2025

AI Agents9 min de lecture

Concevoir des systèmes multi-agents IA qui fonctionnent vraiment

Architectures orchestrateur-worker, peer-to-peer et hiérarchiques — quand utiliser chacune.

Multi-AgentLLMArchitectureOrchestration

15 mars 2025

MLOps11 min de lecture

Pipeline MLOps from scratch : CI/CD pour les modèles ML

Comment construire un pipeline MLOps complet — versioning des données avec DVC, tracking des expériences avec MLflow.

MLOpsDVCMLflowCI/CD

22 mars 2025

MLOps8 min de lecture

Détecter la dérive des modèles en production avant qu'elle ne détruise vos KPIs

Dérive des données vs dérive des concepts — méthodes de détection, dashboards Evidently AI.

Model DriftMonitoringEvidently AIProduction

10 février 2025

MLOps7 min de lecture

Déployer des modèles ML avec FastAPI : checklist de production

Du pickle au FastAPI de production — inférence async, validation Pydantic, rate limiting, health checks.

FastAPIDockerDeploymentREST API

30 janvier 2025

Machine Learning9 min de lecture

Ma stratégie de compétition Kaggle : du bronze à l'or

Le workflow exact que je suis dans chaque compétition Kaggle — EDA, baseline, sprints de feature engineering.

KaggleCompetitionStrategyEnsemble

20 février 2025

Machine Learning9 min de lecture

Prévision de séries temporelles à grande échelle : d'ARIMA à LightGBM

Quand les méthodes classiques fonctionnent et quand le ML gagne — feature engineering pour les séries temporelles.

Time SeriesForecastingLightGBMProphet

5 janvier 2025

Machine Learning13 min de lecture

DQN from scratch : apprendre à un agent à jouer à Snake

Implémentation DQN from scratch en PyTorch — environnement, replay buffer, exploration epsilon-greedy.

Reinforcement LearningDQNPyTorchGame AI

18 janvier 2025

Computer Vision8 min de lecture

Reconnaissance faciale en production avec InsightFace

Système de reconnaissance faciale de bout en bout — détection, alignement, extraction d'embeddings ArcFace.

Face RecognitionArcFaceInsightFaceFaiss

20 décembre 2024

Computer Vision7 min de lecture

Classification d'images avec EfficientNet : meilleures pratiques du transfer learning

Comment fine-tuner EfficientNet pour la classification d'images — planning de dégel, augmentation, label smoothing.

EfficientNetTransfer LearningImage ClassificationPyTorch

5 décembre 2024

Generative AI10 min de lecture

Entraîner des GANs qui ne s'effondrent pas : leçons du DCGAN au StyleGAN

Astuces d'entraînement GAN pour prévenir l'effondrement de mode — normalisation spectrale, croissance progressive.

GANDCGANStyleGANPyTorch

20 novembre 2024

Data Engineering7 min de lecture

Pandas à grande échelle : 10 optimisations pour les grands DataFrames

De 10 minutes à 30 secondes : downcasting des types, vectorisation, repli sur Dask.

PandasPerformanceData EngineeringMemory

28 décembre 2024

Data Engineering8 min de lecture

PostgreSQL comme feature store : patterns de conception pour les pipelines ML

Comment utiliser PostgreSQL efficacement comme feature store — vues matérialisées, partitionnement pour les séries temporelles.

PostgreSQLFeature StoreML PipelineSQL

15 novembre 2024

Machine Learning9 min de lecture

Algorithme NEAT : faire évoluer des réseaux de neurones sans backprop

Comment NEAT fait évoluer les poids et la topologie des réseaux de neurones — spéciation, croisement, numéros d'innovation.

NEATNeuroevolutionGenetic AlgorithmGame AI

28 novembre 2024

Machine Learning10 min de lecture

Monte Carlo Tree Search : l'algorithme derrière AlphaGo

Une explication claire de MCTS — sélection, expansion, simulation, rétropropagation.

MCTSGame AIAlphaGoTree Search

10 novembre 2024

Machine Learning8 min de lecture

Algorithmes génétiques pour les problèmes d'optimisation réels

Utiliser des algorithmes génétiques pour la sélection de features, l'optimisation des hyperparamètres et la planification.

Genetic AlgorithmOptimizationFeature SelectionEvolutionary Computing

25 octobre 2024

AI Agents7 min de lecture

Exécuter des LLMs localement avec Ollama : guide de production

Configuration d'Ollama pour la production — sélection de modèle, intégration API, optimisation des performances.

OllamaLLMLocal AILlama

18 avril 2025

AI Agents8 min de lecture

Comparatif des bases de données vectorielles 2025 : Pinecone vs Weaviate vs Qdrant vs Chroma

Benchmark pratique des meilleures bases de données vectorielles — vitesse d'indexation, latence de requête, filtrage.

Vector DatabasePineconeQdrantRAG

14 février 2025

MLOps6 min de lecture

Docker pour le ML : environnements reproductibles et builds multi-étapes

Meilleures pratiques pour conteneuriser le code ML — builds multi-étapes, support GPU, mise en cache des modèles.

DockerMLOpsContainersReproducibility

8 janvier 2025

Machine Learning6 min de lecture

Pipelines Scikit-learn : la bonne façon de construire des workflows ML

Pourquoi tout envelopper dans un Pipeline sklearn — prévention des fuites de données, validation croisée correcte.

Scikit-learnPipelineData LeakageBest Practices

5 novembre 2024

NLP6 min de lecture

Modèles d'embedding de texte en 2025 : lequel utiliser pour le RAG ?

Benchmarking des embeddings OpenAI, Cohere, E5, BGE et Jina sur des tâches de récupération.

EmbeddingsRAGMTEBMultilingual

8 mars 2025

Machine Learning8 min de lecture

Détection d'anomalies avec des autoencodeurs : mieux que les règles, moins cher que les étiquettes

Utiliser des autoencodeurs pour la détection d'anomalies non supervisée — seuillage de l'erreur de reconstruction.

Anomaly DetectionAutoencoderUnsupervisedPyTorch

12 décembre 2024

Deep Learning7 min de lecture

Optimisation de l'entraînement GPU : tirer le meilleur parti de votre matériel

Utilisation GPU, diagnostic des goulots d'étranglement, optimisation DataLoader — techniques pratiques pour s'entraîner 2x plus vite.

GPUCUDAPyTorchTraining

15 octobre 2024

NLP9 min de lecture

Analyse de sentiment pour le texte arabe : BERT vs ML traditionnel

Construire un classificateur de sentiment production pour les avis clients arabes — curation de dataset, défis de prétraitement.

Sentiment AnalysisArabic NLPBERTAraBERT

25 janvier 2025

Computer Vision8 min de lecture

Stratégies d'augmentation de données avec moins de 1000 exemples

Mixup, CutMix, AugMix, données synthétiques avec GANs — que faire quand votre dataset est minuscule.

Data AugmentationSmall DatasetsMixupCutMix

1 octobre 2024

Machine Learning10 min de lecture

Entretien de conception de système ML : un framework qui fonctionne

Une approche structurée pour les entretiens de conception de système ML — cadrage du problème, stratégie de données.

System DesignML InterviewArchitectureProduction

5 février 2025

NLP7 min de lecture

Prétraitement de texte NLP : le guide complet pour 2025

Tokenisation, normalisation, stemming vs lemmatisation, encodage de sous-mots.

NLPText PreprocessingTokenizationBERT

1 novembre 2024

Machine Learning10 min de lecture

Construire un système de recommandation : du filtrage collaboratif au Neural CF

Factorisation matricielle, feedback implicite et filtrage collaboratif neuronal — implémentation pratique.

Recommendation SystemCollaborative FilteringMatrix FactorizationPyTorch

10 octobre 2024

NLP8 min de lecture

Speech-to-Text en production avec Whisper : support du dialecte arabe marocain

Déployer OpenAI Whisper pour la transcription multilingue — sélection du modèle, optimisations.

WhisperSpeech-to-TextArabicMoroccan Darija

12 janvier 2025

MLOps9 min de lecture

Rendre les modèles 10x plus petits : quantification, élagage et distillation

Quantification INT8, élagage structuré et distillation — réduire la taille du modèle de 90% en gardant 95% de précision.

Model CompressionQuantizationPruningKnowledge Distillation

20 septembre 2024

Besoin d'un ingénieur IA ou data scientist ?

Je conçois des modèles ML sur mesure, des agents IA, de la vision par ordinateur et de l'automatisation — de l'idée à la production.

Me contacter Voir les services