Reconnaissance d'Activité Humaine (HAR)
Benchmark de 14 modèles sur 9 299 lectures de capteurs UCI. SVM linéaire en tête à 96,1%. t-SNE montre des clusters d'activité nets. PCA retient 95% de variance à ~95 composantes. Confusion Assis/Debout est la principale source d'erreurs.
UCI HAR : 9 299 échantillons, 561 caractéristiques, 6 activités, 30 sujets
Benchmark de 14 modèles avec analyse PCA + t-SNE sur caractéristiques de capteurs
Pipeline ML de bout en bout sur UCI HAR — accéléromètre + gyroscope de 30 sujets, 6 activités.
Données
- ▸9 299 échantillons (7 352 entraînement / 2 947 test), 30 sujets (21 train / 9 test)
- ▸561 caractéristiques pré-extraites : statistiques temporelles + fréquentielles
- ▸6 activités : Marche, Montée, Descente, Assis, Debout, Allongé
Analyse de dimensionnalité
- ▸t-SNE sur 3K : séparation claire des clusters même en 2D
- ▸PCA : 95% de variance à ~95 composantes (sur 561)
- ▸Top caractéristiques par F-stat : tBodyAcc-mean-X, tGravityAcc-mean-X, angle(X,gravityMean)
14 modèles
| Modèle | Précision test |
|---|---|
| Naive Bayes | 77,03% |
| KNN (k=5) | 88,02% |
| Decision Tree | 87,07% |
| Random Forest | 92,74% |
| XGBoost | 94,10% |
| LightGBM | 93,99% |
| Stacking (RF+XGB+LGB→LR) | 95,18% |
| Logistic Regression | 95,42% |
| SVM RBF | 95,49% |
| SVM Linéaire | 96,10% |
Analyse des erreurs (115 erreurs / 2 947 = 3,9%)
- ▸ASSIS → DEBOUT : 55 erreurs
- ▸DEBOUT → ASSIS : 18 erreurs
- ▸Cause : les caractéristiques de posture de l'accéléromètre sont quasi-identiques — seuls les fins signaux du gyroscope distinguent les deux postures
Pourquoi SVM linéaire gagne Les 561 caractéristiques sont des statistiques conçues par des experts pour être linéairement séparables. Le SVM à noyau linéaire exploite cela directement. Les modèles basés sur les arbres ajoutent une complexité inutile.