Tous les Projets
Vision par Ordinateur

Reconnaissance d'Activité Humaine (HAR)

Benchmark de 14 modèles sur 9 299 lectures de capteurs UCI. SVM linéaire en tête à 96,1%. t-SNE montre des clusters d'activité nets. PCA retient 95% de variance à ~95 composantes. Confusion Assis/Debout est la principale source d'erreurs.

96.10%
SVM Linear accuracy
95.18%
Stacking accuracy
94.10%
XGBoost accuracy
~95
PCA components (95%)
Jeu de Données

UCI HAR : 9 299 échantillons, 561 caractéristiques, 6 activités, 30 sujets

Approche

Benchmark de 14 modèles avec analyse PCA + t-SNE sur caractéristiques de capteurs

Stack Technique
PythonScikit-learnXGBoostLightGBMPCAt-SNEPandas
Mots-clés
SVMXGBoostLightGBMPCAt-SNESensor DataUCI HAR
Visualisations6 Graphiques
Analyse Approfondie

Pipeline ML de bout en bout sur UCI HAR — accéléromètre + gyroscope de 30 sujets, 6 activités.

Données

  • 9 299 échantillons (7 352 entraînement / 2 947 test), 30 sujets (21 train / 9 test)
  • 561 caractéristiques pré-extraites : statistiques temporelles + fréquentielles
  • 6 activités : Marche, Montée, Descente, Assis, Debout, Allongé

Analyse de dimensionnalité

  • t-SNE sur 3K : séparation claire des clusters même en 2D
  • PCA : 95% de variance à ~95 composantes (sur 561)
  • Top caractéristiques par F-stat : tBodyAcc-mean-X, tGravityAcc-mean-X, angle(X,gravityMean)

14 modèles

ModèlePrécision test
Naive Bayes77,03%
KNN (k=5)88,02%
Decision Tree87,07%
Random Forest92,74%
XGBoost94,10%
LightGBM93,99%
Stacking (RF+XGB+LGB→LR)95,18%
Logistic Regression95,42%
SVM RBF95,49%
SVM Linéaire96,10%

Analyse des erreurs (115 erreurs / 2 947 = 3,9%)

  • ASSIS → DEBOUT : 55 erreurs
  • DEBOUT → ASSIS : 18 erreurs
  • Cause : les caractéristiques de posture de l'accéléromètre sont quasi-identiques — seuls les fins signaux du gyroscope distinguent les deux postures

Pourquoi SVM linéaire gagne Les 561 caractéristiques sont des statistiques conçues par des experts pour être linéairement séparables. Le SVM à noyau linéaire exploite cela directement. Les modèles basés sur les arbres ajoutent une complexité inutile.