رؤية الحاسوب

التعرف على النشاط البشري (HAR)

معيار 14 نموذجاً على 9,299 قراءة من حساسات UCI. SVM الخطي يتصدر بـ 96.1%. t-SNE يُظهر مجموعات نشاط واضحة. PCA يحتفظ بـ 95% من التباين عند ~95 مكوناً. الخلط بين الجلوس/الوقوف هو المصدر الرئيسي للأخطاء.

عرض على كاغل

96.10%

SVM Linear accuracy

95.18%

Stacking accuracy

94.10%

XGBoost accuracy

~95

PCA components (95%)

مجموعة البيانات

UCI HAR: 9,299 عينة، 561 ميزة، 6 أنشطة، 30 مشاركاً

المنهجية

معيار 14 نموذجاً مع تحليل PCA + t-SNE على ميزات الحساسات

المكدس التقني

PythonScikit-learnXGBoostLightGBMPCAt-SNEPandas

الكلمات المفتاحية

SVMXGBoostLightGBMPCAt-SNESensor DataUCI HAR

المرئيات6 مخططات

التعمق

خط أنابيب ML شامل على UCI HAR — مقياس التسارع + الجيروسكوب من 30 مشاركاً، 6 أنشطة.

مجموعة البيانات

◂9,299 عينة (7,352 تدريب / 2,947 اختبار)، 30 مشاركاً
◂561 ميزة مستخرجة مسبقاً: إحصاءات زمنية + ترددية
◂6 أنشطة: المشي، صعود السلالم، نزول السلالم، الجلوس، الوقوف، الاستلقاء

تحليل الأبعاد

◂t-SNE على 3K: فصل واضح للمجموعات حتى في بُعدين
◂PCA: 95% من التباين عند ~95 مكوناً (من 561)
◂أعلى الميزات بـ F-stat: tBodyAcc-mean-X، tGravityAcc-mean-X

14 نموذجاً

النموذج	دقة الاختبار
Naive Bayes	77.03%
KNN (k=5)	88.02%
Random Forest	92.74%
XGBoost	94.10%
Stacking (RF+XGB+LGB→LR)	95.18%
Logistic Regression	95.42%
SVM RBF	95.49%
SVM الخطي	96.10%

تحليل الأخطاء (115 خطأ / 2,947 = 3.9%)

◂جالس → واقف: 55 خطأ
◂واقف → جالس: 18 خطأ
◂السبب: ميزات وضع مقياس التسارع متطابقة تقريباً — إشارات الجيروسكوب الدقيقة فقط تميّزهما

لماذا يتفوق SVM الخطي الـ 561 ميزة هي إحصاءات مصممة بمعرفة خبراء لتكون قابلة للفصل الخطي. SVM بنواة خطية يستغل ذلك مباشرة. نماذج الأشجار تضيف تعقيداً غير ضروري.

العودة إلى المشاريع توظيفي