كل المشاريع
رؤية الحاسوب
التعرف على النشاط البشري (HAR)
معيار 14 نموذجاً على 9,299 قراءة من حساسات UCI. SVM الخطي يتصدر بـ 96.1%. t-SNE يُظهر مجموعات نشاط واضحة. PCA يحتفظ بـ 95% من التباين عند ~95 مكوناً. الخلط بين الجلوس/الوقوف هو المصدر الرئيسي للأخطاء.
96.10%
SVM Linear accuracy
95.18%
Stacking accuracy
94.10%
XGBoost accuracy
~95
PCA components (95%)
مجموعة البيانات
UCI HAR: 9,299 عينة، 561 ميزة، 6 أنشطة، 30 مشاركاً
المنهجية
معيار 14 نموذجاً مع تحليل PCA + t-SNE على ميزات الحساسات
المكدس التقني
PythonScikit-learnXGBoostLightGBMPCAt-SNEPandas
الكلمات المفتاحية
SVMXGBoostLightGBMPCAt-SNESensor DataUCI HAR
المرئيات6 مخططات
التعمق
خط أنابيب ML شامل على UCI HAR — مقياس التسارع + الجيروسكوب من 30 مشاركاً، 6 أنشطة.
مجموعة البيانات
- ◂9,299 عينة (7,352 تدريب / 2,947 اختبار)، 30 مشاركاً
- ◂561 ميزة مستخرجة مسبقاً: إحصاءات زمنية + ترددية
- ◂6 أنشطة: المشي، صعود السلالم، نزول السلالم، الجلوس، الوقوف، الاستلقاء
تحليل الأبعاد
- ◂t-SNE على 3K: فصل واضح للمجموعات حتى في بُعدين
- ◂PCA: 95% من التباين عند ~95 مكوناً (من 561)
- ◂أعلى الميزات بـ F-stat: tBodyAcc-mean-X، tGravityAcc-mean-X
14 نموذجاً
| النموذج | دقة الاختبار |
|---|---|
| Naive Bayes | 77.03% |
| KNN (k=5) | 88.02% |
| Random Forest | 92.74% |
| XGBoost | 94.10% |
| Stacking (RF+XGB+LGB→LR) | 95.18% |
| Logistic Regression | 95.42% |
| SVM RBF | 95.49% |
| SVM الخطي | 96.10% |
تحليل الأخطاء (115 خطأ / 2,947 = 3.9%)
- ◂جالس → واقف: 55 خطأ
- ◂واقف → جالس: 18 خطأ
- ◂السبب: ميزات وضع مقياس التسارع متطابقة تقريباً — إشارات الجيروسكوب الدقيقة فقط تميّزهما
لماذا يتفوق SVM الخطي الـ 561 ميزة هي إحصاءات مصممة بمعرفة خبراء لتكون قابلة للفصل الخطي. SVM بنواة خطية يستغل ذلك مباشرة. نماذج الأشجار تضيف تعقيداً غير ضروري.