كل المشاريع
كشف الاحتيال⭐ مميز
كشف الاحتيال على بلوكشين إيثيريوم
كشف احتيال بلوكشين على 9,841 عنوان إيثيريوم. XGBoost+LightGBM+CatBoost+Stacking مع Optuna HPO (40 تجربة) وSHAP. AUC 0.9973، F1 0.9658 عند العتبة المثلى 0.85.
0.9973
Stacking AUC
0.9658
F1 Score (Fraud)
0.85
Optimal threshold
0.9992
Optuna best AUC
مجموعة البيانات
9,841 عنوان إيثيريوم، 51 ميزة سلوكية على السلسلة
المنهجية
خط أساسي → SMOTE + Optuna HPO + مجموعة تكدس + ضبط العتبة
المكدس التقني
PythonXGBoostLightGBMCatBoostOptunaSHAPSMOTE (imbalanced-learn)
الكلمات المفتاحية
XGBoostLightGBMCatBoostSMOTEOptunaSHAPBlockchain
المرئيات6 مخططات
التعمق
خط أنابيب ثنائي المرحلة للكشف عن عناوين إيثيريوم الاحتيالية من الميزات السلوكية على السلسلة.
مجموعة البيانات
- ◂9,841 عنوان: 7,662 شرعي (77.9%) + 2,179 احتيال (22.1%)
- ◂51 ميزة: أنماط ERC20، المبالغ المرسلة/المستقبلة، العناوين الفريدة، التوقيت
- ◂829 قيمة مفقودة في ميزات ERC20 → إسناد بالوسيط
هندسة الميزات
- ◂نسبة الإرسال/الاستقبال، تكرار المعاملات، متوسط القيمة لكل معاملة
- ◂تجميع نشاط ERC20 (رموز فريدة، سرعة المعاملات)
- ◂تحويلات log على توزيعات المبالغ المنحرفة (56 ميزة بعد الهندسة)
المرحلة 1 — خط الأساس
| النموذج | AUC | ملاحظات |
|---|---|---|
| Logistic Regression | 0.8419 | ضعيف في الأنماط السلوكية |
| Random Forest | 0.9973 | ممتاز بالفعل |
المرحلة 2 — خط الأنابيب المتقدم
- ◂فرط العينات بـ SMOTE → توازن 50/50 (11,070 عينة تدريبية)
- ◂Optuna HPO — XGBoost، 40 تجربة → أفضل CV AUC: 0.9992
- ◂تدريب XGBoost + LightGBM + CatBoost
- ◂متعلم فوقي للتكديس (Logistic Regression)
- ◂ضبط العتبة → تعظيم F1
النتائج النهائية
| النموذج | AUC | F1 (احتيال) |
|---|---|---|
| XGBoost | 0.9971 | 0.9659 |
| LightGBM | 0.9972 | 0.9569 |
| CatBoost | 0.9969 | 0.9584 |
| Stacking | 0.9973 | — |
العتبة المثلى: 0.85 → F1: 0.9658
أبرز مؤشرات SHAP للاحتيال عدد إرسال ERC20، تنوع العناوين الفريدة، إجمالي الإيثيريوم المستقبَل، عدم انتظام التوقيت، تنوع رموز ERC20