كشف الاحتيال⭐ مميز

كشف الاحتيال على بلوكشين إيثيريوم

كشف احتيال بلوكشين على 9,841 عنوان إيثيريوم. XGBoost+LightGBM+CatBoost+Stacking مع Optuna HPO (40 تجربة) وSHAP. AUC 0.9973، F1 0.9658 عند العتبة المثلى 0.85.

عرض على كاغل

0.9973

Stacking AUC

0.9658

F1 Score (Fraud)

0.85

Optimal threshold

0.9992

Optuna best AUC

مجموعة البيانات

9,841 عنوان إيثيريوم، 51 ميزة سلوكية على السلسلة

المنهجية

خط أساسي → SMOTE + Optuna HPO + مجموعة تكدس + ضبط العتبة

المكدس التقني

PythonXGBoostLightGBMCatBoostOptunaSHAPSMOTE (imbalanced-learn)

الكلمات المفتاحية

XGBoostLightGBMCatBoostSMOTEOptunaSHAPBlockchain

المرئيات6 مخططات

التعمق

خط أنابيب ثنائي المرحلة للكشف عن عناوين إيثيريوم الاحتيالية من الميزات السلوكية على السلسلة.

مجموعة البيانات

◂9,841 عنوان: 7,662 شرعي (77.9%) + 2,179 احتيال (22.1%)
◂51 ميزة: أنماط ERC20، المبالغ المرسلة/المستقبلة، العناوين الفريدة، التوقيت
◂829 قيمة مفقودة في ميزات ERC20 → إسناد بالوسيط

هندسة الميزات

◂نسبة الإرسال/الاستقبال، تكرار المعاملات، متوسط القيمة لكل معاملة
◂تجميع نشاط ERC20 (رموز فريدة، سرعة المعاملات)
◂تحويلات log على توزيعات المبالغ المنحرفة (56 ميزة بعد الهندسة)

المرحلة 1 — خط الأساس

النموذج	AUC	ملاحظات
Logistic Regression	0.8419	ضعيف في الأنماط السلوكية
Random Forest	0.9973	ممتاز بالفعل

المرحلة 2 — خط الأنابيب المتقدم

◂فرط العينات بـ SMOTE → توازن 50/50 (11,070 عينة تدريبية)
◂Optuna HPO — XGBoost، 40 تجربة → أفضل CV AUC: 0.9992
◂تدريب XGBoost + LightGBM + CatBoost
◂متعلم فوقي للتكديس (Logistic Regression)
◂ضبط العتبة → تعظيم F1

النتائج النهائية

النموذج	AUC	F1 (احتيال)
XGBoost	0.9971	0.9659
LightGBM	0.9972	0.9569
CatBoost	0.9969	0.9584
Stacking	0.9973	—

العتبة المثلى: 0.85 → F1: 0.9658

أبرز مؤشرات SHAP للاحتيال عدد إرسال ERC20، تنوع العناوين الفريدة، إجمالي الإيثيريوم المستقبَل، عدم انتظام التوقيت، تنوع رموز ERC20

العودة إلى المشاريع توظيفي