التصنيف متعدد الفئات: OvA مقابل OvO
“توسيع المصنّفات الثنائية إلى متعددة الفئات — أقواس بطولة للخوارزميات”
استراتيجيات كل واحد مقابل الكل وكل واحد مقابل واحد لتوسيع المصنفات الثنائية — حدود القرار وقابلية التوسع وتطبيقات SVM ومتى تستخدم Softmax.
المتطلبات الأساسية
المفاهيم المغطاة
∑الصيغ الرئيسية
مصنِّفات OvA
K مصنِّفات ثنائية، واحد لكل فئة ضد جميع الأخرى — يستلزم K مرات وقت التدريب
مصنِّفات OvO
مصنِّف ثنائي واحد لكل زوج من الفئات — K(K-1)/2 نموذجاً، كل منها يتدرب على فئتين
دالة Softmax
تُطبِّع K لوجيتس إلى توزيع احتمالي — الخرج الطبيعي للتصنيف متعدد الفئات
▶محاكاة تفاعلية
⬡هندسة النموذج
مشكلة التصنيف المتعدد
كثير من المشاكل الحقيقية لها أكثر من فئتين: التعرف على الأرقام (10 فئات)، تصنيف الأنواع (مئات)، تصنيف المنتجات (آلاف). بعض الخوارزميات (الانحدار اللوجستي، SVMs) ثنائية بطبعها. استراتيجيتان تمتدانهما: OvA تُدرب K مصنِّفاً، كل منها يفصل الفئة k عن الباقي. OvO تُدرب K(K-1)/2 مصنِّفاً لكل زوج.
واحد مقابل الكل، واحد مقابل واحد، وSoftmax
OvA: K مصنِّفاً، كل منها يستخدم جميع البيانات. تدريب سريع. غير متوازن (إيجابي واحد مقابل K-1 سلبية). جيد لـK الكبير.
OvO: K(K-1)/2 مصنِّفاً، كل منها يستخدم فئتين فقط. متوازن لكن بطيء لـK الكبير (100 فئة = 4950 مصنِّفاً).
Softmax (LR متعدد الحدود): نموذج واحد، K مخرجاً، مُدرَّب بإنتروبيا تقاطعية. الأكثر كفاءة. أصيل لشبكات الخلايا العصبية.
اصطلاح SVM: OvO هو الافتراضي في sklearn (تاريخياً أداؤه أفضل قليلاً). لشبكات الخلايا العصبية، دائماً Softmax.
التصنيف متعدد الفئات بـSoftmax
import torch import torch.nn as nn from sklearn.datasets import make_classification from sklearn.model_selection import train_test_split from sklearn.multiclass import OneVsRestClassifier, OneVsOneClassifier from sklearn.svm import SVC class="tok-comment"># ── Sample data ──────────────────────────────────────────────────────── X_np, y_np = make_classification(n_samples=class="tok-num">300, n_features=class="tok-num">8, n_classes=class="tok-num">3, n_informative=class="tok-num">6, random_state=class="tok-num">42) X_train_np, X_test_np, y_train_np, _ = train_test_split( X_np, y_np, test_size=class="tok-num">0.2, random_state=class="tok-num">42) class="tok-comment"># ── PyTorch multiclass setup ─────────────────────────────────────────── K = class="tok-num">3 class="tok-comment"># number of classes batch = class="tok-num">16 class="tok-comment"># Tiny class="tok-num">2-layer net for the demo class SimpleNet(nn.Module): def __init__(self): super().__init__(); self.fc = nn.Linear(class="tok-num">8, K) def forward(self, x): return self.fc(x) model = SimpleNet() x = torch.randn(batch, class="tok-num">8) class="tok-comment"># one mini-batch y = torch.randint(class="tok-num">0, K, (batch,)) class="tok-comment"># class indices class="tok-comment"># Class weights (handle imbalance) class_weights = torch.tensor([class="tok-num">1.0, class="tok-num">2.0, class="tok-num">1.5]) class="tok-comment"># weight rarer classes higher class="tok-comment"># Softmax + Cross-Entropy (combined for numerical stability) criterion = nn.CrossEntropyLoss( weight=class_weights, class="tok-comment"># For imbalanced classes label_smoothing=class="tok-num">0.1 class="tok-comment"># Prevents overconfident predictions ) class="tok-comment"># Model outputs raw logits (no softmax in forward pass) logits = model(x) class="tok-comment"># Shape: (batch, K) loss = criterion(logits, y) class="tok-comment"># y contains class indices print(fclass="tok-str">"Multiclass CE loss: {loss.item():.4f}") class="tok-comment"># Predictions probs = torch.softmax(logits, dim=-class="tok-num">1) preds = probs.argmax(dim=-class="tok-num">1) class="tok-comment"># Sklearn: OvR (OvA) strategy ovr = OneVsRestClassifier(SVC(kernel=class="tok-str">'rbf', probability=True)) ovo = OneVsOneClassifier(SVC(kernel=class="tok-str">'rbf')) ovr.fit(X_train_np, y_train_np) print(fclass="tok-str">"OvR accuracy: {ovr.score(X_test_np, _):.3f}")
?اختبار المعرفة
يتم حفظ التقدم في متصفحك — لا حاجة لحساب.