وصفة الضبط الدقيق
from transformers import BertForSequenceClassification, AdamW
model = BertForSequenceClassification.from_pretrained(
'bert-base-multilingual-cased', # for AR/FR/EN
num_labels=3
)
# Discriminative learning rates
optimizer = AdamW([
{'params': model.bert.embeddings.parameters(), 'lr': 1e-5},
{'params': model.bert.encoder.layer[:6].parameters(), 'lr': 2e-5},
{'params': model.bert.encoder.layer[6:].parameters(), 'lr': 3e-5},
{'params': model.classifier.parameters(), 'lr': 5e-5},
])
دروس رئيسية
- ابدأ بـ LR=2e-5 وbatch=16 وepochs=3-5
- الإحماء على 10% من الخطوات يمنع النسيان الكارثي
- للعربية: استخدم CAMeL-BERT أو AraBERT وليس mBERT
- تصدير ONNX: استدلال أسرع بثلاث مرات دون الحاجة إلى PyTorch