نتائج معيار MTEB (2025)
| النموذج | متوسط الدرجة | الأبعاد | التكلفة |
|---|---|---|---|
| text-embedding-3-large | 64.6 | 3072 | $0.13/M tokens |
| Cohere embed-v3 | 64.5 | 1024 | $0.10/M tokens |
| BGE-M3 | 63.8 | 1024 | مجاني |
| E5-mistral-7b | 66.6 | 4096 | مجاني |
| Jina-embeddings-v3 | 65.2 | 1024 | مجاني |
للغات المتعددة (AR/FR/EN)
يوفّر BGE-M3 وJina-v3 أفضل تغطية متعددة اللغات بتكلفة صفرية.
مكدّسي
# Free, local, multilingual
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('BAAI/bge-m3')
embeddings = model.encode(texts, normalize_embeddings=True)