العودة إلى المدونة
NLP 12 يناير 2025 8 min للقراءة

تحويل الكلام إلى نص في الإنتاج باستخدام Whisper: دعم اللهجة العربية المغربية

نشر Whisper من OpenAI للنسخ متعدد اللغات — اختيار النموذج والتحسينات وضبط الدارجة المغربية.

اختيار النموذج

النموذجالمعاملاتWER (EN)السرعة
tiny39M14%32x
base74M10%16x
small244M7%6x
medium769M5%2x
large-v31.5B3%1x

للإنتاج مع قيود الكمون: small هو الخيار الأمثل.

النشر باستخدام FastAPI

import whisper
from fastapi import FastAPI, UploadFile

app = FastAPI()
model = whisper.load_model('small').to('cuda')

@app.post('/transcribe')
async def transcribe(audio: UploadFile, language: str = 'ar'):
    audio_bytes = await audio.read()
    result = model.transcribe(audio_bytes, language=language, fp16=True)
    return {'text': result['text'], 'language': result['language']}

مجموعة بيانات الضبط الدقيق للدارجة

استخدمت Mozilla Common Voice Arabic + تسجيلات إذاعية مغربية مستخرجة. الضبط الدقيق على 3 حقب يخفّض WER من 32% إلى 18% على الدارجة.

WhisperSpeech-to-TextArabicMoroccan DarijaAudio
O

Ossama Elhakki

مهندس ذكاء اصطناعي وأنظمة ML — المغرب