الانحدارمبتدئ

الانحدار الخطي واللوجستي

“إيجاد أفضل خط في سحابة من البيانات المتشعثة”

غوص بصري عميق من MCO إلى الانحدار التدرجي وR² والبواقي والتعددية الخطية، ثم اللوجستي: sigmoid وخسارة log وتنظيم L1/L2 وحدود القرار.

45 min

15 مخططات

8 المفاهيم المغطاة

المتطلبات الأساسية

←Linear Algebra

←Probability & Statistics

المفاهيم المغطاة

Least SquaresGradient DescentR²SigmoidL1/LassoL2/RidgeDecision BoundaryOverfitting

السابق: نظرية المعلومات التالي: تقييم النماذج والمقاييس

∑الصيغ الرئيسية

حل MCO

الحل بصيغة مغلقة الذي يُقلل البواقي المربعة — يُطبَّق عندما تكون XᵀX قابلة للعكس

خسارة MSE

متوسط الخطأ التربيعي — الهدف المُقلَّل؛ يعاقب البواقي الكبيرة تربيعياً

تحديث التدرج

قاعدة تحديث الانحدار التدرجي — α هو معدل التعلم الذي يتحكم في حجم الخطوة

السيغمويد

تضغط أي رقم حقيقي إلى (0,1) للتفسير الاحتمالي في الانحدار اللوجستي

▶محاكاة تفاعلية

Loading visualization…

⬡هندسة النموذج

Loading visualization…

🎯

لماذا يهم هذا؟

motivation

الانحدار هو أساس كل نظام تنبؤ. درجة الائتمان، توقعات الطقس، تقدير سعر المنزل، محرك التوصية — كلها تبدأ هنا. قبل الشبكات العصبية، قبل المجموعات، كانت الخط. فهم الانحدار بعمق يعني فهم ما يعنيه 'التعلم' رياضياً.

فاز الانحدار الخطي بجائزة نوبل (الاقتصاد، 1978). يسبق الحواسيب بـ200 عام — استخدمه غاوس للتنبؤ بمدارات الكواكب.

💡

الحدس الهندسي

intuition

تخيل رمي السهام على حائط. كل سهم يهبط في موضع (x, y). تريد إيجاد الخط الذي يمر بأقرب ما يمكن من جميع السهام في آنٍ واحد. 'الأقرب' يعني تقليل المسافات الرأسية (البواقي) من كل سهم إلى خطك. البواقي المربعة تحول هذا إلى منظر على شكل وعاء — وقاع الوعاء هو حل المربعات الصغرى.

∑

رياضيات المربعات الصغرى

math

نصمم العلاقة كـ ŷ = Xβ + ε حيث ε ~ N(0, σ²). تقليل مجموع البواقي المربعة له حل جميل بصيغة مغلقة يسمى المعادلة الطبيعية. يعمل هذا لأن سطح الخسارة مكافئ مكافئ — وعاء مثالي بحد أدنى واحد بالضبط.

🔬

لماذا تعظيم الاحتمالية = تصغير الأخطاء المربعة

deepdive

هذا الترابط عميق. إذا افترضنا ضوضاء غاوسية ε ~ N(0, σ²)، فاحتمال مشاهدة y بمعلومية x يتناسب مع exp(-(y - Xβ)²/2σ²). أخذ اللوغاريتم والنفي يعطينا بالضبط مجموع البواقي المربعة. MCO وMLE نفس الشيء تحت الضوضاء الغاوسية.

افتراض الضوضاء الغاوسية هو سبب تأثير القيم الشاذة بشدة — الأخطاء المربعة تعاقب البواقي الكبيرة تربيعياً. استخدم خسارة هوبر للمتانة.

⚙️

الانحدار التدرجي: التعلم خطوة بخطوة

algorithm

عندما لا تكون XᵀX قابلة للعكس (التعددية الخطية) أو كان مجموعة البيانات كبيرة جداً للمعادلة الطبيعية، نستخدم الانحدار التدرجي. ابدأ في أي مكان على سطح الخسارة، قس الميل، اخطُ خطوة صغيرة للأسفل. كرر حتى التقارب.

تهيئة الأوزان β = 0 (أو قيم عشوائية صغيرة)

حساب التنبؤ: ŷ = Xβ

حساب البواقي: ε = y - ŷ

حساب التدرج: ∇L = -(2/n) Xᵀε

التحديث: β ← β - α · ∇L

التكرار حتى ||∇L|| < التسامح

∑

الانحدار اللوجستي: القفزة الثنائية

math

للنتائج الثنائية نحتاج مخرجات في النطاق (0,1). نمرر التركيبة الخطية عبر دالة السيغمويد σ(z) = 1/(1+e⁻ᶻ) التي تضع ℝ → (0,1). تتغير دالة الخسارة من MSE إلى الإنتروبيا التقاطعية الثنائية (خسارة اللوغاريتم).

</>

من الصفر مع NumPy

code

The full gradient descent implementation in 12 lines:

python36 lines

import numpy as np
from sklearn.datasets import make_regression

# ── Sample data ────────────────────────────────────────────────────────
X_raw, y = make_regression(n_samples=200, n_features=5, noise=10, random_state=42)
X = np.c_[np.ones(len(X_raw)), X_raw]   # prepend bias column
lam = 0.1                                 # Ridge regularisation strength

class LinearRegression:
    def __init__(self, lr=0.01, n_iter=1000):
        self.lr, self.n_iter = lr, n_iter

    def fit(self, X, y):
        n, p = X.shape
        self.beta = np.zeros(p)
        for _ in range(self.n_iter):
            y_hat = X @ self.beta
            residuals = y - y_hat
            grad = -(2/n) * X.T @ residuals
            self.beta -= self.lr * grad
        return self

    def predict(self, X):
        return X @ self.beta

# Demo
model = LinearRegression(lr=0.01, n_iter=1000).fit(X, y)
print("GD beta:", model.beta[:3].round(2))

# Closed-form (Normal Equation):
beta_ols = np.linalg.solve(X.T @ X, X.T @ y)
# Ridge (L2 regularization):
p = X.shape[1]
beta_ridge = np.linalg.solve(X.T @ X + lam * np.eye(p), X.T @ y)
print("OLS beta:  ", beta_ols[:3].round(2))
print("Ridge beta:", beta_ridge[:3].round(2))

⚠️

المزالق الحرجة

pitfall

أربعة أخطاء تُدمّر نماذج الانحدار في الإنتاج:

التعددية الخطية — الميزات المرتبطة تجعل (XᵀX) شبه منفردة. VIF > 10 إنذار. الحل: تنظيم Ridge أو ACP.

الميزات غير الموسّعة — الانحدار التدرجي يتقارب أبطأ 100× إذا كانت الميزات بمقاييس مختلفة. طبّق دائماً StandardScaler أولاً.

عدم تجانس التباين — تباين البواقي غير ثابت. تخيّل البواقي مقابل القيم المجهّزة.

الاستقراء — النماذج الخطية واثقة بشكل خطير خارج نطاق التدريب. لا تستقرئ أبداً بدون معرفة النطاق.

?اختبار المعرفة

يتم حفظ التقدم في متصفحك — لا حاجة لحساب.

نظرية المعلومات

تقييم النماذج والمقاييس

تحتاج مهندس ذكاء اصطناعي أو عالم بيانات؟

أبني نماذج تعلم آلي مخصصة، ووكلاء ذكاء اصطناعي، ورؤية حاسوب، وأتمتة — من الفكرة إلى الإنتاج.

تواصل معي الخدمات