الانحدار المتعدد
سبق أن تكلمنا عن الانحدار البسيط ممثلاً في معادلة خط انحداره Y = α + βX والتي تظهر المتغير التابع Y المعتمد على المتغير المستقل X وسندرس الآن المتغير التابع مرتبطاً بأكثر من متغير مستقل وهو ما يمكن معالجته بالانحدار البسيط بتأثير كل المتغيرات المستقلة معاً على المتغير التابع وهو ما يقودنا لانحدار المتعدد (أكثر من متغير مستقل X1, X2, ..., Xn) بقصد التنبؤ بالمتغير التابع والذي يأخذ معادلة انحداره ( X2X1/ Y ) الصورة الآتية:
μY/X1X2 = α + β1X1+ + β2X2 + β3X3+ ... + βkXk + ε
أو اختصاراً
μY = α + β1X1+ + β2X2 + β3X3+ ... + βkXk + ε
وإذا أخذنا المعادلة:
μY = α + β1X1+ β2X2 حيث X1, X2 متغيران مستقلان ، Y المتغير التابع ، α , β1 , β2 ثوابت وأن β1 معامل انحدار X1/ Y وأن β2 معامل انحدار X2 / Y .
وتحت نفس الشروط الأربع السابق ذكرها في الانحدار البسيط ( توزيع معتدل ، متوسط صفر , تباين ثابت ، استقلالية الأخطاء) مع إضافة تساوي التباينات لقيم X1, X2
وسوف نمثل المعادلة μY = α + β1X1+ β2X2 في الفراغ ذو الثلاثة أبعاد كما مبين بالشكل.
من الواضح إن المستوى العمودي على المحور X1 جميع نقاطه لها نفس القيمة X1وهو (هنا X1 ثابت) ما يعني تثبيت أثر المتغير X1 وتقاطع هذا المستوى مع مستوى الانحدار (الأخضر) سيكون خط مستقيم (المستويان يتقاطعان في خط مستقيم ) ميله β2ميل خط انحدار X1/ Y، لماذا؟ قلنا إن X1 ثابت فإن β1X1 ثابت ، α ثابت فالمعادلة أعلاه μY = α + β1X1+ β2X2 تأخذ الصورة μY = X2 + β2X2 حيث X2 قيمة ثابتة تساوي α + β1X1 وواضح من المعادلة السابقة (μY = X2 + β2X2 ) الميل يساوي β2 ، بالمثل تثبيت X2 يعطينا مستوى يقطع مستوى الانحدار في خط مستقيم ميلهβ1 (خط انحدار X1 / Y ). لاحظ النقطة ( X1 , X2 , Y ) في حالة X1 = X2 = 0 فإن Y = α من التعويض في المعادلة μY = α + β1X1+ β2X2 أي المستوى الأخضر يقطع Y في النقطة التي إحداثها الصادي = α كما مبين بالشكل.
من الواضح إننا نبحث انحدار متغير (عامل) واحد (التابع) على آخر (مستقل) مع تثبيت أثر العوامل الأخرى (المتغيرات الأخرى بتثبيتها) وهنا سنستخدم تقديرات العينة كتقدير لعينات المجتمع فتصبح المعادلة بالصورة: Y = a + bX1+ cX2 (لمتغيرين مستقلين مع المتغير التابع أو أي رموز أخرى بدلاً عن a, b, c .
أي أن: a, b, c تقديرات لـ α , β1 , β2 والتي تجعل مجموع مربعات أبعاد النقط المشاهدة (Observation المبينة في الشكل) للمسافات الرأسية 2( Y – Yi)∑ أقل ما يمكن أي: [Y – (α + β1X1 + β2X2 + β3X3+ ... + βkXk)]2
وبالتفاضل الجزئي لكل من a, b, c على التوالي نحصل على المعادلات الثلاثة التالية ومن ثم جعل كل ناتج يساوي صفر ( شروط وجود النهاية الصغرى).
∑Y = na + b∑X1 + c ∑X2
∑X1Y = a∑X1 + b∑X12 + c ∑X1X2
∑X2Y = a∑X2 + b∑X1X2 + c ∑X22
( راجع البرهان )
حل المعادلات الثلاث أعلاه ليس بالأمر السهل ولكننا نورد هنا قيم a , b , c مع ملاحظة أن المقام لهم نفس القيمة (باستخدام المحددات) وسنحصل على المعادلة:
Ŷ = a + b X1 + c X2
حيث a , b , c تقديرات لكل من α , β1, β2 على الترتيب
تنويه:
إن a تمثل قيمة ŷ عندما تكون X1 = X2 = 0 في حين تمثل b التغير في ŷ نتيجة تغير X1 بوحدة واحدة بغض النظر عن قيمة X2 ، وتمثل c التغير في ŷ نتيجة تغير X2بوحدة واحدة بغض النظر عن قيمة X1، وتسمى b , c بمعاملات الانحدار الجزئية.
الحل هنا باستخدام الحاسب الآلي أسرع والأفضل والمثال التالي سيتم حله بأكثر من طريقة
ملاحظة عن المشتقة الأولى للدالة
المشتقة الأولى للدالة Y = aXn +bXn-1 + ... + c بالنسبة للمتغير X هي Y\ = a(n)Xn–1 + b(n–1)Xn–2 + ....c تكون أصغر قيمة ممكنة للمتغير التابع Y عندما تكون المشتقة الأولى تساوي الصفر أو عند X المتغير المستقل الذي يجعل المشتقة الأولى يساوي الصفر
برهان المعادلة الاعتدالية لخط المربعات الصغرى
بفرض المعادلة المطلوبة (مستوى الانحدار للمجتمع) هي Y = a + bX1+ cX2
إن قيم Y = y1 + y2 + y3 + ... + yn مقابلة لقيم Xi2 = X12 + X22 + X32 + ... + Xn2 , Xi1 = X11 + X21 + X31 + ... + Xn1 في حين القيم الفعلية للمتغير التابع Y هي y1 , y2 , y3 , ... , yn والمسافة الرأسية هي Y1 – yi = a + bXi1+ cXi2 – yi حيث Y1 = a + bXi1+ cXi2
وبفرض S مجموع المربعات للانحرافات الناتجة، فللحصول على أصغر قيمة ممكنة للكمية S ( نهاية صغرى ) عندما تكون التفاضلات الجزئية لها بالنسبة إلى a , b , cتساوي الصفر (شرط النهاية الصغرى) وبالاشتقاق ووضع المشتقة تساوي الصفر وإجراء العمليات الجبرية على الناتج نحصل على:
ٍS = ( a + bX11+ cX12 – y1 )2 + ( a + bX21+ cX22 – y2 )2 + ( a + bX31+ cX32 – y3 )2 + ... + ( a + bXn1+ cXn2 – yn )2
əS
— = 2(a + bX11+ cX12 – y1) + 2( a + bX21+ cX22 – y2) + 2(a + bX31+ cX32 – y3) + ... + 2(a + bXn1+ cXn2 – yn) = 0
əa
2(a + bX11+ cX12 – y1) + 2(a + bX21+ cX22 – y2) + 2(a + bX31+ cX32 – y3) + ... + 2(a + bXn1+ cXn2 – yn) = 0
(a + bX11+ cX12 – y1) + (a + bX21+ cX22 – y2) + (a + bX31+ cX32 – y3) + ... + (a + bXn1+ cXn2 – yn) = 0
na + b(X11 + X21 + X31 + ... + Xn1) + c(X12 + X22 + X32 + ... + Xn2) – (y1 + y2 + y3 + ... + yn) = 0
na + b ∑X1 + c ∑X2 – ∑Y = 0
∑Y = na + b ∑X1 + c ∑X2 ....... (1)
The same way
∑X1Y = a ∑X1 + b ∑X12 + c ∑X1X2 ....... (2)
∑X2Y = a ∑X2 + b ∑X1X2 + c ∑X22 ....... (2)
ـــــــــــ أوـــــــــ
المعادلة Y = a + bX1+ c X2 إذا قمنا بعملية التجميع إلى n مرة نحصل على مجموع Y هو Y∑ ومجموع a هو na ومجموع bX1 هو b ∑ X1 و ... فنحصل على:
∑Y = na + b ∑X1 + c ∑X2 ....... (1)
وإذا ضربنا Y = a + bX1+ c X2 في X1 نحصل على YX1 = aX1 + bX12+ c X1X2 ولنجمع كما سبق أعلاه فنحصل على المعادلة الثانية:
∑(X1Y) = a ∑X1 + b ∑X12 + c ∑X1X2
وإذا ضربنا Y = a + bX1+ c X2 في X2 نحصل على YX2 = aX2 + bX1X2+ c X22 ولنجمع كما سبق أعلاه فنحصل على المعادلة الثانية:
∑(X2Y) = a ∑X2 + b ∑X1X2 + c ∑X22
مثال
الجدول التالي لبيانات يبين درجات عينة عشوائية مكونة من 10 طلاب في المرحلة الثانوية لامتحانات تحديد المستوى في الرياضيات والفيزياء والمعدل التراكمي لهم في نهاية السنة الأولى في الجامعة والمطلوب التنبؤ بقيمة متغير المعدل التراكمي عند معرفة قيم المتغيرين الآخرين.
درجة الرياضيات X1
| 55 | 80 | 94 | 63 | 78 | 84 | 70 | 70 | 73 | 85 |
درجة الفيزيــاء X2
| 60 | 90 | 85 | 55 | 71 | 90 | 85 | 65 | 80 | 78 |
المعـدل التراكمـي Y
| 2.45 | 3.25 | 3.55 | 2.18 | 2.24 | 2.95 | 2.53 | 2.48 | 2.82 | 2.75 |
الحـل:
نفرض أن: Y متغير المعدل التراكمي و X1 متغير الدرجات في مادة الفيزياء و X2 متغير الدرجات في مادة الرياضيات
نكون جدول البيانات متضمن عناصر الصيغ الثلاثة لحساب a , b , c اللازمة للحصول على معادلة انحدار Y على X1 , X2
Y2 | X22 | X12 | X2Y | X1Y | X1X2 | X2 | X1 | Y |
6.0025 | 3025 | 3600 | 134.75 | 147 | 3300 | 60 | 55 | 2.45 |
10.563 | 6400 | 8100 | 260 | 292.5 | 7200 | 90 | 80 | 3.25 |
12.603 | 8836 | 7225 | 333.7 | 301.75 | 7990 | 85 | 94 | 3.55 |
4.7524 | 3969 | 3025 | 137.34 | 119.9 | 3465 | 55 | 63 | 2.18 |
5.0176 | 6084 | 5041 | 174.72 | 159.04 | 5538 | 71 | 78 | 2.24 |
8.7025 | 7056 | 8100 | 247.8 | 265.5 | 7560 | 90 | 84 | 2.95 |
6.4009 | 4900 | 7225 | 177.1 | 215.05 | 5950 | 85 | 70 | 2.53 |
6.1504 | 4900 | 4225 | 173.6 | 161.2 | 4550 | 65 | 70 | 2.48 |
7.9524 | 5329 | 6400 | 205.86 | 225.6 | 5840 | 80 | 73 | 2.82 |
7.5625 | 7225 | 6084 | 233.75 | 214.5 | 6630 | 78 | 85 | 2.75 |
75.706 | 57724 | 59025 | 2078.62 | 2102.04 | 58023 |
752
|
759
|
27.2
|
ناتج حل المعادلات
|
المعادلات بعد التعويض من الجدول أعلاه(الصف الأخير)
|
المعادلات
|
a = 0.342
b = 0.017
c = 0.015
|
27.2 = 10a + 759b + 752c
2102.4= 759a + 59025b + 58023c
2078.62 = 752a + 58023b + 57724c
|
∑Y = na + b∑X1 + c ∑X2
∑X1Y = a∑X1 + b∑X12 + c ∑X1X2
∑X2Y = a∑X2 + b∑X1X2 + c ∑X22
|
معادلة الانحدار بين المتغير التابع Y والمتغيرين المستقلين X1 , X2 هي: Ŷ = 0.342 + 0.017 X1 + 0.015 X2
التعويض في القوانين ↓
بالتعويض نحصل على قيم الثوابت مع ملاحظة هنا أن مقام الكسور الثلاثة متساوي:
حساب قيمة a
Nnumerator = 59025[27.2×57724-752×2078.62] + 2102.04[752×58023-759×57724] – 58023[27.2×58023 – 759×2078.6]
= 2621818.74
Denominator = 59025[10×57724-752×752]– (10×58023×58023) + (2×759×752×58023) – (759×759×57724)
= 7675794
a = 2635931.4 / 7675794 = 0.341569
= 0.342
حساب قيمة b
Nnumerator = 2102.04[10×57724 – 752×752] + 58023[27.2×752 – 10×2078.62] + 759[752×2078.62 – 27.2×57724]
= 126855
Denominator = 59025[10×57724 – 752×752] – (10×58023×58023) + (2×759×752×58023) – (759×759×57724)
= 7675794
b = 126855 / 7675794 = 0.01653
= 0.0165
حساب قيمة c
Nnumerator = – [59025[27.2×752 – 10×2078.62] + 2102.04[10×58023 – 759×752] – 759[27.2×58023 – 759×2078.6]]
= 114734.7
Denominator = 59025[10×57724 – 752×752] – (10×58023×58023) + (2×759×752×58023) – (759×759×57724)
= 7675794
c = 114829.8 / 7675794 = 0.0149476
= 0.0149