18‏/03‏/2021

تقدير تباين خط الانحدار

 تقدير تباين خط الانحدار Estimate of the Variance of the Regression Line

    نستعمل معادلة الانحدار لتقدير قيم الفعلية بقيم Ŷ المقدرة للحكم على جودة التقدير بمعرفة مدى مطابقة خط الانحدار على نقاط لوحة الانتشار وذلك بحساب كل من مجموع المربعات الكلي SST ، مجموع المربعات للانحدار SSR ، مجموع المربعات للأخطاء SSE ومنها نحسب تقدير تباين خط الانحدار حيث أن:

مجموع المربعات الكلي SST) Sum of Squares)              مثال          معامل التحديد          الخطأ المعياري لميل الانحدار        اختبار فرضية التوزيع الطبيعي

    مقياس لتشتت القيم الفعلية حول وسطها الحسابي Y` حيث أن:

SST = ∑ (Yi `Y )2      Or     SST = ∑Y2  n`Y2

إذا قسمنا SST على درجات الحرية n – 1 نحصل على تقدير للتباين الكلي لقيم Y عن  Y`

مجموع المربعات للانحدار SSR) Sum of Squares for Regression)

مجموع مربعات التباين المفسر بواسطة Ŷ = a + b x بين قيم المتغير المستقل والمتغير التابع.

SSR = ∑ (Ŷi `Y )2     Or     SSR = b2[∑xi2  n`X2] = b[∑xiYi – n`x`Y]

نحصل على قيم Ŷ بالتعويض عن قيمة x في معادلة خط الانحدار ، SSR هو تقدير تباين قيم Ŷ عن الوسط الحسابي لقيم Y الفعلية.

مجموع المربعات للانحدار SSE) Sum of Squares for Errors)

    هو عبارة عن مقياس التشتت للقيم الفعلية حول خط الانحدار ويعرف بمجموعات مربعات البواقي.

SSE = ∑ (Y `Y )2

وهي مجموع مربعات الانحرافات لقيم Y الفعلية عن قيم Y المقدرة.

تباين الخطأ العشوائي:

    هو تقدير تباين خط انحدار Y على x ويحسب من الصيغة الرياضية (S2Y/x)

 

               SSE        ∑ (Y `Y )2

 S2Y/x = ـــــــــــــــــــــــــــــــ ـــــــــــــــ

              (n – 2         (n – 2)s

 

الخطأ المعياري لتقدير خط انحدار Y على هو قيمة الجذر التربيعي لهذا التقدير.

يمكن تكوين جدول تحليل التباين للانحدار كالتالي:

المحتسبةMSd fSSمصدر التغير

μSx / S2Y/x

OR

MSR / MSE

MSR =μSx = SSR / 1

1

∑ ( Ŷi `Y )2

مجموع المربعات بسبب الانحدار SSR

MSE = S2Y/x = SSE / (n – 2)

n – 2

∑ ( Yi – Ŷ )2

مجموع مربعات الانحرافات عن الانحدار(البواقي) SSE
 n – 1

 ∑ ( Yi `Y )2

مجموع المربعات الكلي SST

 


مثال: كون جدول تحليل التباين للانحدار من الجدول الآتي:

الجدول الآتي يبين إنتاج محصول الذرة من المساحة المزروعة به . اختبر معنوية معامل الانحار عند مستوى معنوية 0.05

 

Y إنتاج الذرة بالآف الكيلوجرامX المساحة المزروعة بالهكتارالمنطقة
14050

1

5002002
4001103
300804
3561205
240.574.56
200.688.97
33.55.78
69.8119
18.73.210

الحل:

 الفرضية الصفرية  H0 : β = 0

الفرضية البديلة     H1 : β  0

    نكون جدول جديد للحصول على البيانات اللازمة لحساب المطلوب:

 

XY

X2Y2المنطقة
7000250019600140501
100000400002500005002002
44000121001600004001103
24000640090000300804
42720144001267363561205
17917.255550.2557840.25240.574.56
17833.347908.2140240.36200.688.97
190.9532.491122.2533.55.78
767.81214872.0469.8119
59.8410.24349.6918.73.210
254489.289017.19(2259.1)750760.62259.1743.3Total
  `Y2 = 51035.3281`Y = 225.91`X = 74.33المتوسط

 

باستخدام الصيغ الرياضية نجد أن:       

SST = ∑Y2  n`Y2

        = 750760.6 – 10 × 51035.3281

        = 750760.6 – 5103.533

        = 745657.067

SSR = b[∑xiYi – n`x`Y]

        = 2.564[254489.2 – 10 × 74.33 × 225.91]

        = 2.564[254489.2 – 167918.903]

        = 221966.242

SSE = SST – SSR

        = 745657.067 – 221966.242

        = 523690.825

 

F الجدوليةالمحتسبةMSd fSSمصدر التغير
F0.05,1,9 = 5.12

3.391

μSx = 221966.242

1

221966.242

مجموع المربعات بسبب الانحدار SSR
  

S2Y/x = 65461353

10 – 2

523690.825

مجموع مربعات الانحرافات عن الانحدار SSE
   

10 – 1

745657.067

مجموع المربعات الكلي SST

 

ومن حيث F المحتسبة أقل من F الجدولية فنقبل الفرضية الصفرية H0 ونستدل منها على خطية معادلة الانحدار Y = 35.35 + 2.564 X (يراجع المثال) وحال مقاربة أو مساواة β للصفر تكون المعادلة محدودة الكفاءة بقصد التوقع ولذا نبني نموذج غير خطي لوصف العلاقة بين X , Y من خلال إيجاد معامل التحديد (R2) الذي تبين قيمته قوة أو ضعف تفسير التباين بابتعاد قيم Yi عن خط انحدار Ŷ .

RSSR ÷ SST = 221966.242 ÷ 745657.067 = 0.298

يستدل من قيمة معامل التحديد ضعف تفسير التباين.


معامل التحديد The Coefficient of Determination

    معامل التحديد ورمزه R2 هو قياس وصفي لتفسير الفائدة لمعادلة الانحدار بتقدير القيم ويمثل نسبة انخفاض الأخطاء حال استخدام معادلة الانحدار عوضاً عن استخدام المتوسطات كذلك هو نسبة التباين في القيم الفعلية التي تفسر خط الانحدار وقيمة النسبة هذه SSR / SST حيث أن SSR = SST – SSE إلا أن تأثيره قليل جداً وقيمته بين – 1 ، 1 واقتراب القيمة من 1 يعني فائدة أكثر لمعادلة الانحدار بالتنبؤ لقيمة المتغير التابع وكذلك يكون المتغير المستقل ذو أهمية في تفسير التباين بين القيم الفعلية والشكل التالي يبين مكونات الانحدار الخطي:

  

من الشكل القيمة الفعلية Yi تنحرف عن خط الوسط  Y`بمسافة رأسية تساوي Yi `في حين تنحرف عن خط القيمة المقدرة Ŷ مسافة رأسية Yi – Ŷ  

انحراف القيمة المقدرة Ŷ عن خط الوسط   Y`يعرف بالانحراف المفسر في حين انحراف القيمة الفعلية (المشاهدة) ن خط الوسط   Y`يعرف بالانحراف غير المفسر.

ومن الشكل نجد أن: مجموع الانحرافات = الانحراف المفسر + الانحراف غير المفسر

كما يمكن استخدام الصيغ التالية لحساب كل من  SST , SSR , SSE السابق ذكرها أعلاه:

 SST = ∑Yi 2  (∑Yi)2 / n

SSR = b2[∑Xi2  (∑Xi)2 / n]

SSE = SST  SSR

جدول تحليل التباين للانحدار

المحتسبةMSd fSSمصدر التغير أو مصدر التباين

μSx / S2Y/x

OR

MSR / MSE

MSR =μSx = SSR / 1

1

∑ ( Ŷi `Y )2

مجموع المربعات بسبب الانحدار SSR

MSE = S2Y/x = SSE / (n – 2)

n – 2

∑ ( Yi – Ŷ )2

مجموع مربعات الانحرافات عن الانحدار(البواقي) SSE
 n – 1

 ∑ ( Yi `Y )2

مجموع المربعات الكلي SST


الخطأ المعياري لميل الانحدار  Standard Error of Regression Slop

    في خط الانحدار Y = a + b X الذي ميله حيث تتراوح قيمته حول قيم المجتمع β ولقياس هذا الانحراف فنقيس الخطأ المعياري لميل الانحدار ويرمز له بالرمز Sb ويحسب من الصيغة الرياضية الآتية حيث Se2 تباين الخطأ العشوائي وهو ثابت لقيم X أو SY/x:

ففي مثالنا السابق نجد أن الخطأ لميل الانحدار(Y = 35.35 + 2.564 X) :

اختبار فرضية التوزيع الطبيعي لمعطيات نموذج الانحدار

    يمكن استخدام أحصاءة لهذا الاختبار والذي صيغته T = (b –β)/Sb مع درجات حرية (n –2) ونبحث الفرضية عند مستوى معنوية α ومقارنة T مع الجدولية:

 الفرضية الصفرية  H0 : ß = 0

الفرضية البديلة     H1 : ß  0

ويتم رفض الفرضية الصفرية إذا كان: T ≥ t (n – 2, α/2) or T ≥ –t (n – 2, α/2)s والقيمة صفر تعني لا فرق بين المتغيرات والاختبار هنا ذو طرفين، وبتطبيق ذلك على مثالنا السابق عند مستوى معنوية 0.05 نجد أن:

t0.05,8 = 2.306

T = (b –β)/Sb    ,    ß = 0

   = 2.564 / 0.261

   = 9.824

    > 2.306

    نرفض الفرضية الصفرية ونقبل بالفرضية البديلة والدالة على أن قيمة ميل المجتمع تدل على أن معامل الانحدار يختلف عن الصفر