طريقة المربعات الصغرى (Least Square Method)
في المقدمة بينا في الشكل خط انحدار Y على X في حالة العلاقة التامة (معامل الارتباط = 1) ولكن من غير أن تقع جميع نقاط الأزواج على خط الانحدار فإن العلاقة الخطية التامة يجب أن تعدل لتضم الخطأ العشوائي للنقاط التي لا تقع على خط الانحدار بانحرافاتها عن خط الانحدار ويرمز لها لهذا الخطأ بالرمز ε يتصف بالآتي:
1) توزيعه طبيعي 2) وسطه يساوي صفر 3) تباينه ثابت 4) مستقل يمثل انحراف القيم التقديرية عن الحقيقية حسب الصيغة yi = a + bXi + εi
إن تقليل الانحرافات لأصغر قيمة ممكنة يؤدي لاقتراب قيمة من الصفر عندها نحصل على أفضل خط للانحدار وهو نادر الحدوث ولذا فإن تلك النقاط التي لا تقع على خط الانحدار تكون قيم Y الناتجة من التعويض عن قيمة X ( قيمة مشاهدة الموجودة في (x , y) ) ومن حيث أننا أخذنا خط انحدار لا يمر بهذه النقطة فتوجد قيمة أخرى للمتغير Y تقابل قيمة X في (x , y) أي أن قيمة Y تأخذ قيمتين لقيمة X المناظرة لها إحداها المشاهدة لا تقع على خط الانحدار والمتوقعة الواقعة على خط الانحدار (نحصل عليها من الخط المستقيم كما مبين بالشكل بوجد قيمتين y1 , y2 للقيمة x1
الزوج (x1 , y2) يمثل النقطة الحقيقية للبيانات الأصلية
الزوج (x1 , y1) يمثل النقطة الواقعة على خط الانحدار (المتوقع أن يكون أفضل خط)
القيمة y1 هي a + bx1 وهي الناتجة من التعويض في المعادلة Y = a + bX بـ x1
توجد نقاط بعدد حجم العينة n كل منها له بعد رأسي عن الخط
انحرافات بين القيمة المشاهدة والقيمة المتوقعة أي (a + bXi) –ـ Yi
القيمة x1 يقابلها بعد رأسي يساوي (a + bx1) –ـ y1 ـ= y1y2 كما مبين بالشكل
هذا الفرق قد يكون سالباً لذا نأخذ مربعات الفروق
نرغب أن تكون أصغر قيمة ممكنة للمقدار الذي يبين مربعات هذه الفروق وهو:
وهذا ما يعرف بخط المربعات الصغرى ( Least square line ) حيث سيكون حساب a , b مهما معالم خط الانحدار والتي يجب الحصول على قيمها من بيانات العينة اللتان تجعلان مجموع مربعات الانحرافات أقل ما يمكن ويتم الحصول عليهم من المعادلتين الآتيتين بعد تكوين جدول البيات المطلوبة من بيانات العينة:
∑ Y =na + b∑X ................. (1)
∑ XY =a∑ X + b∑X2 .........(2)
توجد أكثر من طريقة لحل المعادلتين السابقتين مثل الحذف أو التعويض أو المحددات أو المصفوفات أو الرسم البياني أو التفاضل وكلها تؤدي للحصول على قيمتي a , b ومنها نحصل على معادلة خط الانحدار وبحل المعادلتين يتم الحصول على قيم a , b وهنا تجد:
هناك صيغتان لحساب a الأولى بقسمة Y∑Y = na + b∑Xعلى n والثانية من قانون الوسط الحسابي وهما
مثال 1
جدول الآتي يبين إنتاج محصول الذرة Y من المساحة المزروعة به X . أوجد معادلة انحدار Y على X
Y إنتاج الذرة بالآف الكيلوجرام | X المساحة المزروعة بالهكتار | المنطقة |
140 | 50 | 1 |
500 | 200 | 2 |
400 | 110 | 3 |
300 | 80 | 4 |
356 | 120 | 5 |
240.5 | 74.5 | 6 |
200.6 | 88.9 | 7 |
33.5 | 5.7 | 8 |
69.8 | 11 | 9 |
18.7 | 3.2 | 10 |
الحل: هنا الحل باستخدام برنامج EXCEL
نكون جدول جديد للحصول على البيانات اللازمة لحساب قيمتي a , b
XY | X2 | Y | X | المنطقة |
7000 | 2500 | 140 | 50 | 1 |
100000 | 40000 | 500 | 200 | 2 |
44000 | 12100 | 400 | 110 | 3 |
24000 | 6400 | 300 | 80 | 4 |
42720 | 14400 | 356 | 120 | 5 |
17917.25 | 5550.25 | 240.5 | 74.5 | 6 |
17833.34 | 7903.21 | 200.6 | 88.9 | 7 |
190.95 | 32.49 | 33.5 | 5.7 | 8 |
767.8 | 121 | 69.8 | 11 | 9 |
59.84 | 10.24 | 18.7 | 3.2 | 10 |
254489.2 | 89017.19 | 2259.1 | 743.3 | Total |
المعادلة المطلوبة: Y = 2.564 X+35.35
الجدول يبين بيانات عن متوسط سعر البترول ومعدلات النمو الاقتصادي في دولة الجزائر خلال السنوات من i1980إلى i1989م والمطلوب إيجاد معادلة خط الانحدار للبيانات أي Y = a + bX ومدى جودتها و التنبوء بالنمو الاقتصادي عندما يكون سعر برميل البترول 20$ ثم عندما يصبح سعر البرميل 40$
السنة | 1980 | 1981 | 1982 | 1983 | 1984 | 1985 | 1986 | 1987 | 1988 | 1989 |
سعر البترول دولار | 35,19 | 39,54 | 35,50 | 30,60 | 29,67 | 29,11 | 14,18 | 18,72 | 16,26 | 18,41 |
معدل النمو الاقتصادي | 0,9 | 3,6 | 4,0 | 5,6 | 4,1 | 5,2 | 1 | -1,1 | -1,8 | -2,9 |
نكون جدول جديد للحصول على البيانات اللازمة لحساب قيمتي a , b ووجود Y2 لحساب معامل الارتباط لمعرفة معامل التحديد للتبوء عن النمو الاقتصادي للسنة عند السعر الجديد للبرميل i10أو i40.
XY | Y2 | X2 | Y | X | Year |
31.671 | 0.81 | 1238.336 | 0.9 | 35,19 | 1980 |
142.344 | 12.96 | 1563.412 | 3.6 | 39,54 | 1981 |
142 | 16 | 1260.25 | 4.0 | 35,50 | 1982 |
171.36 | 31.36 | 936.36 | 5.6 | 30,60 | 1983 |
121.647 | 16.81 | 880.3089 | 4.1 | 29,67 | 1984 |
151.372 | 27.04 | 847.3921 | 5.2 | 29,11 | 1985 |
14.18 | 1.0 | 201.0724 | 1.0 | 14,18 | 1986 |
– 20.592 | 1.21 | 350.4384 | –1.1 | 18,72 | 1987 |
– 29.268 | 3.24 | 264.3876 | –1.8 | 16.26 | 1988 |
– 53.389 | 8.41 | 338.928 | – 2.9 | 18,41 | 1989 |
671.325 | 118.84 | 7880.885 | 18.6 | 267.18 | Total |
n ∑XY – ∑X ∑Y
b = ـــــــــــــــــــــــــــــــــــــــــ
n∑X2 – (∑X)2
10 × 671.325 – 267.18 × 18.6
b = ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
10 × 7880.885 – (267.18)2
1743.702
b = ـــــــــــــــــــــــــ
7423.698
b = 0.235
∑Y – b∑X
a = ــــــــــــــــــــــــــ
n
18.6 – 0.2349 × 267.18
a = ـــــــــــــــــــــــــــــــــــــــــــــــــ
10
a = – 4.416
The Equation is: Y = – 4.416 + 0.235X
نوجد الآن معامل ارتباط بيرسون
هذه القيمة تعني وجود علاقة قوية نسبياً بين متوسط السعر ومعدل النمو ومن حيث القيمة موجبة فالعلاقة طردية.
نوجد معامل التحديد (مربع معامل بيرسون) ويساوي ( 0.697 )2 = 0.49 وهذا يعني أن 49% من معدل تغير النمو الاقتصادي في الجزائر يعتمد على سعر برميل البترول في حين 51% ( 1 – 0.49) ترجع لعوامل أخرى غير سعر البرميل ولم تدخل تلك العوامل ضمن معادلة خط الانحدار التي حصلنا عليها.
إن القيم الناتجة سواء لمعامل الارتباط الذي يجب أن يكو 9% أو أكثر وكذلك معامل التحديد 80% أو أكثر وهو ما يقودنا للقول بأن معاداة الانحدار ليست ذات جودة عالية مما يستدعي إدخال عوامل أخرى بجانب سعر برميل البترول.
نعوض في المعادلة التي حصلنا عليها Y = – 4.416 + 0.235X عن القيم 20 ، 40 نجد أن:
التنبؤ بمعدل النمو الاقتصادي عند السعر 20$ : Y = – 4.416 + 0.235× 20 = 0.284 وهو معدل النمو الاقتصادي لتلك السنة التي يكون فيها سعر البرميل 20%
التنبؤ بمعدل النمو الاقتصادي عند السعر 40$ : Y = – 4.416 + 0.235× 40 = 4.984 وهو معدل النمو الاقتصادي لتلك السنة التي يكون فيها سعر البرميل 40%
البرهان
الحل بواسطة الاكسل
استخدام برنامج EXCEL
بعد إدخال البيانات (المبينة بالشكل) ثم تعليمها كما مبين باللون السماوي ثم نضغط على Chart Wizard من شريط الأدوات فنحصل على Chart Type المبين بالشكل ومن قائمة ( XY Scatter) ثم نضغط على Finish بالطبع ممكن اختيار Next لإعطاء بيانات تفصيلية للرسم البياني المطلوب إظهاره ولكننا هنا بصدد الحصول على نتائج إحصائية بحتة أهمها معادلة خط الانحدار وأي بيانات إحصائية أخرى يمكن اختارها لاحقاًً.
لاحظ هنا البيانات تحت العمودين A , B يجب إعطاء اسماً لكل منها مثل X , Y كمتغيرين أو الاسم الحقيقي لتلك البيانات.
من الممكن اختيار أي من الأشكال الخمسة المبينة بالشكل وكان اختارنا للأول لكوننا نعرف أن المطلوب هو خط الانحدار الذي سيرسمه البرنامج ليضم أكبر عدد من النقاط ممثلة للأزواج في العمودين المبينين بالشكل تمثل تمثيلاً تاماً النقط(50، 140) ، (200، 500) ، ... ، (3.2، 18.7) والتي ستظهر حقيقة مع الخط في نهاية الحل هنا.
نضغط على Finish الآن للحصول على الشكل التالي والذي يظهر هنا بعد إجراء تغير في الخلفية للشكل كما مبين ولكن المهم هنا ظهور 10 نفط تمثل الأزواج التي ذكرناها أعلاه وهنا تمثيل حقيقي لها أي للنقاط .
القيم على المحور الأفقي تمثل قيم X للبيانات والمحور الرأسي للقيم Y ونحن هنا بصدد إيجاد معادلة خط انحدار Y على X والتي تأخذ الصورة الآتية Y = a + b X .
بزر الفأرة الأيمن نضغط على أحد النقاط (في الشكل) فتظهر القائمة المبينة بالشكل حيث نختار منها ِAdd Trendline وبالنقر عليها بالفأرة نحصل على الشكل التالي الذي يظهر ستة أشكال من الانتشار قمنا باختيار الأول منها كما مبين بالتظليل باللون الأسود كخيار مقبول لكوننا نريد الخط المستقيم
ومن ثم من Options لتحديد المطلوب وذلك بالنقر عليها بالفأرة حيث يظهر صندوق الحوار الآتي:
نعلم على Display equation on chart كما هو مبين بالشكل أعلاه وذلك للتعرف على المعادلة المطلوبة.
نضغط على OK للحصول على المطلوب وهو:
1) الشكل المبين فيه خط الانحدار متوسط النقاط الممثلة لأزواج البيانات
2) معادلة خط الانحدار
قد قمنا هنا بنقل المعادلة من مكانها في الشكل لأعلى مع تغير الخط لتوضيح الأمر والشكل التالي هو نتاج العملية والذي يبين لنا المطلوب وخاصة المعادلة الآتية:
Y = 2.5637X + 35.35 وهي معادلة خط الانحدار ونفس المعادلة التي وجدناها في الحلول الأخرى.