18‏/03‏/2021

طريقة المربعات الصغرى (Least Square Method)

 طريقة المربعات الصغرى (Least Square Method)

    في المقدمة بينا في الشكل خط انحدار Y على في حالة العلاقة التامة (معامل الارتباط = 1) ولكن من غير أن تقع جميع نقاط الأزواج على خط الانحدار فإن العلاقة الخطية التامة يجب أن تعدل لتضم الخطأ العشوائي للنقاط التي لا تقع على خط الانحدار بانحرافاتها عن خط الانحدار ويرمز لها لهذا الخطأ بالرمز ε يتصف بالآتي:

1) توزيعه طبيعي        2) وسطه يساوي صفر        3) تباينه ثابت        4) مستقل       يمثل انحراف القيم التقديرية عن الحقيقية حسب الصيغة yi = a + bXi + εi

    إن تقليل الانحرافات لأصغر قيمة ممكنة يؤدي لاقتراب قيمة  من الصفر عندها نحصل على أفضل خط للانحدار وهو نادر الحدوث ولذا فإن تلك النقاط التي لا تقع على خط الانحدار تكون قيم الناتجة من التعويض عن قيمة X ( قيمة مشاهدة الموجودة في (x , y) ) ومن حيث أننا أخذنا خط انحدار لا يمر بهذه النقطة فتوجد قيمة أخرى للمتغير Y تقابل قيمة X في (x , y) أي أن قيمة تأخذ قيمتين لقيمة X المناظرة لها إحداها المشاهدة لا تقع على خط الانحدار والمتوقعة الواقعة على خط الانحدار (نحصل عليها من الخط المستقيم كما مبين بالشكل بوجد قيمتين y1 , y2 للقيمة x1

الزوج (x1 , y2) يمثل النقطة الحقيقية للبيانات الأصلية

الزوج (x1 , y1) يمثل النقطة الواقعة على خط الانحدار (المتوقع أن يكون أفضل خط)

القيمة yهي a + bx1 وهي الناتجة من التعويض في المعادلة Y = a + bX بـ x1

توجد نقاط بعدد حجم العينة كل منها له بعد رأسي عن الخط

انحرافات بين القيمة المشاهدة والقيمة المتوقعة أي (a + bXi) ـ Yi

القيمة x1 يقابلها بعد رأسي يساوي (a + bx1) ـ y1 ـ= y1y2 كما مبين بالشكل

هذا الفرق قد يكون سالباً لذا نأخذ مربعات الفروق

نرغب أن تكون أصغر قيمة ممكنة للمقدار الذي يبين مربعات هذه الفروق وهو:

 

وهذا ما يعرف بخط المربعات الصغرى ( Least square line ) حيث سيكون حساب a , b مهما معالم خط الانحدار والتي يجب الحصول على قيمها من بيانات العينة اللتان تجعلان مجموع مربعات الانحرافات أقل ما يمكن ويتم الحصول عليهم من المعادلتين الآتيتين بعد تكوين جدول البيات المطلوبة من بيانات العينة:

∑ Y =na + b∑X ................. (1)

∑ XY =a∑ X + b∑X2 .........(2)


    توجد أكثر من طريقة لحل المعادلتين السابقتين مثل الحذف أو التعويض أو المحددات أو المصفوفات أو الرسم البياني أو التفاضل وكلها تؤدي للحصول على قيمتي a , b ومنها نحصل على معادلة خط الانحدار وبحل المعادلتين يتم الحصول على قيم a , b وهنا  تجد:

هناك صيغتان لحساب a الأولى بقسمة Y∑Y = na + bXعلى  والثانية من قانون الوسط الحسابي وهما

مثال 1

جدول الآتي يبين إنتاج محصول الذرة من المساحة المزروعة به . أوجد معادلة انحدار على X

 

Y إنتاج الذرة بالآف الكيلوجرامX المساحة المزروعة بالهكتارالمنطقة
14050

1

5002002
4001103
300804
3561205
240.574.56
200.688.97
33.55.78
69.8119
18.73.210

 

الحل:                     هنا الحل باستخدام برنامج EXCEL

    نكون جدول جديد للحصول على البيانات اللازمة لحساب قيمتي a , b

 

XYX2YXالمنطقة

7000

2500

140

50

1

100000

40000

500

200

2

44000

12100

400

110

3

24000

6400

300

80

4

42720

14400

356

120

5

17917.25

5550.25

240.5

74.5

6

17833.34

7903.21

200.6

88.9

7

190.95

32.49

33.5

5.7

8

767.8

121

69.8

11

9

59.84

10.24

18.7

3.2

10

254489.2

89017.19

2259.1

743.3

Total

المعادلة المطلوبة: Y = 2.564 X+35.35



الجدول يبين بيانات عن متوسط سعر البترول ومعدلات النمو الاقتصادي في دولة الجزائر خلال السنوات من i1980إلى i1989م والمطلوب إيجاد معادلة خط الانحدار للبيانات أي  Y = a + bX ومدى جودتها و التنبوء بالنمو الاقتصادي عندما يكون سعر برميل البترول 20$ ثم عندما يصبح سعر البرميل 40$

السنة

1980

1981

1982

1983

1984

1985

1986

1987

1988

1989

سعر البترول دولار

35,19

39,54

35,50

30,60

29,67

29,11

14,18

18,72

16,26

18,41

معدل النمو الاقتصادي

0,9

3,6

4,0

5,6

4,1

5,2

1

-1,1

-1,8

-2,9

 

                الحل باستخدام EXCEL

    نكون جدول جديد للحصول على البيانات اللازمة لحساب قيمتي a , b ووجود Y2 لحساب معامل الارتباط لمعرفة معامل التحديد للتبوء عن النمو الاقتصادي للسنة عند السعر الجديد للبرميل i10أو i40.

 

XY

Y2

X2

Y

X

Year

31.671

0.81

1238.336

0.9

35,19

1980

142.344

12.96

1563.412

3.6

39,54

1981
142

16

1260.25

4.0

35,50

1982
171.36

31.36

936.36

5.6

30,60

1983
121.647

16.81

880.3089

4.1

29,67

1984
151.372

27.04

847.3921

5.2

29,11

1985
14.18

1.0

201.0724

1.0

14,18

1986
– 20.592

1.21

350.4384

–1.1

18,72

1987
– 29.268

3.24

264.3876

–1.8

16.26

1988
– 53.389

8.41

338.928

– 2.9

18,411989
671.325

118.84

7880.885

18.6

267.18Total

 

        n ∑XY – ∑X ∑Y       

b = ـــــــــــــــــــــــــــــــــــــــــ

         n∑X2 – (∑X)2         

 

 

       10 × 671.325 – 267.18 × 18.6

b = ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ

          10 × 7880.885 – (267.18)2

 

       1743.702

b = ـــــــــــــــــــــــــ

     7423.698

 

b = 0.235

 

       ∑Y – b∑X

a = ــــــــــــــــــــــــــ

              n

 

       18.6 – 0.2349 × 267.18

a = ـــــــــــــــــــــــــــــــــــــــــــــــــ

                      10

 

a = – 4.416

 

The Equation is: Y = – 4.416 + 0.235X

 

نوجد الآن معامل ارتباط بيرسون

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

    هذه القيمة تعني وجود علاقة قوية نسبياً بين متوسط السعر ومعدل النمو ومن حيث القيمة موجبة فالعلاقة طردية.

    نوجد معامل التحديد (مربع معامل بيرسون) ويساوي ( 0.697 )2 = 0.49 وهذا يعني أن 49% من معدل تغير النمو الاقتصادي في الجزائر يعتمد على سعر برميل البترول في حين 51% ( 1 – 0.49) ترجع لعوامل أخرى غير سعر البرميل ولم تدخل تلك العوامل ضمن معادلة خط الانحدار التي حصلنا عليها.

    إن القيم الناتجة سواء لمعامل الارتباط الذي يجب أن يكو 9% أو أكثر وكذلك معامل التحديد 80% أو أكثر وهو ما يقودنا للقول بأن معاداة الانحدار ليست ذات جودة عالية مما يستدعي إدخال عوامل أخرى بجانب سعر برميل البترول.

    نعوض في المعادلة التي حصلنا عليها Y = – 4.416 + 0.235X عن القيم 20 ، 40 نجد أن:

التنبؤ بمعدل النمو الاقتصادي عند السعر 20$ : Y = – 4.416 + 0.235× 20 = 0.284 وهو معدل النمو الاقتصادي لتلك السنة التي يكون فيها سعر البرميل 20%

التنبؤ بمعدل النمو الاقتصادي عند السعر 40$ : Y = – 4.416 + 0.235× 40 = 4.984 وهو معدل النمو الاقتصادي لتلك السنة التي يكون فيها سعر البرميل 40%



البرهان 
الحل بواسطة الاكسل 


استخدام برنامج EXCEL

    بعد إدخال البيانات (المبينة بالشكل) ثم تعليمها كما مبين باللون السماوي ثم نضغط على Chart Wizard من شريط الأدوات فنحصل على Chart Type المبين بالشكل ومن قائمة ( XY Scatter) ثم نضغط على Finish بالطبع ممكن اختيار Next لإعطاء بيانات تفصيلية للرسم البياني المطلوب إظهاره ولكننا هنا بصدد الحصول على نتائج إحصائية بحتة أهمها معادلة خط الانحدار وأي بيانات إحصائية أخرى يمكن اختارها لاحقاًً.

     لاحظ هنا البيانات تحت العمودين A , B يجب إعطاء اسماً لكل منها مثل X , Y كمتغيرين أو الاسم الحقيقي لتلك البيانات.

    من الممكن اختيار أي من الأشكال الخمسة المبينة بالشكل وكان اختارنا للأول لكوننا نعرف أن المطلوب هو خط الانحدار الذي سيرسمه البرنامج ليضم أكبر عدد من النقاط ممثلة للأزواج في العمودين المبينين بالشكل تمثل تمثيلاً تاماً النقط(50، 140) ، (200، 500) ، ... ، (3.2، 18.7) والتي ستظهر حقيقة مع الخط في نهاية الحل هنا.

    نضغط على Finish الآن للحصول على الشكل التالي  والذي يظهر هنا بعد إجراء تغير في الخلفية للشكل كما مبين ولكن المهم هنا ظهور 10 نفط تمثل الأزواج التي ذكرناها أعلاه وهنا تمثيل حقيقي لها أي للنقاط .

    القيم على المحور الأفقي تمثل قيم للبيانات والمحور الرأسي للقيم ونحن هنا بصدد إيجاد معادلة خط انحدار Y على والتي تأخذ الصورة الآتية Y = a + b X .

    بزر الفأرة الأيمن نضغط على أحد النقاط (في الشكل) فتظهر القائمة المبينة بالشكل حيث نختار منها ِAdd Trendline وبالنقر عليها بالفأرة نحصل على الشكل التالي الذي يظهر ستة أشكال من الانتشار قمنا باختيار الأول منها كما مبين بالتظليل باللون الأسود كخيار مقبول لكوننا نريد الخط المستقيم

ومن ثم من Options لتحديد المطلوب وذلك بالنقر عليها بالفأرة حيث يظهر صندوق الحوار الآتي:

نعلم على  Display equation on chart كما هو مبين بالشكل أعلاه وذلك للتعرف على المعادلة المطلوبة.

نضغط على OK للحصول على المطلوب وهو:

    1) الشكل المبين فيه خط الانحدار متوسط النقاط الممثلة لأزواج البيانات

    2) معادلة خط الانحدار

قد قمنا هنا بنقل المعادلة من مكانها في الشكل لأعلى مع تغير الخط لتوضيح الأمر والشكل التالي هو نتاج العملية والذي يبين لنا المطلوب وخاصة المعادلة الآتية:

Y = 2.5637X + 35.35 وهي معادلة خط الانحدار ونفس المعادلة التي وجدناها في الحلول الأخرى.