28‏/02‏/2016

التباين والانحراف المعياري

    سبق أن ذكرنا بأن مجموع انحرافات القيم عن وسطها الحسابي يساوي صفر وقولنا المجموع يساوي الصفر يعني وجود فروق سالبة وأخرى موجبة وللتخلص من الفروق السالبة قمنا بأخذ الانحراف المطلق أي بضرب الفرق السالب بسالب 1 وعرفنا ذلك بالانحراف المتوسط وتوجد طريقة أخرى للتخلص من الفروق السالبة هذه وذلك بتربيعها لتصبح موجبة ومجموع مربعات الانحرافات للقيم عن وسطها الحسبي يعرف بالتباين (Variance) في حين الجذر ألتربيعي لهذا المجموع (مجموع مربعات الانحرافات) يعرف بالانحراف المعياري (Standard Deviation) ، فالتباين أحد مقاييس التشتت.
التباين:
    هو مقياس لاختلاف البيانات وتشتتها، وهو متوسط مربعات انحرافات القيم عن وسطها الحسابي، ويرمز له بالرمز S2 ويحسب من الصيغة الرياضية الآتية:
S2 = [ ∑ (xi – `X )2] / n           , i = 1, 2, 3, ..., n      
ويمكن القسمة على n – 1 في حالة العينة وهو ما يعرف بالقيم الحرة أو درجات الحرية حيث القيمة المتبقية من  يكمل انحرافها عن الوسط الحسابي للصفر لأن مجموع انحرافات القيم عن وسطها يساوي الصفر.
S2 = [ ∑ (xi – `X )2] / ( n – 1 )    , i = 1, 2, 3, ..., n
أما في حالة المجتمع فنستخدم الصيغة الرياضية الآتية:
σ2 = [ ∑ (xi – μ )2] / N    , i = 1, 2, 3, ..., N             
   حيث S2 تباين العينة ، σ2 تباين المجتمع.
    التباين يتعامل مع مربع الانحراف عن الوسط  وهذا يعطي قياس غير ذو معنى مثل مربع الكيلوجرام أو مربع الدينار ولذا يفضل إرجاع ذلك (بأخذ الجذر التربيعي) للمعنى المقبول مثل الكيلوجرام والدينار وما إلى ذلك من وحدات وهذا الجذر ألتربيعي هو الانحراف المعياري لعينة ما.
الانحراف المعياري:
    ببساطة نقول إن الانحراف المعياري هو الجذر ألتربيعي للتباين، ومن الملاحظ أن التباين يقاس بالوحدات المريعة وليس بوحدات المتغير والانحراف المعياري يقاس بنفس وحدات المتغير محل ظاهرة الدراسة.
    الانحراف المعياري هو أفضل مقاييس التشتت وأشهرها استخداماً بالرغم من صعوبة حساباته حال كبر حجم العينة ولكن الحاسب الآلي سهل هذه الصعوبة.
    تستخدم الصيغ الرياضية السابقة لحساب الانحراف المعياري سواء للعينة أو σ للمجتمع
معامل الاختلاف:
    يستخدم لمقارنة التشتت بين مجموعتين (المتغيرات النفسية) وذلك للاختلاف الواضح في الوسط الحسابي لمجموعتين من حيث القيمة فصغر الوسط الحسابي في المجموعة الأولى في مقابل كبره في المجموعة الثانية وهو النسبة المئوية بين الانحراف المعياري والوسط الحسابي وبالتالي لا يعتمد على وحدات المتغير الأصلي وبالتالي يمكن استخدامه لمجموعتين مختلفتين في الوحدات، ويحسب من الصيغة الرياضية الآتية: معامل الاختلاف = 100( الانحراف المعياري ÷ الوسط الحسابي)
طرق حساب الانحراف المعياري:
أولاً: بيانات غير مبوبة
 مثال:
    احسب كلاً من التباين والانحراف المعياري للقيم i 12 ، 15 ، 11 ، 17 ، 18 ، 20 ، 19
الحل:                  نكون جدول المعلومات التالي:
X`X )2
X`X )
Xi
1612 – 16 =  –412
115 – 16 =  – 115
2511 – 16 = – 511
117 – 16 = 1    17
418 – 16 = 2    18
1620 – 16 = 4    20
919 – 16 = 3    19
∑ X`X )= 72 `X = 112/7 = 16
∑ Xi = 112

نحسب التباين من القانون أعلاه:
S2 = [ ∑ (xi – `X )2] / ( n – 1 )
= 72 / 6                            
12                                 
الانحراف المعياري يساوي الجذر ألتربيعي للتباين أي:
S.D = 3.46                                     
حل آخر باستخدام القيم دون الوسط الحسابي  بعد وضع القانون أعلاه في صورة جديدة كما يأتي:
S2 = [ ∑ (xi – `X )2] / ( n – 1 )
           ∑ (X`X )2 =  ∑ ( Xi2 – 2 Xi`X + (`X )2 )  
                                 2`X constant (in sample) Then ∑ 2 Xi`X =  2`X ∑Xi
           ∑ (Xi –`X )2 = ∑ (Xi2 ) – 2`X ∑(Xi) + ∑(`X )2   
                              `X = ∑(Xi) / n Then ∑(Xi) = n`X , ∑(Xi)2 = n2(`X )2 → (∑Xi )2 / n = n2(`X )2 / n =  n`X2
                               = ∑ (Xi2 ) – 2n(`X )2  + n(`X )2
                               = ∑ (Xi2 ) –  n(`X )2                 ,`X = ∑(Xi) / n → `X2 = ∑(Xi)2 / n2  بالضرب في ) → n`X2 = (∑Xi )2 / n
                               = ∑ (Xi2 ) –  (∑Xi)2 / n 
S2 = [∑ (Xi2 ) –  (∑Xi )2 / n] / ( n – 1 ) ... (1)
Or
S2 = [( ∑Xi2 ) –  n`X2 ] / ( n – 1 ) ... (2)
الجدول الآتي هو تعديل للجدول أعلاه:
Xi2
Xi
 14412
 22515
 12111
 28917
 32418
 40020
 36119
∑ Xi2 = 1864
∑ Xi = 112
 بتطبيق هذه الصيغة رقم (1):
S2 = [∑ (Xi2 ) –  (∑Xi )2 / n] / ( n – 1 )
S2 = [1864 –  (112 )2 / 7] / (7 – 1 )
S2 = [1864 –  1792] / 6
S2 = 72 / 6
S2 = 12       التباين
الانحراف المعياري هو الجذر ألتربيعي للتباين أي:
S.D = 3.46

Or
 بتطبيق هذه الصيغة رقم (2):
S2 = [( ∑Xi2 ) –  n`X2 ] / ( n – 1 )
S2 = [1864 –  7(16 )2] / (7 – 1 )
S2 = [1864 –  1792] / 6
S2 = 72 / 6
S2 = 12       التباين
الانحراف المعياري هو الجذر ألتربيعي للتباين أي:
S.D = 3.46


حساب الانحراف المعياري من البيانات المبوبة:
    سنبين ذلك من خلال المثال التالي وكما ورد في المثال السابق من طريقتين إحداهم باستخدام الوسط الحسابي (الطريقة المطولة)  والأخرى بدون الوسط الحسابي (الطريقة المختصرة) وبالتالي سيكون لدينا الصيغ الرياضية  الآتية للتباين والانحراف المعياري للبيانات المبوبة:
حيث طول الفئة ، D الانحراف عن الوسط الفرضي وهو القيمة التي في مركز الفئة التي تقابل أكبر تكرار ونتائج الانحرافات أعداد صحيحة
مثال:
    احسب التشتت باستخدام الانحراف الانحراف من جدول التوزيع التكراري الآتي والذي يبين درجات 30 طالب في امتحان ما.
Total24 – 2621 – 2318 – 2015 – 1712 – 14الفئات
30271083التكرار
الحل:                  
    نكون الجدول الشامل للبيانات المطلوبة للصيغ الرياضية الخاصة بالانحراف المعياري و باستخدام الصيغة (1) أعلاه:  
نجد أن:
fi Xi2Xi2fi XiXifiالفئات
5071693913312 – 14
204825612816815 – 17
3610361190191018 – 20
338848415422721 – 23
12506255025224 – 26
108031895561 30Total

الانحراف المعياري = 3.28
تنبيه:
    312.3 ÷ 30 = 10.41 ويكون الانحراف المعياري = 3.23 كما هو مطابق للحلين الآخرين أدناه


يمكن استخدام الصيغة رقم (2) أعلاه لحساب الانحراف المعياري كما يلي
    نكون الجدول الشامل للبيانات المطلوبة للصيغ الرياضية الخاصة بالانحراف المعياري و باستخدام الصيغة (2) أعلاه نجد أن:
          `X = 561 / 30
                = 18.7
fX –`X )2X –`X )2X –`X )fi XiXifiالفئات
 97.47 32.49 – 5.73913312 – 14
 58.32 7.29 – 2.712816815 – 17
 0.90 0.090.3190191018 – 20
 76.23 10.893.315422721 – 23
 79.38 39.696.35025224 – 26
 312.3 90.45 561 30Total

يمكن استخدام الصيغة رقم (2) أعلاه لحساب الانحراف المعياري كما يلي
    نكون الجدول الشامل للبيانات المطلوبة للصيغ الرياضية الخاصة بالانحراف المعياري و باستخدام الصيغة (2) أعلاه نجد أن:
          `X = 561 / 30
                = 18.7
fiXi2Xi2fi XiXifiالفئات
 5071693913312 – 14
 2048 25612816815 – 17
 3610 361190191018 – 20
 3388 48415422721 – 23
 1250 6255025224 – 26
 10803 561 30Total


الحل باستخدام الوسط الفرضي
 من مركز الفئة العدد 19 المقابل لأكبر تكرار (10)   


f(Di + 1)2fDi2fi DD=(19 – Xi)/319 – XiXifiInterval
3 12– 6– 2– 613312 – 14
0 8 – 8– 1– 316815 – 17
10 0 000191018 – 20
28 7 71322721 – 23
18 8 42625224 – 26
59 35– 3 0 30Total

  تنويه: 1) يمكن الاستغناء عن العمود الرابع من اليسار لكون العمود الخامس ثابت للوسط الفرضي المختار من مركز الفئات
           2) توجد معادلة للتأكد من صحة العملية الحسابية السابقة وهي:
f(Di + 1)2 = fDi2 + 2fi D + n
f(Di + 1)= 59        من العمود الأخير
 fDi2 + 2fi D + n = 35 – 6 + 30     
                  = 59
يعرف هذا التحقق بتحقق تشارليز

المنوال Mode


يعرف المنوال لمجموعة من القيم بأنه القيمة الأكثر شيوعاً بينها، وقد يوجد أكثر من منوال لمجموعة القيم.
البيانات غير المبوبة:
مجموعة القيم 12 ، 13، 8 ، 9 ، 12 ، 12، 23 لها منوال واحد هو القيمة 12
مجموعة القيم 12 ، 13، 8 ، 8 ، 12 ، 12، 23 يوجد أكثر من منوال 12, 8
  • يمكن استخدام المنوال للقيم الكمية والنوعية ولكن يكثر استخدامه مع المعطيات النوعية.
  • في حال وجود أكثر من منوال (متجاورة) فمتوسط هذه المنوالات يعتبر منوال التوزيع حال وجود تلك القيمة في التوزيع.
  • يسمى التوزيع أُحادي المنوال إذا وجد منوال واحد، وثنائي المنوال إذا وجد منوالان، وهكذا.
  • إذا وجد أكثر من منوال فالأكثر تكرار بينهم يدعى المنوال الرئيسي (Major Mode) والأخرى تعرف بالمنوال الفرعي أو الثانوي (Minor Mode)
  • المنوال ببساطة يمثل بقيمة مسقط أعلى نقطة  في المنحنى التكراري على محور الفئات.  
  • المنوال لا يتأثر بالقيم المتطرفة وهو يمثل غالبية القيم.
  • تقل قيمته كمتوسط للقيم حال تباعد القيم عن بعضها البعض.
في حالة البيانات المبوبة:
توجد أكثر من طريقة لحساب المنوال  مثل الطريقة الحسابية ، الطريقة البيانية ، الحاسب الآلي.
الطريقة الحسابية    
    الطريقة الحسابية نوضحها من خلال جدول البيانات التالي فإن الفئة المنوالية (التي تضم المنوال) تقابل أكبر تكرار وهنا أما نستخدم قانون خاص بالمنوال أو نقوم بعملية حسابية وسنين هذا من خلال المثال التالي:
جدول التوزيع التكراري الآتي يبين درجات 50 طالب في مادة الإحصاء والمطلوب حساب المنوال.
27 – 29
24 – 26
21 – 23
18 – 20
15 – 17
12 – 14
الفئات
2
5
7
15
10
11
التكرار
الحل:
    أكبر تكرار هو القيمة 15 F ) إذن 18 – 20 الفئة المنوالية (Modal Intervalالحد الأدنى L ) لهذه الفئة L = 18 تكرار الفئة قبل المنوالية (b1) هو القيمة 10 وتكرار الفئة بعد المنوالية bهو القيمة 7 فإذا رمزنا لطول الفئة بالرمز I ) ومركزها يساوي 19 وهو أقرب قيمة للمنوال إن لم يكن يساويها فإن الصيغة الرياضية لحساب المنوال ( MO ) هي:
وبالتعويض نجد أن:

طريقة الرافعة:
    قانون الرافعة المعروف: القوة في ذراعها = المقاومة في ذراعها وعلى اعتبار ما ورد هنا من أن:
الفئة المنوالية هي 18– ما قبل 21 (طولها 3) التي تقابل أكبر تكرار (15)
ومن الشكل المقابل وحسب قانون الرافعة أي:
10 X = 7(3 – X)     
10 X = 21 – 7 X    
17 X = 21             
X = 1.2                 
Mode = 18 + X    
Mode = 18 + 1.2
Mode = 19.2       

ويمكن وضع صيغة رياضية لذلك بالصورة الآتية

إذا رمزنا  لطول الفئة بالرمز I ولتكرار الفئة اللاحقة للفئة المنوالية بالرمز Fn وتكرار الفئة السابقة للفئة المنوالية بالرمز Fb ولبداية الفئة المنوالية بالرمز L فإن المنوال يحسب من الصيغة الآتية:
              Fn
Mode = L + ـــــــــــــــــــــ × I
                Fb + Fn
بتطبيق الصيغة هذه على المثال السابق نجد أن
                     7× 3
Mode = 18 + ـــــــــــــــــ
                      107

Mode = 18 + 1.2        

Mode = 19.2              

طريقة الفروق(طريقة بيرسون):
    هذه الطريقة تعتمد الفرق بين تكرار الفئة المنوالية (15) والفئة السابقة لها (10) كقوة في قانون الرافعة والفرق بين تكرار الفئة المنوالية (15) والفئة التالية لها (7) كمقاومة في قانون الرافعة       
5 X = 8 (3 – X)
5 X = 24 – 8 X
13 X = 24         
X = 1.9           
Mode = 18 + 1.9
Mode = 19.9    

وهذه النتيجة أفضل من تلك التي حصلنا عليها من تطبيق طريقة الرافعة ويعتبر أفضل قيمة للمنوال من الرسم التكراري ما لم تتساوي قيمتي التكرار السابق واللاحق لتكرار الفئة المنوالية.
في الحالة التي لا تتساوى فيها أطوال الفئات فيلزم هنا قسمة كل تكرار للفئة على طولها فنحصل على ما يعرف بالتكرار المعدل وسنبين ذلك من خلال المثال التالي:
مثال:
في جدول البيانات فإن الفئة المنوالية (التي تضم المنوال) تقابل أكثر تكرار وهنا أما نستخدم قانون خاص بالمنوال أو نقوم بعملية حسابية وسنين هذا من خلال المثال التالي:
جدول التوزيع التكراري الآتي يبين درجات 50 طالب في مادة الإحصاء والمطلوب حساب المنوال.
30 – 33
26 
23 
19 
16 
12 
الفئات
2
5
7
15
10
11
التكرار
الحل:
    نكون الجدول الآتي:
الفئاتالتكرارطول الفئةالتكرار المعدل
12 11411 ÷ 3 = 2.75
16 10310 ÷ 4 = 3.33
19 15415 ÷ 6 = 3.75
23 737 ÷ 2  = 3.50
26 545 ÷ 3  = 1.25
30 – 33232 ÷ 3  = 0.67

الفئة المنوالية هنا 19 – 23 حيث تقابل أكبر تكرار 3.75 وبتطبيق أي من الطرق السابقة نحصل على قيمة المنوال ونستخدم طريقة الرافعة والفروق.
باستخدام طريقة الرافعة نجد أن:
3.33 X = 3.50 ( 4 – X )
3.33 X = 14 – 3.50 X   
3.33 X + 3.50 X = 14   
6.83 X = 14                  
X = 14 ÷ 6.83               
X = 2.1                         
Mode = 19 + 2.1          
Mode = 21.1                
باستخدام طريقة الفروق نجد أن:
0.42 X = 0.25 ( 4 – X )
0.42 X = 1 – 0.25 X      
0.42 X + 0.25 X = 1      
0.67 X = 1                     
X = 1 ÷ 0.67                  
X = 1.5                           
Mode = 19 + 1.5           
Mode = 20.5                 

الطريقة البيانية:
    برسم المنحنى التكراري باتخاذ مراكز الفئات كممثلة للتكرار أي نعين النقاط (13، 11) ، (16، 10) ، ... ، (28، 2) في المستوى ثم نصل بينها باليد فنحصل على المنحني التكراري كما مبين بالشكل.

من أعلى نقطة في المنحنى نسقط عموداً على المحور الأفقي ونقطة تقاطعه مع المحور تمثل قيمة المنوال كما مبين بالشكل.
أو من الجدول التكراري كما مبين بالشكل حيث م نقطة تقاطع المستقيان الواصلان من بداية الفئة المنوالية لبداية الفئة اللاحقة ، من نهاية الفئة المنوالية لنهاية الفئة السابقة، ومسقط م على المحور الأفقي يعطي قيمة المنوال.
توضيح رياضي:
من الشكل  الهندسي المقابل ( الجدول التكراري الثاني )
∆ س ص ن فيه ل ع // س ن فإن ل ع : س ن = ل ص ÷ س ص   ... (1)
∆ س ص ك فيه ل ع // ص ك فإن ل ع : ص ك = ل س ÷ س ص  ... (2)
من (1) ، (2) والقسمة
س ن : ص ك = ل ص : ل س   ... (3)
س ن = قيمة تكرار الفئة المنوالية – قيمة تكرار الفئة قبل المنوالية
ص ك = قيمة تكرار الفئة المنوالية – قيمة تكرار الفئة بعد المنوالية
ل س = الجزء المطلوب حسابه  فالمنوال يساوي 18 + ل س
ل ص =  طول الفئة – ل س
يمكن وضع الصيغة (3) بالصورة:
س ن : ص ك = ( ف – ل س ) : ل س     بضرب الطرفين × الوسطين
ل س × س ن = ف × ص ك – ل س × ص ك
ل س × س ن + ل س × ص ك = ف × ص ك
ل س ( س ن + ص ك ) = ف × ص ك
ل س = ف × ص ك ÷ ( س ن + ص ك )
المنوال = بداية الفئة المنوالية + ل س
سنوجد الصيغة لحساب المنوال كما يلي:
    إذا رمزنا  لطول الفئة بالرمز I ولتكرار الفئة اللاحقة للفئة المنوالية بالرمز Fn وتكرار الفئة السابقة للفئة المنوالية بالرمز Fb ولبداية الفئة المنوالية بالرمز L فإن المنوال يحسب من الصيغة الآتية:
              Fn
Mode = L + ـــــــــــــــــــــ × I
                Fb + Fn
لقد سبق هذه الصيغة أعلاه ( طريقة الرافعة )

    نختار رمز Chart Wizard من شريط القوائم ثم Column  Next ← Rows ← Finish فنحصل على الآتي مع ملاحظة إضافتنا للخطوط في المستطيل الأصفر.

      
حساب المنوال من المدرج التكراري                                                                       حساب المنوال من المنحنى التكراري

العلاقة بين الوسط والوسيط والمنوال
    توجد أربع حالات لهذه العلاقة
تطابق المتوسطات الثلاث (الوسط = الوسيط = المنوال) حال تماثل (Symmetry) وتجانس شكل المنحنى نماماً  (لاحظ شكل 3).
المنحنى غير متماثل أي مفرطح (Skewness) والتفرطح جهة اليمين (+) فإن:  المنوال < الوسيط < الوسط الحسابي (لاحظ شكل 1).
المنحنى غير متماثل أي مفرطح (Skewness) والتفرطح جهة اليسار (–) فإن:  الوسط الحسابي< الوسيط <  المنوال (لاحظ شكل 2).
المنحنى للتوزيع يكون التفرطح فيه معتدل يكون: الوسط الحسابي – المنوال = 3 (الوسط الحسابي – الوسيط).

ملاحظات عامة
 أفضل مقياس من الوسط والوسيط  للقياسات النوعية الصرفة مثل متغير النوع والجنسية وما شابه لتمثيله الظاهرة محل الدراسة.
قيمته تمثل الأكثر تجمع للظاهرة.
سهولة حسابه كما بينا ذلك.
توجد عدة طرقه لحسابه وكلها تقريبية مع اختلاف القيمة فقط المدرج التكراري والفروق الطريقتان اللتان تتفق في الإجابة.
يستخدم المنوال لحساب مقياس سريع عند عدم الاهتمام بالدقة للمقياس.
قد يتواجد منوالان ضمن دراسة واحدة تضم ذكور وإناث قد نعمل على فصلهم لمجموعتين.
الالتواء SKEWNESS

    التوزيع التكراري المتماثل ما كانت تكراراته موزعة توزيعاً متماثلاً حول وسطه الحسابي بما يعني قيم المتغير المتساوية البعد عن الوسط الحسابي لها نفس التكرار فالتواء توزيع يعني مدى بعده عن التماثل وقد يكون الالتواء جهة اليمين (موجب الالتواء) أو الالتواء جهة اليسار (سالب الالتواء) والأشكال الثلاثة التالية تبين ذلك:

  
   
    فالشكل 1 التواء جهة اليمين ، الشكل 2 التواء جهة اليسار ، الشكل 3 متماثل، وبافتراض أن هذه الأشكال تمثل درجات طلاب في امتحان ما، ففي الشكل 1 يعني عدد كبير من الطلاب حصلوا على درجات أقل من المتوسط بمعنى أن مستوى الطلاب أقل من مستوى الامتحان أو أن الامتحان صعب في حين العكس تماماً في الشكل 2 حيث يبن أن عدد كبير من الطلاب حصلوا على درجات أكبر من المتوسط أي أن مستوى الطلاب أعلى من مستوى الامتحان أو أن الامتحان سهل في حين الشكل 3 يعنى مستوى الطلاب مناسب لمستوى الامتحان.
    يقاس الالتواء بأحد المقياسين الآتيين:

            3 (`X – MD )
SKEWNESS = ———————  , MD الوسيط ,  S الانحراف المعياري
                                        S

                             ∑ ( Xi –`X )3
SKEWNESS = ———————    , i = 1, 2, ..., N
                             S3 ( N – 1 )

     وهي مقاييس نسبية يمكن استخدامها للمقارنة بين التواء التوزيعات كما أن قيمة مقياس الالتواء محصورة بين i+3 ، – 3فالقيمة السالبة تعني الالتواء جهة اليسار والقيمة الموجبة تعني الالتواء جهة اليمين والقيمة صفر تعني عدم وجود التواء أو التماثل (التوزيع متماثل).

التفرطح (KURTOSIS or PEAKEDNESS)

التفرطح ثلاثة أنواع للمنحنيات التكرارية (مقارنة بالمنحنيات المعتدلة):
    1) متوسط التفرطح (معتدل) Mesokurtic ( Norma
    2) مدبب ( Leptokurtic ) معظم القيم بالقرب من الوسط الحسابي والذيلين
    3) مفرطح ( Platykurtic ) معظم القيم بعيدة عن الوسط والذيلين

يحسب من الصيغة الرياضية:

                             ∑ ( Xi –`X )4
KURTOSIS  = ———————    , i = 1, 2, ..., N
                             S4 ( N – 1 )