المقاييس الاحصائية
تعد المقاييس الاحصائية جزءًا أساسيًا من العلم الاحصائي من العلوم التطبيقية الهامة في مجال البحث والدراسة، فهو يهتم بتجميع البيانات وتحليلها وتفسيرها من أجل اتخاذ القرارات الصحيحة، حيث تساعدنا المقاييس الاحصائية في تحويل البيانات الكمية إلى أرقام معنوية يمكننا فهمها واستخدامها في الدراسات والأبحاث المختلفة.
تعريف المقاييس الاحصائية:
المقاييس الاحصائية هي أدوات تستخدم في علم الاحصاء لقياس الظواهر والمتغيرات المختلفة، وتساعدنا هذه المقاييس في تلخيص وتحليل البيانات، وفهم العلاقات بين المتغيرات، واستنتاج النتائج وإجراء التنبؤات، وتتنوع المقاييس الاحصائية بحسب النوع وخصائص البيانات التي نعمل عليها، مثل المقاييس الوسطية والتمثيلية والتشتتية.
أهمية المقاييس الاحصائية؟
تحظى المقاييس الاحصائية بأهمية كبيرة في مجال البحث والدراسة، حيث:
- تساهم في فهم البيانات وتحليلها بطريقة منهجية ودقيقة.
- من خلال استخدام المقاييس الاحصائية، يمكننا قياس الظواهر وتحديد المعدلات والتوزيعات والفروق البينية بين المجموعات.
- تساعدنا في تحليل العلاقات وتوجيه القرارات بناءً على البيانات القوية المعتمدة على الأرقام.
- فهم المقاييس الاحصائية والاستفادة منها يعتبر ضروريًا للأشخاص العاملين في مجالات البحث والتحليل.
مقاييس النزعة المركزية وأنواعها:
تعرف مقاييس النزعة المركزية أو مقاييس الموقع أو المتوسطات، على أنها مقاييس عددية تحدد موقع التوزيع للبيانات، ويمكن تعريف المتوسطات بأنها القيمة النموذجية الممثلة لمجموعة من البيانات، والتي تميل إلى الوقوع في المركز، لذلك تسمى المتوسطات بمقاييس النزعة المركزية.
وهي مهمة في حالة المقارنة بين التوزيعات المختلفة للبيانات، وتكون فائدتها أكثر في حالة التوزيعات المتشابهة في طبيعتها وأشكالها ولكنها مختلفة في مواقعها.
فمثال: عند دراسة الإنفاق لعينة من الأسر في الريف، وأخرى في والحضر، فإنه يمكننا المقارنة بينهما من خال هذه المقاييس، وسوف نستعرض أهم مقاييس النزعة المركزية أدناه، حيث أن لكل منها مميزاته ومحدداته:
أنواع مقاييس النزعة المركزية:
يوجد لمقاييس النزعة المركزية عدة أنواع وهي كالتالي:
أولاً: الوسط (المتوسط) الحسابي Mean:
هو قيمة تتجمع حولها مجموعة من القيم، ويعتبر من أهم مقاييس النزعة المركزية والأكثر استخداما في الإحصاء والحياة العملية، ويستخدم عادة في الكثير من المقارنات بين الظواهر المختلفة.
أهم مميزات الوسط الحسابي:
- مقياس سهل حسابه ويخضع للعمليات الجبرية بسهولة، ويعتبر أكثر المقاييس استخداما في الإحصاء
- يأخذ في الاعتبار جميع القيم محل الدراسة
- يكون المتوسط الحسابي محصوراً دائماً بين أكبر وأصغر قيمة في العينة.
- مجموع انحرافات القيم عن الوسط الحسابي للعينة يساوي صفراً.
بعض محددات الوسط الحسابي:
- يتأثر بالقيم الشاذة (المتطرفة) وهي القيم الكبيرة جدا أو الصغيرة جدا مقارنة بباقي القيم.
- يصعب حسابه في حالة الجداول التكرارية المفتوحة، حيث يتطلب ذلك معرفة مركز كل فئة.
- لا يمكن حسابه في حالة البيانات الوصفية.
ثانياً: الوسيط Median:
علماء الإحصاء يعرفونه بأنه المقياس الذي يستخدم لقياس القيمة المتوسطة التي تكون القيم الأكثر منها تساوي القيم الأقل منها، أو بعبارة أخرى: هو المقياس الذي يقوم بعملية فصل متساو للنصف الأعلى من البيانات عن النصف الأدنى، بحيث يأخذ بالاعتبار ترتيب البيانات، ويختلف حساب الوسيط في حالة البيانات غير المبوبة عنها في المبوبة، ويوجد لديه نوعان وهما:
- الوسيط للبيانات غير المبوبة.
- الوسيط للبيانات المبوبة.
مميزات الوسيط:
- لا يتأثر بالقيم المتطرفة، ويمكن إيجاده في حالة البيانات الوصفية التي يمكن ترتيبها.
- مجموع الانحرافات المطلقة عن الوسيط أقل ما يمكن مقارنة بأي قيمة حقيقية.
محددات الوسيط:
- لا يأخذ جميع القيم في الاعتبار عند حسابه.
- لا يسهل التعامل معه في التحاليل الإحصائية والرياضية.
ثالثا: المنوال Mode:
يعرف المنوال على أنه القيمة الأكثر تكرارا في مجموعة البيانات، ويكثر استخدامه في حالة البيانات الوصفية، لمعرفة النمط (المستوى) الشائع، وقد يكون لمجموعة البيانات منوال واحد ولذلك يطلق عليها وحيدة المنوال، أو يكون لها أكثر من منوال وتسمى متعددة المنوال، وقد لا يكون لمجموعة البيانات أي منوال وبذلك تسمى عديمة المنوال.
مميزات المنوال:
- مقياس سهل حسابه ولا يتأثر بالقيم الشاذة.
- يمكن إيجاده للقيم الوصفية والتوزيعات التكرارية المفتوحة.
محددات المنوال:
عند حساب المنوال لا تؤخذ جميع قيم البيانات في الاعتبار، وقد يكون لبعض البيانات أكثر من منوال وبذلك لا يمكن تحديد قيمة وحيدة للمنوال.
رابعاً: الوسط الهندسي Geometric Mean:
الوسط الهندسي (GM) هو نوع من المتوسطات أو المعدلات التي تقيس النزعة المركزية أو القيمة النموذجية لمجموعة معطيات، يتم حسابه عن طريق حساب الجذر من الدرجة ال(n) لحاصل ضرب حدود المجموعة، حيث (n) هو عدد الحدود.
مميزات ومحددات الوسط الهندسي:
- من مميزاته أنه لا يتأثر بالقيم المتطرفة.
- ينما لا يمكن استخدامه مع البيانات التي تضم قيما سالبة او صفر.
خامساً: الوسط التوافقي Harmonic Mean:
يكون الوسط التوافقي مفيد، إذا كانت المتغيرات على شكل نسب، فهو يستخدم عندما يكون مقلوب المتغير له دلاله كأن يعين نسبة بين متغيرين مرتبطين مثل السرعة بالنسبة للزمن، والوسط التوافقي H لمجموعة من القيم هو مقلوب الوسط الحسابي لهذه القيم.
مقاييس التشتت(Measures of Dispersion):
مقاييس التشتت هي مقاييس عددية تستخدم لقياس درجة تجانس (تقارب) أو تشتت (تباعد) مفردات البيانات عن بعضها البعض، ومقاييس التشتت تستخدم لوصف مجموعة البيانات، وكذلك لمقارنة مجموعات البيانات المختلفة، إذ أن مقاييس النزعة المركزية لا تكفي وحدها لوصف مجموعة البيانات أو مقارنة مجموعات البيانات المختلفة، ومن أشهر مقاييس التشتت نذكر:
أولاً: المدى Range:
يعتبر المدى من أسهل مقاييس التشتت تعريفا وحسابا، حيث أنه يعطينا فكرة سريعة عن مدى تفرق البيانات ويرمز له بالرمز (R).
في حالة البيانات غير المبوبة:
المدى (R)= أكبر قيمة - أصغر قيمة
في حالة البيانات المبوبة فإن المدى يعرف بأكثر من طريقة، نذكر منها الطريقتين الآتيتين:
المدى (R)= مركز الفئة العليا - مركز الفئة الدنيا
المدى (R)= الحد الأعلى للفئة العليا - الحد الأدنى للفئة الدنيا
مميزات المدى:
- سهل التعريف والحساب.
- يعطى فكرة سريعة عن طبيعة البيانات، ويستخدم كثيرا في ظواهر الحياة المختلفة مثل مراقبة جودة الإنتاج وكذلك في وصف طبيعة الأحوال الجوية.
محددات المدى:
- يعتمد في حسابه على قيمتين من البيانات، ولا يأخذ بالاعتبار باقي القيم.
- يتأثر بالقيم الشاذة، وبالتالي فهو لا يعطى صورة صادقة عن طبيعة البيانات. لذلك فهو مقياس تقريبي.
ثانياً: نصف المدى الربيعي (Mid – Range Quartile):
نصف المدى الربيعي هو نصف المدى بين الربيع الأول (Q1)، والربيع الثالث (Q3) ويرمز له بالرمز (Q).
حساب نصف المدى الربيعي للبيانات غير المبوبة:
- ترتب البيانات تصاعديا.
- نجد قيمة الربيع الأول (Q1).
- نجد قيمة الربيع الثالث (Q3).
- تطبيق للعلاقة الرياضية السابقة.
نصف المدى الربيعي للبيانات المبوبة:
يحسب نصف المدى الربيعي لهذه البيانات بطريقة الفروق، ويتم حساب الربيع الأول والثالث حسب العاقات المبينة أدناه
مميزات نصف المدى الربيعي:
- لا يتأثر بالقيم الشاذة أو المتطرفة.
- يمكن حسابه من التوزيعات التكرارية المفتوحة من الطرفين
محددات نصف المدى الربيعي:
- لا يأخذ جميع القيم في الاعتبار.
- لا يسهل التعامل معه في التحليل الإحصائي
ثالثاً: الانحراف المتوسط Mediterranean Deviation:
يعرف الانحراف المتوسط بأنه متوسط الانحرافات المطلقة للبيانات عن وسطها الحسابي، ويرمز له بالرمز MD.
رابعاً: الانحراف المعياري Standard Deviation:
يعتبر الانحراف المعياري من أهم وأفضل مقاييس التشتت وأكثرها شيوعا واستخداما في التحليل الإحصائي، ونظرا لكون الانحراف المعياري هو الجذر التربيعي لتباين البيانات، لا بد من تعريف التباين Varianceالذي هو متوسط مربع انحرافات القيم عن وسطها الحسابي ويرمز له بالرمز، وفكرة التباين تعتمد على تشتت أو تباعد البيانات عن متوسطها، فالتباين يكون كبيراً إذا كانت البيانات متباعدة عن متوسطها والعكس بالعكس.
مقاييس الالتواء Skewness:
الالتواء (sk) هو درجة عدم التماثل أو الانحراف عن التماثل، فإذا كان منحنى توزيع الشكل العام للبيانات له طرف على يمين مركز التوزيع أطول من الطرف الأيسر، فان التوزيع يسمى ملتوي لليمين أو أن له التواء موجب، وإذا حدث العكس يقال إن التوزيع ملتوي لليسار أو أنه سالب الالتواء.
مقاييس التفرطح Kurtosis:
هو مقياس يقيس درجة علو أو انخفاض أي منحنى توزيع تكراري بالنسبة للمنحنى الطبيعي للبيانات، وهو منحنى متماثل حول الرأس يمر بالمتوسط، فإذا كان للتوزيع قمة مرتفعة (أكبر من التوزيع الاعتدالي) يقال أنه مدبب (Leptokurtic) وإذا كان التوزيع ذو قمة مسطحة يقال أنه مفلطح (Platykurtic)، وإذا كانت قمة التوزيع متوسطة (ليست مدببة وليست مفلطحة) يسمى متوسط التفلطح (Mesokurtic) وصفة التفلطح ليس لها عاقة بالمتوسط الحسابي للتوزيع فقد يكون هناك أكثر من توزيع لهم نفس المتوسط الحسابي ولكن يختلف شكل المنحنى من مدبب أو مسطح.