التقنيات المستخدمة في الإحصاء

سنناقش في هذه المقالة بعض تقنيات الإحصائيات. بعض هذه التقنيات هي: 1. مقاييس التيار المركزي 2. التباين 3. الاحتمالية 4. توزيع التردد 5. السلاسل الزمنية.

مقاييس التيار المركزي:

المتوسطات:

أي تدبير إحصائي يعطي فكرة حول موضع النقطة التي تدعى حولها مجموعة ملاحظات أخرى مقياس الاتجاه المركزي. القياس الأكثر استخداماً هو "المتوسط" أو الوسط الحسابي.

الأرباح اليومية لعملين لمدة أسبوع هي كالتالي:

العامل الأول ر 70 ، 50 ، 100 ، 90 ، 50 متوسط ​​الكسب = روبية 76

العامل الثاني 200 روبية و 250 و 50 و 300 و 150 من متوسط ​​الكسب = 190 روبية

وهكذا ، من المثال أعلاه ، يمكننا أن نستنتج أنه في المتوسط ​​يكسب العامل الثاني أكثر من الأول. الهدف من حساب المتوسط ​​- كما يمكن للمرء رؤيته بسهولة - هو استبدال سلسلة الملاحظات بقيمة واحدة ، والتي تؤخذ لتكون ممثلة لجميع الملاحظات. من المثال المذكور أعلاه ، يمكن ملاحظة أن المتوسط ​​الحسابي هو قيمة قريبة من الوسط وأن بعض الملاحظات أكبر منها في حين أن بعضها أصغر.

وبالتالي ، يمكن القول أن المتوسط ​​الحسابي للملاحظات على متغير يتم تعريفه على أنه مجموع الملاحظات مقسومًا على عدد المشاهدات.

بالنسبة للعامل الأول ، تم حساب المتوسط ​​الحسابي كما يلي:

(Rs 70 + 50 + 100 + 90 + 50) ÷ 5 = Rs 76

يُعرّف المتوسط ​​الهندسي (GM) متوسط ​​مجموعة من الملاحظات بأنه الجذر nth لمنتج جميع الملاحظات. لنفترض أن الملاحظات هي x 1 و x 2 و x 3 و ... و x n .

يمكن حساب GM على النحو التالي:

يمكن حساب ذلك بمساعدة جدول سجل.

الوضع:

يُعرّف الوضع بأنه قيمة المتغيرات أو الملاحظات التي تحدث بشكل متكرر. على سبيل المثال ، إذا كانت الملاحظات هي 2 و 9 و 6 و 2 و 8 و 2 و 2 و 7 و 2 و 3 ، عندئذٍ يُرى أن الوضع هو 2 ، والذي حدث للحد الأقصى لعدد المرات ، أي 5 مرات.

الوسيط:

الوسيط هو قيمة المتغير الأوسط الأكثر ، عندما يتم ترتيب الملاحظات في ترتيب تصاعدي أو تنازلي. من الواضح أن نصف القيم ستكون أقل من المتوسط ​​وسيصبح نصف القيم أكبر. وبالتالي ، إذا كانت الملاحظات هي 3 و 9 و 6 و 4 و 5 و 7 و 10 ، عند ترتيب القيم بترتيب تصاعدي 3 و 4 و 5 و 6 و 7 و 9 و 10 ، فإن القيمة المتوسطة هي الملاحظة الرابعة ويساوي 6.

ومع ذلك ، إذا كان عدد المشاهدات متساويًا ، فهناك قيمتان متوسطتان ومن المعتاد أخذ المتوسط ​​الحسابي لهذين القيمتين. على سبيل المثال ، إذا تم حذف الملاحظة 10 من المتغيرات المذكورة أعلاه ، فهناك قيمتان متوسطتان 5 و 6 ، وقيمة الوسيط هي 5 + 6 ÷ 2 = 5.5.

تتضمن الأدوات الإحصائية الهامة الأخرى لقياس وتحليل البيانات وعناصر التباين فيها حساب (i) المدى ، (ii) المدى شبه المشترك بين الربعين ، (iii) متوسط ​​الانحراف المطلق ، (4) الانحراف المعياري ، (v) ) توزيع التردد (سواء متناظرة وغير متناظرة).

يتميز التوزيع المتماثل بوجود خط التماثل الذي يقسم الرسم البياني إلى جزأين وجزء واحد هو صورة طبق الأصل للآخر. ومع ذلك ، فإن معظم التوزيعات في التجارة والاقتصاد ليست من هذا النوع. تُعرف التوزيعات غير المتناظرة أيضًا بالتوزيعات المنحرفة. يعني الانحراف عدم التماثل وتتميز التوزيعات المنحرفة بذيل أطول على جانب واحد من الرسم البياني.

قياس التقلب:

تُستخدم الوسائل الحسابية والهندسية أو الوسيط كأساس لمقارنة مجموعتين أو مشاهدات أو أكثر. لكن المقاييس الأخرى للتنوع أو الانحراف مهمة أيضا في التعبير عن مدى اختلاف الملاحظات عن بعضها البعض. في الإحصائيات ، فإن التشتت مرادف للتغير أو الانحراف.

فيما يلي المقاييس الهامة للتنوع:

نطاق:

يُعرف الفرق بين أكبر القيم وأقلها في مجموعة من الملاحظات باسم "النطاق".

نصف ربيع شبه المشترك :

ويطلق على الفرق بين قيمة الملاحظات في الربعين الثاني والثالث النطاق شبه المشترك بين الربعين. هذا يزيل تأثير القيم منخفضة جدا وعالية جدا من الملاحظات ، والتي هي قليلة العدد.

يعني الانحراف المطلق:

يعني الانحراف المطلق تباين الملاحظات من المتوسط ​​الحسابي للملاحظات.

مثال: ملاحظات x 1 ، x 2 … x n والوسط الحسابي x.

الصيغة هي:

وبالتالي ، فإن المتوسط ​​هو

لكن ∑ (x 1 - x̅) = 0 ، مهما كانت قيمة x 1 ، x 2 ، ... xx n

وبالتالي ، لا يمكن استخدام الصيغة ∑ (x i - x̅) كمقياس للتغير. يمكن تجنب هذه الصعوبة إذا تم تجاهل العلامات (+ أو -). وهذا أمر منطقي ، لأن علامة الانحراف المعين x i - x̅ تشير فقط إلى ما إذا كانت الملاحظة x i ، هي إلى يسار x أو إلى يمينها وهذا ليس له صلة بحساب الانحرافات ، من النقطة المركزية (x) من أي ملاحظة.

الانحراف المعياري:

قد يكون انحراف الملاحظات من الوسط الحسابي (x̅) موجبًا (+) أو سلبي (-). في الإحصائيات ، تشير علامات الانحرافات من الحساب إلى اتجاه الملاحظة فقط من الميل المركزي (x̅) وبالتالي يتم تجاهلها. يمكن أيضًا تجنب العلامات السلبية (-) بين الانحراف من x إذا بدلًا من أخذ القيم المطلقة ، يتم أخذ مربعات الانحرافات كما يلي:

بما أن قياس التباين يجب أن يكون في نفس الوحدة مثل الملاحظات الأصلية ، يتم حساب الانحراف المعياري بالمعادلة التالية:

لتوزيع التردد ، مع x 1 x 2 ، ... ، x n كقيم منتصف الطبقات و f 1 f 2 ،… ، f n باعتبارها الترددات ، يتم حساب الانحراف المعياري (SD) من خلال التحسين التالي لل الصيغة المذكورة أعلاه:

إن الانحراف المعياري هو إلى حد بعيد المقياس الأكثر استخدامًا للتنوع في الإحصاء. لديها العديد من الخصائص التي تجعلها المقياس الأكثر تفضيلا في المشاكل الإحصائية.

مثال:

مستويات الذكاء لدى خمسة من طلاب إدارة الأعمال هي كما يلي:

لذلك ، يكون الانحراف المعياري هو: 13.22

13.22 هو الانحراف المعياري المعبر عنه في نفس الوحدات مثل الملاحظات نفسها. القيمة 13.22 هي نقطة على نفس المقياس الرقمي.

تم عمل الانحراف المعياري أعلاه من التباينات في عدد سكان من 5 طلاب. ومع ذلك ، من الناحية العملية ، لا يمكن في كثير من الأحيان حساب الانحراف المعياري من السكان ، لأن معظم الوقت يكون عدد السكان كبيرًا بحيث يتم أخذ العينة عادة لغرض حساب الانحراف.

بالنسبة لبيانات العينة ، يتم قياس التباين باختلاف العينة ويحسب الانحراف المعياري باستخدام الصيغة التالية:

وتجدر الإشارة إلى أنه ، منذ استخدام بيانات العينة ، تشير 'n' إلى حجم العينة بدلاً من 'N' مما يدل على مراعاة السكان.

مفهوم الاحتمال:

في كثير من الأحيان ، في حياتنا اليومية ، نتوقع أحداثًا مستقبلية معينة بكلمات مثل - قد يحدث هذا على الأرجح ، أو "احتمال أن يكون هذا مرتفعًا جدًا" ، أو "سيحدث هذا في جميع الاحتمالات" ، مع قدر معين من الغموض في مثل هذا صياغات. هذه التصريحات إلى حد كبير ذاتية وتعتمد في معظمها على قدرتنا على تحليل مواقف مماثلة في الماضي. أهمية مفهوم الاحتمال لحدث ما وبعض وسائل قياسه بالأدوات الإحصائية هائلة بالنسبة للبنوك التجارية.

أثناء تقديم قرض لأحد العملاء ، يرغب المصرفي في معرفة احتمال التقصير من جانب العميل المذكور ، والذي يتم قياسه على أساس دراسة الاحتمالات باستخدام الحسابات الإحصائية. على الرغم من صعوبة تحديد الاحتمالية بدقة على المستوى الأولي ، إلا أنه يمكن بذل جهد للتنبؤ بنفس الطريقة باستخدام تقنيات التجربة العشوائية وتعريف التردد.

التجربة العشوائية تعني تجربة معروفة جميع نتائجها المحتملة والتي يمكن تكرارها في ظل ظروف متطابقة ، ولكن من المستحيل التنبؤ الدقيق بالنتيجة. قد يعتبر سعر سلعة ما في أيام مختلفة نتائج لتجربة عشوائية. سيتم ذكر النتائج عادة بواسطة E1 ، E2 ، E 3 … ، E n ويفترض أنها محدودة العدد.

التوزيع بتكرار:

إذا كانت النتيجة E 1 تحدث r مرة عندما يتم تكرار التجربة العشوائية n مرة ، فإن احتمال E 1 يتم تعريفه من خلال نسبة r / n ، حيث أن عدد مرات التكرار يزيد إلى أجل غير مسمى. وبالتالي ، يتم تعريف الاحتمال على أنه حد للتردد النسبي عند تكرار التجربة لعدد لا نهائي من المرات.

السلاسل الزمنية:

وتشكل سلسلة من الملاحظات في نقاط زمنية مختلفة على متغير - يعتمد على الزمن - سلسلة زمنية. وهكذا ، فإن هذه السلسلة من الرصدات تعطي التغييرات أو الاختلافات في الكمية على مدى فترة من الزمن ، وغالبا ما تسمى بيانات تاريخية أو كرونولوجية. بالنسبة لهذا النوع من البيانات ، يكون أحد المتغيرات هو الوقت الذي يمثله الحرف 't' والآخر ، والذي يعتمد على الوقت 'Yt.'

على سبيل المثال ، إنتاج المحاصيل في مواسم مختلفة ، إنتاج الصلب في أشهر مختلفة ، تصدير الشاي كل ثلاثة أشهر ، بيع الآيس كريم في أشهر مختلفة من السنة ، إلخ. تشير جميع الأمثلة المذكورة أعلاه إلى بعض النشاط الاقتصادي أو التجاري ويطلق على سلسلة من الملاحظات حول هذه المتغيرات عادةً بيانات سلاسل زمنية اقتصادية. مثال آخر على بيانات السلاسل الزمنية هو هطول الأمطار بالبوصة في أيام مختلفة من السنة.

وبالتالي ، من الواضح أن أي متغير ، والذي يعتمد على الوقت ، يشكل بيانات السلاسل الزمنية. الاستنتاجات القيمة التي يتم رسمها من قبل الأطراف المعنية مثل مجتمع الأعمال ، والمصرفيين ، والصناعيين ، وما إلى ذلك ، من سلسلة زمنية تؤدي إلى قياس الاتجاه من البيانات ، والتي تؤثر على قراراتهم بشكل كبير.