صلاحية الاختبار: 6 أنواع

الأنواع الستة التالية من الصلاحية شائعة الاستخدام بمعنى ، صحة الوجه ، صلاحية المحتوى ، الصلاحية التنبؤية ، الصلاحية المتزامنة والبناءية والعوامل. من بين هذه ، المحتوى ، التنبؤية ، المتزامن ، وصحة البناء هي العوامل الهامة المستخدمة في مجال علم النفس والتعليم.

وتناقش هذه أدناه:

اكتب # 1. صحة الوجه:

صحة الوجه إلى الحد الذي يظهر فيه الاختبار لقياس ما سيتم قياسه.

تشير صلاحية الوجه إلى ما إذا كان الاختبار يبدو صحيحًا أم لا ، أي من المظهر الخارجي سواء ظهرت العناصر لقياس الجانب المطلوب أم لا. إذا كان الاختبار يقيس ما يرغب مؤلف الاختبار في قياسه ، فنحن نقول أن الاختبار يواجه صلاحية. وبالتالي ، لا تشير صلاحية الوجوه إلى ما يقيس الاختبار ، ولكن ما يبدو أن الاختبار "يقيسه". لا ينبغي أن يبدو محتوى الاختبار غير مناسب أو غير ذي صلة.

على سبيل المثال ، يجب أن يحتوي اختبار لقياس "مهارة إضافة" على عناصر إضافية فقط. عندما يمر المرء بالعناصر ويشعر أن جميع العناصر تظهر لقياس المهارة بالإضافة إلى ذلك ، يمكن القول أن الاختبار مصادق على الوجه.

على الرغم من أنها ليست طريقة فعالة لتقييم صلاحية الاختبار ، وعلى هذا النحو لا يتم استخدامها عادةً ، إلا أنه يمكن استخدامها كخطوة أولى في التحقق من صحة الاختبار. بمجرد التحقق من صحة الاختبار في وجهه ، يمكننا المضي قدما لحساب معامل الصلاحية.

وعلاوة على ذلك ، تساعد هذه الطريقة صانع الاختبار على مراجعة بنود الاختبار لتتناسب مع الغرض. عندما يتم إجراء الاختبار بسرعة أو عندما تكون هناك حاجة ملحة لإجراء اختبار ، ولا يوجد وقت أو مجال لتحديد صلاحية الطرق الأخرى الفعالة ، يمكن تحديد صلاحية الوجه.

هذا النوع من الصلاحية غير مناسب لأنه يعمل على مستوى الوجه ، وبالتالي يمكن استخدامه كحل أخير.

اكتب # 2. صحة المحتوى:

صلاحية المحتوى هي عملية مطابقة لعناصر الاختبار مع الأهداف التعليمية.

صلاحية المحتوى هي أهم معيار لفائدة الاختبار ، خاصة اختبار التحصيل. ويسمى أيضا بصحة عقلانية أو صلاحية منطقية أو صلاحية دراسية أو صلاحية داخلية أو صلاحية متأصلة.

تشير صلاحية المحتوى إلى الدرجة أو المدى الذي يتكون فيه الاختبار من العناصر التي تمثل السلوكيات التي يريد صاحب الاختبار قياسها. ويطلق على المدى الذي تكون فيه عناصر الاختبار تمثيلاً حقيقياً للمحتوى الكامل وأهداف التدريس ، صلاحية محتوى الاختبار.

يتم تقدير صلاحية المحتوى من خلال تقييم مدى ملاءمة عناصر الاختبار. بمعنى أن عناصر الاختبار يجب أن تغطي جميع المحتوى والمناطق السلوكية للسمة المراد قياسها. يعطي فكرة عن موضوع أو تغيير في السلوك.

بهذه الطريقة ، تشير صلاحية المحتوى إلى مدى احتواء الاختبار على عناصر تمثل السلوك الذي سنقوم بقياسه. يجب أن تشتمل عناصر الاختبار على كل سمة ذات صلة بمجال المحتوى بالكامل والأهداف بالنسب الصحيحة.

قبل إنشاء الاختبار ، يقوم صانع الاختبار بإعداد جدول ذي اتجاهين للمحتوى والأهداف ، ويعرف باسم "جدول المواصفات".

لنفترض أن اختبار التحصيل في الرياضيات قد تم إعداده. يجب أن تحتوي على عناصر من الجبر والحساب والهندسة ، وعلم النفس وعلم المثلثات ، وعلاوة على ذلك ، يجب أن تقوم العناصر بقياس الأهداف السلوكية المختلفة مثل المعرفة والفهم والمهارة والتطبيق وما إلى ذلك. لذا فمن الضروري إعطاء الوزن المناسب إلى مجال المحتوى والأهداف المختلفة.

يظهر مثال على "جدول المواصفات" في الرياضيات في الجدول التالي:

يعكس الجدول عينة مهام التعلم التي سيتم قياسها. وكلما اقتربت عناصر الاختبار من العينة المحددة ، زادت إمكانية وجود صلاحية مرضية للمحتوى. لذلك ، من المرغوب فيه أن يتم فحص العناصر الموجودة في الاختبار بواسطة فريق من الخبراء. يجب عليهم التحقق مما إذا كان وضع العناصر المختلفة في خلايا الجدول مناسبًا وما إذا كانت جميع خلايا الجدول تحتوي على عدد كافٍ من العناصر.

يتم الحكم على مدى كفاية الوزن من حيث الوزن المعطى لجدول مختلف حسب الموضوع وفقا لفريق الخبراء الذين صمموا المناهج الدراسية.

فيما يلي بعض النقاط العامة لضمان صحة المحتوى:

1. اختبار يجب أن يخدم المستوى المطلوب من الطلاب ، لا فوق ولا دون معيارهم.

2. يجب أن تكون اللغة تصل مستوى الطلاب.

3. أي شيء غير موجود في المناهج الدراسية يجب ألا يتم تضمينه في بنود الاختبار.

4. يجب إعطاء كل جزء من المنهج الوزن الضروري. يجب اختيار المزيد من العناصر من الأجزاء الأكثر أهمية في المنهج الدراسي.

محددات:

1. الوزن الذي سيتم منحه لأجزاء مختلفة من المحتوى هو موضوعي.

2. من الصعب بناء الاختبار الموضوعي المثالي.

3. صلاحية المحتوى ليست كافية أو كافية لاختبارات الذكاء والإنجاز والموقف وإلى حد ما اختبارات الشخصية.

4. الوزن المحدد على تغيير السلوك المختلفة ليس موضوعيا.

النوع # 3. الصلاحية التنبؤية:

الصدق التنبؤي مدى توقع الاختبار لأداء الطلاب في المستقبل.

اﻟﺻﺣﺔ اﻟﺗﻧﺑؤﯾﺔ ﺗﻌﻧﻲ ﺑﺎﻟﻘدرة اﻟﺗﻧﺑؤﯾﺔ ﻟﻼﺧﺗﺑﺎر. وهو يشير إلى فعالية اختبار في التنبؤ أو التنبؤ بالنتائج المستقبلية في مجال معين. يرغب مستخدم الاختبار في توقع الأداء المستقبلي للفرد. يمكن استخدام درجات الاختبار للتنبؤ بالسلوك أو الأداء المستقبلي ، وبالتالي تسمى كصلاحية تنبؤية.

من أجل إيجاد صلاحية تنبؤية ، يقوم المختبر بربط نتائج الاختبار بالأداء التالي لل testee ، والمعروف تقنيًا باسم "Criterion". المعيار هو قياس مستقل ، خارجي ومباشر للاختبار الذي تم تصميمه للتنبؤ أو القياس. ومن ثم ، تُعرف أيضًا باسم "صحة المعايير المترابطة".

تم تعريف الصلاحية التنبؤية أو التجريبية بواسطة Cureton (1965) كتقدير لمعامل الارتباط بين درجات الاختبار والمعيار الحقيقي.

مثال يمكن أن يوضح المفهوم بشكل أفضل.

مثال:

يتم إنشاء اختبار القبول الطبي وإدارته لاختيار المرشح للقبول في دورات MBBS. استناداً إلى النتائج التي قام بها المرشحون في هذا الاختبار ، فإننا نعترف بالمرشحين.

بعد الانتهاء من الدورة تظهر في الفحص النهائي MBBS. الدرجات النهائية للفحص MBBS هو المعيار. ترتبط درجات اختبار القبول والفحص النهائي (المعيار). علاقة عالية تنطوي على صلاحية تنبؤية عالية.

ويمكن ذكر أمثلة مماثلة مثل اختبارات التوظيف الأخرى أو اختبارات القبول في الزراعة والهندسة والبنوك والسكك الحديدية وما إلى ذلك والتي يجب أن يكون لها صلاحية تنبؤية عالية.

يجب أن تكون الاختبارات المستخدمة للتوظيف والتصنيف وفحص الدخول ذات صلاحية تنبؤية عالية. ويشار أحيانًا إلى هذا النوع من الصلاحية بـ "الصلاحية التجريبية" أو "الصلاحية الإحصائية" لأن تقييمنا هو في المقام الأول تجريبي وإحصائي.

على سبيل الحصر:

إذا حصلنا على مقياس المعيار المناسب الذي يجب أن ترتبط نتائج اختبارنا به ، يمكننا تحديد الصلاحية التنبؤية للاختبار. لكن من الصعب الحصول على معيار جيد. علاوة على ذلك ، قد لا نحصل على معايير قياسية لجميع أنواع الاختبارات النفسية.

النوع # 4. الصلاحية المتزامنة:

صلاحية متزامنة تربط درجات الاختبار بمجموعة أخرى من نقاط المعيار.

تشير الصلاحية المتزامنة إلى المدى الذي تقابله درجات الاختبار مع الأداء القائم بالفعل أو المقبول ، والمعروف باسم المعيار. لمعرفة مدى صلاحية الاختبار الذي تم إنشاؤه حديثًا ، يكون مرتبطًا أو يقارن ببعض المعلومات المتوفرة.

وبالتالي يتم التحقق من صحة الاختبار ضد بعض المعلومات المتاحة في وقت واحد. ترتبط الدرجات التي تم الحصول عليها من اختبار تم إنشاؤه حديثًا بأداء اختبار محدد مسبقًا. لنفترض أننا أعددنا اختبارًا للذكاء.

نحن نديرها لمجموعة من التلاميذ. يُعطى اختبار ستانفورد-بينيه أيضًا لنفس المجموعة. الآن ترتبط درجات الاختبار التي تم إجراؤها على نتائج الاختبار والاختبار التي أجريناها حديثًا والتي أجراها التلاميذ في اختبار ستانفورد-بينت للمخابرات. إذا كان معامل الارتباط مرتفعًا ، فإن اختبارنا في الذكاء يقال إنه يتمتع بصلاحية عالية متزامنة.

المعنى المعنون للمصطلح "المتزامن" هو "موجود" أو "تم تنفيذه في نفس الوقت". وبالتالي ، يُستخدم مصطلح "الصلاحية المتزامنة" للإشارة إلى عملية التحقق من صحة اختبار جديد من خلال ربط علاماته مع بعض مصدر المعلومات الموجود أو المتاح (المعيار) والذي ربما تم الحصول عليه قبل فترة قصيرة من الاختبار الجديد أو بعده بوقت قصير.

للتأكد من الصلاحية المتزامنة لاختبار التحصيل الذي تم إنشاؤه حديثًا ، ترتبط علاماته مع الدرجات التي حصل عليها هؤلاء الطلاب في الاختبار الأخير النهائي أو المطرافي. وبالتالي يتم التحقق من صحة الاختبار ضد بعض المعلومات المتاحة في وقت واحد. للحصول على مقياس المعيار ، نحن غير مطالبين بالانتظار لمدة طويلة.

تختلف الصلاحية التنبؤية عن الصلاحية المتزامنة بمعنى أننا ننتظر في المستقبل أن يحصل المستقبل على مقياس المعيار. ولكن في سهولة الصلاحية المتزامنة ، لا نحتاج إلى الانتظار لثغرات أطول.

يشير مصطلح "المتزامن" هنا إلى الخصائص التالية:

1 - من المفترض أن يغطي الاختباران - الاختبار الذي يتم فحص صلاحيته والاختبار الذي ثبتت صلاحيته - نفس محتوى المحتوى على مستوى معين والهدف نفسه ؛

2. يظل عدد السكان لكل من الاختبارين متماثلاً ويتم إجراء الاختبارين في بيئات مشابهة تقريبًا ؛ و

3. يمكن الحصول على بيانات الأداء في كلا الاختبارين في وقت واحد تقريبًا.

يعرف هذا النوع من الصلاحية أيضًا باسم "الصلاحية الخارجية" أو "الصلاحية الوظيفية". الصلاحية المتزامنة ذات صلة بالاختبارات المستخدمة للتشخيص وليس للتنبؤ بالنجاح المستقبلي.

اكتب # 5. صدق البناء:

Construct الصلاحية هي المدى الذي يمكن أن يقال فيه الاختبار لقياس البناء النظري أو المتغير النفسي.

البناء هو نفسي بشكل رئيسي. عادة ما يشير إلى سمة أو عملية عقلية. إن التحقق من المصادقة هو عملية تحديد المدى الذي يقيس فيه اختبار معين التركيبات النفسية التي ينوي صانع الاختبار قياسها.

ويشير إلى المدى الذي يقيس فيه الاختبار السمات أو الصفات المجردة التي لا يتم تحديدها من الناحية التشغيلية.

يقول Gronlund و Linn ، "يمكن تحديد التحقق من الإنشاء بأنه عملية تحديد مدى إمكانية تفسير أداء الاختبار على أساس بناء نفسي واحد أو أكثر".

يصف إبيل وفريسبي ، "إن عملية التحقق من المصداقية هي عملية جمع الأدلة لدعم الزعم القائل بأن اختبارًا معينًا يقيس البنية النفسية التي قصد صناع الاختبار قياسها".

تُعرف صلاحية المصادقة أيضًا باسم "الصلاحية النفسية" أو "صلاحية الصفة" أو "الصلاحية المنطقية". تعني صلاحية الإنشاء أنه يتم اختبار درجات الاختبار وفقًا للبناء. يدرس البناء أو السمات النفسية التي يقيسها الاختبار.

يعرف المدى الذي يقيس الاختبار سمات الشخصية أو العمليات العقلية كما هو محدد من قبل صانع الاختبار ويعرف باسم صلاحية الاختبار.

في حين بناء الاختبارات على الذكاء ، والموقف ، والكفاءة الرياضية ، والتفكير النقدي ، ومهارات الدراسة ، والقلق ، والمنطق المنطقي ، وفهم القراءة وما إلى ذلك ، علينا أن نذهب لصحة البناء. خذ على سبيل المثال ، "اختبار الصدق".

قبل إنشاء مثل هذه الأنواع من الاختبارات ، يواجه صانع الاختبار الأسئلة التالية:

1. ماذا يجب أن يكون تعريف مصطلح الإخلاص؟

2. ما هي أنواع السلوك المتوقع من شخص صادق؟

3. ما هو نوع السلوك الذي يميز بين الإخلاص والنفاق؟

يحتوي كل بناء على نظرية أساسية يمكن استخدامها في وصف سلوك التلاميذ والتنبؤ به.

يقترح جروندل (1981) الخطوات الثلاث التالية لتحديد صلاحية البناء:

(ط) تحديد التركيبات التي يفترض حسابها لأداء الاختبار.

(2) اشتقاق فرضيات تتعلق بأداء الاختبار من النظرية التي يقوم عليها كل بناء.

(3) التحقق من الفرضيات بوسائل منطقية وتجريبية.

وتجدر الإشارة إلى أن صلاحية البناء هي استنتاجية. يتم استخدامه بشكل أساسي عندما تكون أنواع الصلاحية الأخرى غير كافية للإشارة إلى صلاحية الاختبار. عادة ما تكون صلاحيات الإنشاء مشتملة على مثل تلك العادات الدراسية ، والتقدير ، والصدق ، والاستقرار العاطفي ، والتعاطف الخ.

النوع # 6.

صحة معامل مدى ارتباط عوامل مختلفة مع الاختبار كله.

تتحدد صلاحية العاملية من خلال تقنية إحصائية تُعرف بتحليل العوامل. ويستخدم أساليب تفسير الارتباطات المتداخلة لتحديد العوامل (التي يمكن أن تكون شفهية بالقدرات) التي تشكل الاختبار.

وبعبارة أخرى ، تُستخدم طرق الترابط المتبادل والطرائق الإحصائية الأخرى لتقدير صحة العوامل. يتم احتساب ارتباط الاختبار مع كل عامل لتحديد الوزن الذي ساهم به كل عامل من هذا القبيل إلى الأداء الكلي للاختبار.

هذا يخبرنا عن عوامل التحميل. وتسمى هذه العلاقة من العوامل المختلفة مع الاختبار كله صحة العوامل. اقترح جيلفورد (1950) أن صحة العوامل هو أوضح وصف لما ينبغي أن تعطيه تدابير الاختبار وبكل الوسائل على أنواع أخرى من الصلاحية.