يتم تحديد الصعوبة المتزايدة للمهام في هذه التقنية. اختبارات في تكنولوجيا تدريس الرياضيات لطلاب المدارس الثانوية. التمييز في مهمة الاختبار

ناقش المقال السابق تسعة مبادئ لتطوير محتوى الاختبارات التربوية. تركز هذه المقالة على المبدأ العاشر: زيادة صعوبة عنصر الاختبار.

إذا تم تعريف الاختبار التربوي لفترة وجيزة على أنه نظام مهام ذات صعوبة متزايدة بشكل موحد، فسيصبح من الواضح أن صعوبة المهام هي المؤشر التكويني الأكثر أهمية للاختبار. يعتقد العديد من قادة المدارس أن معلميهم قادرون على "التوصل إلى" وقت قصيريمكنهم إجراء العديد من "الاختبارات" كما يريدون. في الواقع، يمكنك التوصل إلى الكثير من المهام في نموذج الاختبار. وليست اختبارات إطلاقا، بل واجبات فقط. ولا ينبغي إدراجها في الاختبار الحالي إلا بعد معرفة درجة صعوبتها وخصائصها الأخرى. يتم اختبار مقياس الصعوبة تجريبيا.ومن هذا المطلب يتضح أن الاختبار التجريبي الأولي لكل مهمة أمر إلزامي قبل بدء الاختبار. أثناء عملية التحقق، لا تفي العديد من المهام بالمتطلبات الخاصة بها، وبالتالي لا يتم تضمينها في الاختبار. الشرط الأول لمهام الاختبار: في الاختبار، يجب أن تختلف المهام في مستوى الصعوبة، والذي يتبع من التعريف السابق للاختبار والمبدأ قيد النظر.

ربما يكون القارئ اليقظ قد اكتشف بالفعل الاختلافات في مفردات المفاهيم الأساسية الثلاثة المقدمة هنا، كما لو كان "بشكل غير محسوس": مفهوم الاختبار التربوي، والمهمة في شكل اختبار، ومهمة الاختبار. لقد تمت بالفعل مناقشة متطلبات الأول منهم في مقال "تعريف الاختبار التربوي" (USh No. 30، August 1999).

ومن الأفضل الآن تقديم متطلبات المفهوم الثاني، على الأقل بإدراجها بإيجاز، حتى لا يتم تشتيت الانتباه عن الموضوع الرئيسي للمقال. تنطبق المتطلبات التالية على المهام في نموذج الاختبار:

الإيجاز.

قابلية التصنيع

صحة النموذج

صحة المحتوى

الشكل المنطقي للبيان؛

نفس القواعد لتقييم الإجابات.

وجود مكان محدد للإجابات؛

تعليمات متطابقة لجميع المواد.

الموقع الصحيح لعناصر المهمة؛

أفانيسوف ضد. أساسيات النظرية التربوية للقياسات // القياسات التربوية، 1، 2004. ص 17.

وسيأتي تفسير تفصيلي لهذه المتطلبات في المقالات التالية، ولكن الآن أود أن ألفت انتباه القارئ إلى أنه لا يوجد شرط لصعوبة المهمة المعروفة، في حين أن مثل هذا الشرط مفروض على الاختبار والتجربة. مهمة الاختبار. ومن خلال التفكير في هذه المادة والمواد المنشورة سابقًا، يمكن استخلاص استنتاجين. الأول هو أن الاختبار لا مكان فيه للمهام ذات درجة غير معروفة من الصعوبة. والثاني هو أنه ليس كل المهام المقترحة في نموذج الاختبار يمكن أن تصبح مهام اختبار: فهذه مفاهيم مختلفة. في المفهوم الأول، المتطلبات الأكثر أهمية هي المحتوى والشكل. بالنسبة لمهام الاختبار، أولاً وقبل كل شيء، هناك متطلبات معروفة الصعوبة، وهو أمر من الواضح أنه غير مطلوب للمهام في نموذج الاختبار. يمكن تكرار أن المهام لا تحظى بفرصة أن تصبح اختبارات إلا بعد إجراء اختبار تجريبي لقياس مدى صعوبتها على مجموعات نموذجية من الموضوعات.

مؤشر صعوبة الاختبار و مهام الاختبارذات مغزى ورسمية في نفس الوقت. ذات مغزى لأن اختبار جيديمكن أن تعتمد الصعوبة فقط على صعوبة محتوى المهام وعلى مستوى استعداد الموضوعات نفسها. بينما في الاختبار السيئ، تبدأ النتائج في التأثر بشكل ملحوظ بشكل المهام (خاصة إذا لم تكن مناسبة للمحتوى)، وسوء تنظيم الاختبار، وإذا كانت هناك فرص للغش وتسرب المعلومات. وفي هذا الصدد، فإن الممارسة الضارة المتمثلة في الإعداد المستهدف للطلاب لامتحان الدولة الموحدة تستحق الذكر بشكل خاص. أطلق وزير التعليم الروسي في عام 1907، تولستوي، على المعلمين الذين شاركوا في هذا النوع من العمل اسم "المدربين". لكن المعلمين هم الأقل مسؤولية. يقع اللوم على نظام "البيض" الخاطئ الذي يشجع مثل هذه الممارسات الخاطئة. كما هو التحكم، كذلك التعليم.

ينشأ المكون الرسمي لمؤشر الصعوبة عندما يعتبر الاختبار بمثابة عملية مواجهة بين الموضوع والمهمة المعروضة عليه. ومن المفيد اعتبار النتيجة الناتجة نتيجة لمثل هذه المواجهة. في تفسير مبسط لكل حالة من حالات عرض المهمة، غالبًا ما يتم أخذ نتيجتين في الاعتبار، ولكن ليس بالضرورة: انتصار الموضوع في القرار الصائبالمهام حيث يحصل على نقطة واحدة، أو الفشل الذي يحصل عليه صفر نقاط. يعتمد تقييم نتيجة المواجهة على نسبة المستوى المعرفي للمتقدم إلى مستوى صعوبة المهمة، وعلى وحدة قياس المعرفة المختارة وعلى القاعدة المعتمدة مسبقًا (الاتفاقية) - ماذا يعتبر "انتصارا" للمتقدم للاختبار، وما إذا كان التعادل مقبولا، إذا تحدثنا بلغة الرياضة.

يستخدم مبدأ الصعوبة المتزايدة عند عرض محتوى العديد من الكتب المدرسية والأدلة، وخاصة في تلك التخصصات الأكاديمية التي بنيت على مبدأ تراكمي، وهو ما يعني: أن معرفة العناصر اللاحقة للمقرر تعتمد صراحة على معرفة العناصر التعليمية السابقة. هذا الهيكل متأصل في الكتب المدرسية في الرياضيات والمنطق لغات اجنبيةوالإحصاء والتقنية والعديد من العلوم الأخرى. فيها، يتم استخدام المفاهيم التي تمت دراستها مسبقًا بنشاط في الموضوعات اللاحقة. لذلك لا تحتاج إلى دراسة مثل هذه التخصصات إلا من البداية وبدون ثغرات.

معظم المؤلفين، وخاصة الأجانب منهم، لا يميزون بين مفهومي "الصعوبة" و"التعقيد". العديد من مطوري الاختبار متماثلون. ومع ذلك، هناك أعمال يتم فيها تعريف هذه المفاهيم بشكل مختلف. على سبيل المثال، لاحظ A. N. Zakharov و A. M. Matyushkin أن درجة صعوبة مهمة التعلم لا تتزامن مع تعقيدها. درجة الصعوبة المواد التعليميةيتميز بالكثافة الحقيقية (الموضوعية) للمهمة التعليمية وشكل تقديمها، ودرجة الصعوبة تفترض دائما وجود علاقة بين المادة التعليمية المراد إتقانها والمادة التعليمية المكتسبة سابقا والقدرات الفكرية للطلاب (1) .

إل. إن. أوضحت لاندا الصعوبة مهمة تعليميةلأن الطلاب في كثير من الأحيان لا يعرفون العمليات التي يجب إجراؤها لإيجاد الحل. إذا كان نظام العمليات لحل فئة معينة من المشكلات يسمى طريقة الحل، فإن الصعوبة، في رأيه، ترتبط بجهل الطريقة، مع الجهل بكيفية التفكير في عملية الحل، وكيف وبأي تسلسل وينبغي للمرء أن يتصرف بشروط المشكلة (٢). يتم تفسير الصعوبات التي تنشأ من خلال حقيقة أن المعلم غالبًا ما يحاول تقديم المعرفة حول محتوى ما تتم دراسته ولا يهتم كثيرًا بكيفية التفكير والعقل (المرجع نفسه). ويتقاطع هذا التفسير مع فكرة أن تعقيد المهمة يرتبط بعدد العمليات التي يجب إتمامها لتحقيق النجاح. هذه التعريفات للصعوبة والتعقيد هي تعريفات نفسية إلى حد كبير؛ فهي مفيدة ل التحليل النفسيمحتوى مهام الاختبار.

المقياس التقليدي لصعوبة كل مهمة سنوات طويلةكانت نسبة الإجابات الصحيحة في مجموعة المواضيع، الموضحة بالرمز p j، حيث يشير المؤشر j إلى عدد المهمة محل الاهتمام (1، 2، إلخ). على سبيل المثال، إذا تم تقييم الإجابات الصحيحة للمواضيع في المهمة الثالثة للاختبار بنقطة واحدة، والإجابات غير الصحيحة - بصفر، فيمكن العثور على قيمة مؤشر p 3 من العلاقة الأولية:

ف 3 = ص 3 /ن،

حيث R 3 يعني عدد الإجابات الصحيحة لمهمة معينة، وN هو الرقم الإجماليالمواضيع في المجموعة. صيغة عامةحساب نسبة الإجابات الصحيحة لأي مهمة (ي) لها النموذج

ص ي = ر ي / ن

المؤشر ص ي . منذ فترة طويلة تستخدم كمقياس للصعوبة في ما يسمى النظرية الكلاسيكيةالاختبارات (3). في وقت لاحق، تم إدراك عدم الدقة الدلالية الموجودة فيه: بعد كل شيء، فإن الزيادة في قيمة P J لا تشير إلى زيادة في الصعوبة، ولكن على العكس من ذلك، زيادة في السهولة، إذا كان من الممكن استخدام مثل هذه الكلمة. لذلك في السنوات الاخيرةبدأت الإحصائيات المعاكسة مرتبطة بمؤشر صعوبة المهمة - نسبة الإجابات غير الصحيحة (q j). يتم حساب هذه النسبة من نسبة عدد الإجابات غير الصحيحة (Wj- من الكلمة الإنجليزية خطأ - غير صحيح) إلى عدد المواضيع (N):

ف ي = ث ي / ن

ومن المفترض بطبيعة الحال أن p j + q j = 1. في نظرية الاختبار الكلاسيكية، لسنوات عديدة تم النظر فقط في المؤشرات التجريبية للصعوبة. في الإصدارات الجديدة من النظريات النفسية والتربوية للاختبارات، تم إيلاء المزيد من الاهتمام لطبيعة النشاط العقلي للطلاب في عملية أداء مهام الاختبار أشكال مختلفة (4).

لا يمكن أن يكون محتوى الاختبار سهلاً أو متوسطًا أو صعبًا فقط. هنا تتجلى بالكامل الفكرة المعروفة حول اعتماد نتائج الطريقة المستخدمة. عناصر الاختبار السهلة تمنح الطلاب مظهر المعرفة فقط لأنها تختبر الحد الأدنى من المعرفة. وفي هذا الصدد، يمكن الإشارة إلى أن تركيز هيئة إدارة التعليم الاتحادية على اختبار الحد الأدنى من المعرفة لا ولا يمكن، حتى بحكم التعريف، إعطاء فكرة عن المستوى الحقيقي للمعرفة، أي. توفير المعلومات التي يحتاجها المجتمع والسلطات الحكومية منذ فترة طويلة. إنه يشوه نتائج الاختبار واختيار المهام الصعبة بشكل واضح، ونتيجة لذلك ينتهي الأمر بأغلبية تلاميذ المدارس بالحصول على درجات منخفضة. غالبًا ما يُنظر إلى التركيز على المهام الصعبة كوسيلة لزيادة الدافع للتعلم. ومع ذلك، فإن هذا العلاج له آثار مختلطة. الواجبات الصعبة قد تدفع البعض إلى الدراسة، بينما قد تدفعهم أخرى بعيداً عنها. مثل هذا التوجه يشوه النتائج ويقلل في النهاية من جودة القياس التربوي. إذا تم بناء الاختبار بشكل صارم من المهام المتزايدة الصعوبة، فهذا يفتح الطريق لإنشاء أحد مقاييس القياس الأكثر إثارة للاهتمام - مقياس L. Gutman.

عند تحديد الاختبار، تمت الإشارة بالفعل إلى أن جميع مهام الاختبار، أود التأكيد عليها، بغض النظر عن محتوى المواضيع والأقسام و التخصصات الأكاديمية، مرتبة حسب الصعوبة المتزايدة. إن التوصية واسعة النطاق، حتى وقت قريب، بإدراج المزيد من المهام ذات الصعوبة المتوسطة في الاختبار لها ما يبررها من وجهة نظر تحديد موثوقية القياس باستخدام ما يسمى بالصيغ. نظرية الاختبار الكلاسيكية. تؤدي طرق تقييم موثوقية الاختبار الموجودة في هذه النظرية إلى انخفاض الموثوقية عندما يتم تضمين المهام السهلة والصعبة في الاختبار. في الوقت نفسه، يؤدي الانجراف في المهام ذات الصعوبة المعتدلة فقط إلى تشوه خطير في محتوى الاختبار: يفقد الأخير القدرة على عكس محتوى التخصص الذي تتم دراسته بشكل طبيعي، حيث يكون هناك دائمًا سهل وصعب مادة. وهكذا، في السعي لتحقيق موثوقية مجردة عالية من الناحية النظرية، يتم فقدان الصلاحية الموضوعية لنتائج الاختبار. غالبًا ما تكون الرغبة في زيادة صلاحية نتائج الاختبار مصحوبة بانخفاض في دقتها. تُعرف هذه الظاهرة نظريًا باسم مفارقة عالم القياس النفسي الأمريكي ف. لورد

إذا تم اختبار مجموعة ضعيفة من الطلاب، فقد اتضح أن عناصر الاختبار الصعبة ببساطة لا تعمل لأنه لا يمكن لأي طالب الإجابة عليها بشكل صحيح. تتم إزالة هذه المهام من معالجة البيانات الإضافية. لا يتم تقديمها في أنظمة التحكم التكيفية. سيختلف محتوى الاختبار للطلاب الضعفاء بشكل ملحوظ عن محتوى الاختبار للطلاب الأقوياء. بالنسبة للأخير، على العكس من ذلك، فإن المهام السهلة لا تعمل، لأن جميع الأشخاص ذوي المعرفة يجيبون على المهام السهلة بشكل صحيح. وبالتالي، فإن محتوى الاختبار التقليدي يختلف بشكل كبير اعتمادًا على مستوى استعداد تلك المجموعات من الطلاب الذين يهدف الاختبار إلى قياس معرفتهم.

يتطلب التعيين الأمثل لمحتوى المادة التعليمية في مهام الاختبار بمستوى الصعوبة المطلوب إمكانية اختيار النموذج المناسب. يتم التعبير عن محتوى الاختبار في أحد الأشكال الأربعة الرئيسية للمهام. هذه هي: 1) المهام مع اختيار واحد أو أكثر من الإجابات الصحيحة من بين تلك المقترحة؛ 2) المهام شكل مفتوححيث يكمل المشارك الإجابة بنفسه، في المساحة المخصصة لذلك؛ 3) مهام إثبات الامتثال، و4) مهام تحديد التسلسل الصحيح للإجراءات.

الأدب

1. زاخاروف أ.، ماتيوشكين أ.م. مشاكل أنظمة التكيفالتدريب // علم التحكم الآلي ومشكلات التدريب. - م: التقدم، 1970.- 389 ص.

2. لاندا إل.ن. الخوارزمية في التدريب. م، التنوير، 1966

3. جوليكسن ه. نظرية الاختبارات العقلية. ن - ي. وايلي. 1950 - 486 ص. و أكثر من ذلك بكثير إلخ.

4. تاتسوكا، ك.ك. بناء العناصر والنماذج السيكومترية المناسبة للاستجابة المبنية. برينستون، نيوجيرسي، 1993. - 56 ص؛ فريدريكسن، ن.، ميسليفي آر جيه، بيجار آي جيه (محرران). نظرية الاختبار لجيل جديد من الاختبارات. لورانس إرلبوم الحمار. نشر. 1993، هيلزديل، نيوجيرسي، 404 صفحة.وإلخ .

ناقش المقال السابق تسعة مبادئ لتطوير محتوى الاختبارات التربوية. اليوم نواصل النظر في المبدأ العاشر - الصعوبة المتزايدة لمهام الاختبار.

إذا تم تعريف الاختبار التربوي لفترة وجيزة على أنه نظام مهام ذات صعوبة متزايدة، فسيصبح من الواضح أن صعوبة المهام هي المؤشر الأكثر أهمية، على سبيل المثال، لتشكيل الاختبار. يعتقد العديد من قادة المدارس أن معلميهم قادرون على "التوصل" إلى العديد من "الاختبارات" التي يريدونها في وقت قصير؛ لقد قرأت بنفسي الأمر الخاص بالمدرسة، حيث أُمر المعلمون بتقديم "اختبارات" لمدير المدرسة في غضون ثلاثة أيام. في الواقع، يمكنك التوصل إلى أي عدد تريده من المهام في نموذج الاختبار (وهذه ليست اختبارات بعد). ولا ينبغي تضمينها في الاختبار الحالي حتى يتم معرفة مقياس الصعوبة الذي يمكن اختباره تجريبيا. ومن هذا المطلب يتضح أن الاختبار التجريبي الأولي لكل مهمة أمر إلزامي قبل بدء الاختبار. أثناء عملية الاختبار، لا تفي العديد من المهام (عادةً أكثر من النصف) بالمتطلبات الخاصة بها، وبالتالي لا يتم تضمينها في الاختبار. الشرط الأول لمهام الاختبار: في الاختبار، يجب أن تختلف المهام في مستوى الصعوبة، والذي يتبع من التعريف السابق للاختبار والمبدأ قيد النظر.

ربما يكون القارئ اليقظ قد لاحظ بالفعل الاختلافات في مفردات المفاهيم الأساسية الثلاثة لنظرية الاختبار، كما لو تم تقديمها هنا "بشكل غير محسوس": الاختبار التربوي، والمهمة في شكل اختبار، ومهمة الاختبار. لقد تمت بالفعل مناقشة متطلبات الأول منهم في مقال "تعريف الاختبار التربوي" (USh No. 30، August 1999).

ومن الأفضل الآن تقديم متطلبات المفهوم الثاني، على الأقل بإدراجها بإيجاز، حتى لا يتم تشتيت الانتباه عن الموضوع الرئيسي للمقال. تنطبق المتطلبات التالية على المهام في نموذج الاختبار:

  • صحة المحتوى
  • الشكل المنطقي للبيان؛
  • الشكل الصحيح؛
  • الإيجاز؛
  • وجود مكان محدد للإجابات؛
  • الموقع الصحيح لعناصر المهمة؛
  • نفس القواعد لتقييم الإجابات؛
  • تعليمات متطابقة لجميع المواد؛
  • مدى كفاية التعليمات لشكل ومحتوى المهمة.

وسيأتي تفسير تفصيلي لهذه المتطلبات في المقالات التالية، ولكن الآن أود أن ألفت انتباه القارئ إلى أنه لا يوجد شرط لصعوبة المهمة المعروفة، في حين أن مثل هذا الشرط مفروض على الاختبار والتجربة. مهمة الاختبار. ومن خلال التفكير في هذه المادة والمواد المنشورة سابقًا، يمكن استخلاص استنتاجين. الأول هو أن الاختبار لا مكان فيه للمهام ذات درجة غير معروفة من الصعوبة. والثاني هو أنه ليس كل المهام المقترحة في نموذج الاختبار يمكن أن تصبح مهام اختبار: فهذه مفاهيم مختلفة. في المفهوم الأول، المتطلبات الأكثر أهمية هي المحتوى والشكل. بالنسبة لمهام الاختبار، أولاً وقبل كل شيء، هناك متطلبات معروفة الصعوبة، وهو أمر من الواضح أنه غير مطلوب للمهام في نموذج الاختبار. لا يمكن للمهام أن تصبح اختبارات إلا بعد التحقق التجريبي، أو بالمعنى الدقيق للكلمة، من مقياس صعوبتها، على مجموعات نموذجية من المواضيع.

مؤشر صعوبة الاختبار ومفرداته هو مؤشر هادف وشكلي في نفس الوقت. مؤشر ذو معنى، لأنه في الاختبار الجيد يمكن أن تعتمد الصعوبة فقط على المحتوى وعلى مستوى استعداد المتقدمين للاختبار أنفسهم، بينما في الاختبار السيئ تبدأ النتائج في التأثر بشكل ملحوظ بشكل المهام (خاصة إذا أنها ليست كافية للمحتوى)، وسوء تنظيم الاختبار، إن وجدت إمكانية الغش، وتسرب المعلومات. وفي هذا الصدد، فإنه يستحق إشارة خاصة ممارسة مثيرة للجدلالإعداد المستهدف للاختبار المركزي.

ينشأ المكون الشكلي لمؤشر الصعوبة عندما يعتبر الاختبار بمثابة عملية مواجهة بين كل موضوع اختبار وكل مهمة معروضة عليه. ومن المفيد اعتبار النتيجة الناتجة نتيجة لمثل هذه المواجهة. مع تفسير مبسط لكل حالة من حالات مواجهة الموضوع للمهمة التالية، عادة ما يتم الأخذ في الاعتبار نتيجتين فقط: فوز الموضوع بالحل الصحيح للمهمة، حيث يحصل على نقطة واحدة، أو الهزيمة، حيث يحصل على صفر نقاط. يعتمد تقييم نتيجة المواجهة على نسبة المستوى المعرفي للمتقدم إلى مستوى صعوبة المهمة، وعلى وحدة قياس المعرفة المختارة وعلى القاعدة المعتمدة مسبقًا (الاتفاقية) - ماذا يعتبر "انتصارا" للمتقدم للاختبار وما إذا كان التعادل مقبولا إذا تحدثنا بلغة الرياضة.

يستخدم مبدأ الصعوبة المتزايدة عند عرض محتوى العديد من الكتب المدرسية والأدلة، وخاصة في تلك التخصصات الأكاديمية التي بنيت على مبدأ تراكمي، وهو ما يعني: أن معرفة العناصر اللاحقة للمقرر تعتمد صراحة على معرفة العناصر التعليمية السابقة. هذا الهيكل متأصل في الكتب المدرسية في الرياضيات والمنطق واللغات الأجنبية والإحصاء والعلوم التقنية والعديد من العلوم الأخرى. فيها، يتم استخدام المفاهيم التي تمت دراستها مسبقًا بنشاط في الموضوعات اللاحقة. لذلك لا تحتاج إلى دراسة مثل هذه التخصصات إلا من البداية وبدون ثغرات.

معظم المؤلفين، وخاصة الأجانب منهم، لا يميزون بين مفهومي "الصعوبة" و"التعقيد". العديد من مطوري الاختبار متماثلون. ومع ذلك، هناك أعمال يتم فيها تعريف هذه المفاهيم بشكل مختلف. على سبيل المثال، لاحظ A. N. Zakharov و A. M. Matyushkin أن درجة صعوبة مهمة التعلم لا تتزامن مع تعقيدها. تتميز درجة تعقيد المادة التعليمية بالثراء الحقيقي (الموضوعي) للمهمة التعليمية وشكل تقديمها، كما أن درجة الصعوبة تفترض دائمًا وجود ارتباط بين المادة التعليمية المراد إتقانها والمادة التعليمية المكتسبة مسبقًا و القدرات الفكرية للطلبة (1).

إل. إن. تشرح لاندا صعوبة المهمة التعليمية بأن الطلاب في كثير من الأحيان لا يعرفون العمليات التي يجب إجراؤها لإيجاد الحل. إذا كان نظام العمليات لحل فئة معينة من المشكلات يسمى طريقة الحل، فإن الصعوبة، في رأيه، ترتبط بجهل الطريقة، مع الجهل بكيفية التفكير في عملية الحل، وكيف وبأي تسلسل وينبغي للمرء أن يتصرف بشروط المشكلة (٢). يتم تفسير الصعوبات التي تنشأ من خلال حقيقة أن المعلم غالبًا ما يحاول تقديم المعرفة حول محتوى ما تتم دراسته ولا يهتم كثيرًا بكيفية التفكير والعقل (المرجع نفسه). ويتقاطع هذا التفسير مع فكرة أن تعقيد المهمة يرتبط بعدد العمليات التي يجب إتمامها لتحقيق النجاح. هذه التعريفات للصعوبة والتعقيد هي تعريفات نفسية إلى حد كبير؛ فهي مفيدة في التحليل النفسي لمحتوى مهام الاختبار.

لسنوات عديدة، كان المقياس التقليدي لصعوبة كل مهمة هو نسبة الإجابات الصحيحة في مجموعة من المواضيع، ويمثلها الرمز pj، حيث يشير الحرف j إلى رقم المهمة محل الاهتمام (1، 2، إلخ). ). على سبيل المثال، إذا تم تقييم الإجابات الصحيحة للمواضيع في المهمة الثالثة للاختبار بنقطة واحدة، والإجابات غير الصحيحة - بصفر، فيمكن العثور على قيمة مؤشر p3 من العلاقة الأولية

حيث R3 يعني عدد الإجابات الصحيحة لمهمة معينة، وN هو العدد الإجمالي للمواضيع في المجموعة. الصيغة العامة لحساب نسبة الإجابات الصحيحة لأي مهمة (ي) لها الشكل التالي:

المؤشر بي جي. وقد تم استخدامه منذ فترة طويلة كمقياس للصعوبة في ما يسمى بنظرية الاختبار الكلاسيكية (3). في وقت لاحق، تم إدراك عدم الدقة الدلالية الواردة فيه: بعد كل شيء، فإن الزيادة في قيمة PJ لا تشير إلى زيادة في الصعوبة، ولكن على العكس من ذلك، زيادة في السهولة، إذا كان من الممكن استخدام مثل هذه الكلمة. لذلك، في السنوات الأخيرة، أصبحت الإحصائيات المعاكسة - نسبة الإجابات غير الصحيحة (qj) - مرتبطة بمؤشر صعوبة المهمة. يتم حساب هذه النسبة من نسبة عدد الإجابات غير الصحيحة (Wj- من الكلمة الإنجليزية خطأ - غير صحيح) إلى عدد المواضيع (N):

ومن المفترض بطبيعة الحال أن pj + qj = 1. في نظرية الاختبار الكلاسيكية، لسنوات عديدة تم النظر فقط في المؤشرات التجريبية للصعوبة. في الإصدارات الجديدة من النظريات النفسية والتربوية للاختبارات، تم إيلاء المزيد من الاهتمام لطبيعة النشاط العقلي للطلاب في عملية أداء مهام الاختبار بأشكالها المختلفة (4).

لا يمكن أن يكون محتوى الاختبار سهلاً أو متوسطًا أو صعبًا فقط. هنا تتجلى بالكامل الفكرة المعروفة حول اعتماد نتائج الطريقة المستخدمة. عناصر الاختبار السهلة تمنح الطلاب مظهر المعرفة فقط لأنها تختبر الحد الأدنى من المعرفة. وفي هذا الصدد، يمكن الإشارة إلى أن تركيز هيئة إدارة التعليم الاتحادية على اختبار الحد الأدنى من المعرفة لا ولا يمكن، حتى بحكم التعريف، إعطاء فكرة عن المستوى الحقيقي للمعرفة، أي. توفير المعلومات التي يحتاجها المجتمع والسلطات الحكومية منذ فترة طويلة. إنه يشوه نتائج الاختبار واختيار المهام الصعبة بشكل واضح، ونتيجة لذلك ينتهي الأمر بأغلبية تلاميذ المدارس بالحصول على درجات منخفضة. غالبًا ما يُنظر إلى التركيز على المهام الصعبة كوسيلة لزيادة الدافع للتعلم. ومع ذلك، فإن هذا العلاج له آثار مختلطة. الواجبات الصعبة قد تدفع البعض إلى الدراسة، بينما قد تدفعهم أخرى بعيداً عنها. مثل هذا التوجه يشوه النتائج ويقلل في النهاية من جودة القياس التربوي. إذا تم بناء الاختبار بشكل صارم من المهام المتزايدة الصعوبة، فهذا يفتح الطريق لإنشاء أحد مقاييس القياس الأكثر إثارة للاهتمام - مقياس L. Gutman.

عند تحديد الاختبار، تمت الإشارة بالفعل إلى أن جميع مهام الاختبار، التي أود التأكيد عليها، بغض النظر عن محتوى المواضيع والأقسام والتخصصات الأكاديمية، مرتبة حسب الصعوبة المتزايدة. إن التوصية واسعة النطاق، حتى وقت قريب، بإدراج المزيد من المهام ذات الصعوبة المتوسطة في الاختبار لها ما يبررها من وجهة نظر تحديد موثوقية القياس باستخدام ما يسمى بالصيغ. نظرية الاختبار الكلاسيكية. تؤدي طرق تقييم موثوقية الاختبار الموجودة في هذه النظرية إلى انخفاض الموثوقية عندما يتم تضمين المهام السهلة والصعبة في الاختبار. في الوقت نفسه، يؤدي الانجراف في المهام ذات الصعوبة المعتدلة فقط إلى تشوه خطير في محتوى الاختبار: يفقد الأخير القدرة على عكس محتوى التخصص الذي تتم دراسته بشكل طبيعي، حيث يكون هناك دائمًا سهل وصعب مادة. وبالتالي، في السعي لتحقيق موثوقية عالية من الناحية النظرية، يتم فقدان صلاحية محتوى نتائج الاختبار. غالبًا ما تكون الرغبة في زيادة صلاحية نتائج الاختبار مصحوبة بانخفاض في دقتها.

إذا تم اختبار مجموعة ضعيفة من الطلاب، فقد اتضح أن عناصر الاختبار الصعبة ببساطة لا تعمل لأنه لا يمكن لأي طالب الإجابة عليها بشكل صحيح. تتم إزالة هذه المهام من معالجة البيانات الإضافية. لا يتم تقديمها في أنظمة التحكم التكيفية. سيختلف محتوى الاختبار للطلاب الضعفاء بشكل ملحوظ عن محتوى الاختبار للطلاب الأقوياء. بالنسبة للأخير، على العكس من ذلك، فإن المهام السهلة لا تعمل، لأن جميع الأشخاص ذوي المعرفة يجيبون على المهام السهلة بشكل صحيح. وبالتالي، فإن محتوى الاختبار التقليدي يختلف بشكل كبير اعتمادًا على مستوى استعداد تلك المجموعات من الطلاب الذين يهدف الاختبار إلى قياس معرفتهم.

يتطلب التعيين الأمثل لمحتوى المادة التعليمية في مهام الاختبار بمستوى الصعوبة المطلوب إمكانية اختيار النموذج المناسب. يتم التعبير عن محتوى الاختبار في أحد الأشكال الأربعة الرئيسية للمهام. هذه هي: 1) المهام مع اختيار واحد أو أكثر من الإجابات الصحيحة من بين تلك المقترحة؛ 2) المهام ذات الشكل المفتوح، حيث يكمل الموضوع الإجابة بنفسه، في المكان المخصص لذلك؛ 3) مهام إثبات الامتثال، و4) مهام تحديد التسلسل الصحيح للإجراءات.

خصائص مهام الاختبار

جمع ومعالجة إحصائية لنتائج الاختبار

لسهولة معالجة بيانات الاختبار، يتم إدخال النتائج في جدول خاص - مصفوفة نتائج الاختبار. يتم عرض العمل مع مصفوفة نتائج الاختبار في درس عملي 2 (ص33).

بناءً على نتائج اختبار الاستحسان، يتم تحديد خصائص مهام الاختبار - الصعوبة والتمييز وصحة المهمة.

يتم تحديد صعوبة المهمة في نظرية الاختبار الكلاسيكي من خلال نسبة عدد المتقدمين للاختبار الذين أكملوا مهمة معينة و الرقم الإجماليالمواضيع، أي. صعوبة المهمة – هذه هي النسبة المئوية للطلاب الذين أكملوا المهمة.


يتم حساب صعوبة المهمة باستخدام الصيغة

أين p j هي نسبة الإجابات الصحيحة للمهمة j؛ Y j هو عدد الأشخاص الذين أكملوا المهمة j بشكل صحيح، N هو عدد الأشخاص في المجموعة، j هو رقم المهمة. أو كنسبة مئوية، P j هي صعوبة المهمة j بالنسبة المئوية:.

يحتوي الاختبار، المتوازن جيدًا في الصعوبة، على العديد من العناصر الأكثر صعوبة بقيمة . هناك بعض من أسهلها مع . مهام أخرى حسب القيم صيشغلون موقعًا متوسطًا بين المواقف المتطرفة ويواجهون صعوبة في المقام الأول 60 - 70 % في اختبار مرجعي المعيار و 40-60 % بطريقة موجهة معياريا.

التمييز في مهمة الاختبار

تمييز(القدرة على التمييز، القدرة على التمييز) المهام هي قدرة المهمة على التمييز بين المواضيع حسب مستوى الإنجاز إلى القوي والضعيف. إذا تم تنفيذ المهمة على قدم المساواة من قبل كل من الأشخاص الضعفاء والأقوياء، فيمكننا التحدث عن التمييز المنخفض للمهمة. إذا تم تنفيذ المهمة من قبل مواضيع قوية، والضعفاء يعطون نتيجة سلبية، إذن لدينا درجة عالية من التمييز.

تعد الطبيعة التمييزية العالية لعناصر الاختبار مهمة بالنسبة للاختبارات المعيارية، والغرض الرئيسي منها هو تصنيف الطلاب وفقًا لمستوى إنجازاتهم.

إذا كان مؤشر التمييز أعلى من الصفر ( أكثر من 0.3يعتبر مرضيًا)، بل والأفضل يميل إلى 1، وهذا يشير إلى أن المهمة لها تأثير تمييزي جيد (كحد أقصى).

لتقييم التمييز للمهمة سوف نستخدمها طريقة المجموعة المتطرفة ، الحساب باستخدام الصيغة:

أين يوجد مؤشر التمييز لعنصر اختبار j-th؛ (P 1) ي - النسبة المئوية للطلاب الذين أكملوا المهمة ي بشكل صحيح في مجموعة فرعية مكونة من 27٪ من أفضل الطلاب وفقًا لنتائج الاختبار؛ (P 0) ي - النسبة المئوية للطلاب الذين أكملوا المهمة ي بشكل صحيح في مجموعة فرعية من 27٪ أسوأ الطلاببناء على نتائج الاختبار.

يختلف مؤشر التمييز ضمن [-1؛ 1]. يصل إلى الحد الأقصى لقيمته في حالة قيام جميع الطلاب من المجموعة الفرعية القوية بإكمال هذه المهمة بشكل صحيح، ولا يكمل أحد من المجموعة الفرعية الضعيفة هذه المهمة بشكل صحيح. في هذه الحالة، سيكون للمهمة أقصى تأثير للتمييز. يصل مؤشر التمييز إلى قيمة صفر عندما تكون نسب الطلاب الذين أكملوا المهمة متساوية في كلا المجموعتين الفرعيتين. وبناء على ذلك، لا يوجد أي تأثير تفاضلي على الإطلاق. ستكون القيمة الأقل من 0 في موقف يؤدي فيه الطلاب الضعفاء مهمة الاختبار هذه بنجاح أكبر من الطلاب الأقوياء. وبطبيعة الحال، يجب إزالة المهام التي يكون مؤشر التمييز لها مساوياً أو أقل من الصفر من الاختبار (الجدول 6).



عن طريق حساب القيم الارتباط الثنائي أو النقطة الثنائيةتقييمها أيضا صلاحية المهام الفرديةامتحان. بشكل عام، يمكن اعتبار المهمة صالحة إذا كانت r pbis قريبة من 0,5. يؤدي تقييم صلاحية العنصر إلى تقييم مدى ملاءمة العنصر. إذا كان الهدف هو التمييز بين الطلاب حسب مستوى الاستعداد، فيجب أن تفصل المهام الصالحة بشكل واضح بين الطلاب ذوي الإعداد الجيد والطلاب ذوي الإعداد الضعيف في مجموعة الاختبار. تشير قيم r pbis القريبة من الصفر إلى انخفاض القدرة التفريقية لعناصر الاختبار. جميع المهام مع r pbis<0, подлежат удалению из теста, так как на эти задания верно отвечают слабые ученики, а сильные либо ошибаются либо пропускают это задание.

الجدول 6

وظيفة رقم. ف ي لجميع المواد مجموعة مؤشر ص ديس
ف ي للضعيف ف ي للقوي
21,0 6,5 32,0 0,26
94,0 90,0 97,0 0,065
64,0 42,0 97,0 0,55
59,0 68,0 58,0 -0,097
27,0 16,0 29,0 0,13
70,0 29,0 94,0 0,65
30,0 13,0 42,0 0,29
12,0 9,7 16,0 0,065
33,0 16,0 52,0 0,35
73,0 42,0 90,0 0,48

تحليل جودة المشتتات في المهام المغلقة

أحد أهم المتطلبات للمهام المغلقة هو معقولية المشتتات احتمالية متساوية لاختيار المشتتات في حالة الإجابة غير الصحيحة.يسمى تقييم جودة المشتت تحليل تشتيت الانتباه.

يتضمن تحليل المشتتات حساب نسبة الأشخاص الذين اختاروا كل مشتت. من الناحية المثالية، يجب اختيار كل مشتت بنسبة متساوية من جميع الإجابات غير الصحيحة. ويبين الجدول 7 التوزيع المثالي للأسهم.

الجدول 7

وظيفة رقم. 1 إجابة إجابة 2* 3 إجابة 4 إجابة
ي 0,1 0,7 0,1 0,1

يوضح الجدول 8 أن 70% من الأشخاص أكملوا المهمة بشكل صحيح (اختر الإجابة الثانية). أما الـ 30% المتبقية الذين أعطوا إجابات غير صحيحة اختاروا بشكل موحد الإجابات 1، 3، 4، أي. تم توفير عوامل تشتيت انتباه متساوية في المهمة.


إذا تم تعريف الاختبار التربوي لفترة وجيزة على أنه نظام مهام ذات صعوبة متزايدة بشكل موحد، فسيصبح من الواضح أن صعوبة المهام هي المؤشر التكويني الأكثر أهمية للاختبار. يعتقد العديد من قادة المدارس أن معلميهم قادرون على "التوصل" إلى العديد من "الاختبارات" التي يريدونها في وقت قصير. في الواقع، يمكنك التوصل إلى الكثير من المهام في نموذج الاختبار. وليست اختبارات إطلاقا، بل واجبات فقط. ولا ينبغي إدراجها في الاختبار الحالي إلا بعد معرفة درجة صعوبتها وخصائصها الأخرى. يتم اختبار مقياس الصعوبة تجريبيا. ومن هذا المطلب يتضح أن الاختبار التجريبي الأولي لكل مهمة أمر إلزامي قبل بدء الاختبار. أثناء عملية التحقق، لا تفي العديد من المهام بالمتطلبات الخاصة بها، وبالتالي لا يتم تضمينها في الاختبار. الشرط الأول لمهام الاختبار: في الاختبار، يجب أن تختلف المهام في مستوى الصعوبة، والذي يتبع من التعريف السابق للاختبار والمبدأ قيد النظر.

ربما يكون القارئ اليقظ قد اكتشف بالفعل الاختلافات في مفردات المفاهيم الأساسية الثلاثة المقدمة هنا، كما لو كان "بشكل غير محسوس": مفهوم الاختبار التربوي، والمهمة في شكل اختبار، ومهمة الاختبار. لقد تمت بالفعل مناقشة متطلبات الأول منهم في مقال "تعريف الاختبار التربوي" (USh No. 30، August 1999).

ومن الأفضل الآن تقديم متطلبات المفهوم الثاني، على الأقل بإدراجها بإيجاز، حتى لا يتم تشتيت الانتباه عن الموضوع الرئيسي للمقال. تنطبق المتطلبات التالية على المهام في نموذج الاختبار:

  • الإيجاز؛
  • قابلية التصنيع
  • الشكل الصحيح؛
  • صحة المحتوى
  • الشكل المنطقي للبيان؛
  • نفس القواعد لتقييم الإجابات؛
  • وجود مكان محدد للإجابات؛
  • تعليمات متطابقة لجميع المواد؛
  • الموقع الصحيح لعناصر المهمة؛
  • مدى كفاية التعليمات لشكل ومحتوى المهمة
أفانيسوف ضد. أساسيات النظرية التربوية للقياسات // القياسات التربوية، 1، 2004. ص 17.

وسيأتي تفسير تفصيلي لهذه المتطلبات في المقالات التالية، ولكن الآن أود أن ألفت انتباه القارئ إلى أنه لا يوجد شرط لصعوبة المهمة المعروفة، في حين أن مثل هذا الشرط مفروض على الاختبار والتجربة. مهمة الاختبار. ومن خلال التفكير في هذه المادة والمواد المنشورة سابقًا، يمكن استخلاص استنتاجين. الأول هو أن الاختبار لا مكان فيه للمهام ذات درجة غير معروفة من الصعوبة. والثاني هو أنه ليس كل المهام المقترحة في نموذج الاختبار يمكن أن تصبح مهام اختبار: فهذه مفاهيم مختلفة. في المفهوم الأول، المتطلبات الأكثر أهمية هي المحتوى والشكل. بالنسبة لمهام الاختبار، أولاً وقبل كل شيء، هناك متطلبات معروفة الصعوبة، وهو أمر من الواضح أنه غير مطلوب للمهام في نموذج الاختبار. يمكن تكرار أن المهام لا تحظى بفرصة أن تصبح اختبارات إلا بعد إجراء اختبار تجريبي لقياس مدى صعوبتها على مجموعات نموذجية من الموضوعات.

مؤشر صعوبة الاختبار ومفرداته هو مؤشر هادف وشكلي في نفس الوقت. إنه أمر ذو معنى، لأنه في الاختبار الجيد، يمكن أن تعتمد الصعوبة فقط على صعوبة محتوى المهام وعلى مستوى استعداد المتقدمين للاختبار أنفسهم. بينما في الاختبار السيئ، تبدأ النتائج في التأثر بشكل ملحوظ بشكل المهام (خاصة إذا لم تكن مناسبة للمحتوى)، وسوء تنظيم الاختبار، وإذا كانت هناك فرص للغش وتسرب المعلومات. وفي هذا الصدد، فإن الممارسة الضارة المتمثلة في الإعداد المستهدف للطلاب لامتحان الدولة الموحدة تستحق الذكر بشكل خاص. أطلق وزير التعليم الروسي في عام 1907، تولستوي، على المعلمين الذين شاركوا في هذا النوع من العمل اسم "المدربين". لكن المعلمين هم الأقل مسؤولية. يقع اللوم على نظام "البيض" الخاطئ، الذي يشجع مثل هذه الممارسات الخاطئة. كما هو التحكم، كذلك التعليم.

ينشأ المكون الرسمي لمؤشر الصعوبة عندما يعتبر الاختبار بمثابة عملية مواجهة بين الموضوع والمهمة المعروضة عليه. ومن المفيد اعتبار النتيجة الناتجة نتيجة لمثل هذه المواجهة. من خلال تفسير مبسط لكل حالة من حالات عرض المهمة، يتم في كثير من الأحيان، ولكن ليس بالضرورة، أخذ نتيجتين في الاعتبار: انتصار الموضوع بالحل الصحيح للمهمة، والذي يحصل على نقطة واحدة من أجله، أو الهزيمة، التي يحصل عليها نظرا لصفر نقطة. يعتمد تقييم نتيجة المواجهة على نسبة المستوى المعرفي للمتقدم إلى مستوى صعوبة المهمة، وعلى وحدة قياس المعرفة المختارة وعلى القاعدة المعتمدة مسبقًا (الاتفاقية) - ماذا يعتبر "انتصارا" للمتقدم للاختبار، وما إذا كان التعادل مقبولا، إذا تحدثنا بلغة الرياضة.

يستخدم مبدأ الصعوبة المتزايدة عند عرض محتوى العديد من الكتب المدرسية والأدلة، وخاصة في تلك التخصصات الأكاديمية التي بنيت على مبدأ تراكمي، وهو ما يعني: أن معرفة العناصر اللاحقة للمقرر تعتمد صراحة على معرفة العناصر التعليمية السابقة. هذا الهيكل متأصل في الكتب المدرسية في الرياضيات والمنطق واللغات الأجنبية والإحصاء والعلوم التقنية والعديد من العلوم الأخرى. فيها، يتم استخدام المفاهيم التي تمت دراستها مسبقًا بنشاط في الموضوعات اللاحقة. لذلك لا تحتاج إلى دراسة مثل هذه التخصصات إلا من البداية وبدون ثغرات.

معظم المؤلفين، وخاصة الأجانب منهم، لا يميزون بين مفهومي "الصعوبة" و"التعقيد". العديد من مطوري الاختبار متماثلون. ومع ذلك، هناك أعمال يتم فيها تعريف هذه المفاهيم بشكل مختلف. على سبيل المثال، لاحظ A. N. Zakharov و A. M. Matyushkin أن درجة صعوبة مهمة التعلم لا تتزامن مع تعقيدها. تتميز درجة تعقيد المادة التعليمية بالثراء الحقيقي (الموضوعي) للمهمة التعليمية وشكل تقديمها، كما أن درجة الصعوبة تفترض دائمًا وجود ارتباط بين المادة التعليمية المراد إتقانها والمادة التعليمية المكتسبة مسبقًا و القدرات الفكرية للطلبة (1).

إل. إن. وأوضحت لاندا صعوبة المهمة التعليمية بأن الطلاب في كثير من الأحيان لا يعرفون العمليات التي يجب إجراؤها لإيجاد الحل. إذا كان نظام العمليات لحل فئة معينة من المشكلات يسمى طريقة الحل، فإن الصعوبة، في رأيه، ترتبط بجهل الطريقة، مع الجهل بكيفية التفكير في عملية الحل، وكيف وبأي تسلسل وينبغي للمرء أن يتصرف بشروط المشكلة (٢). يتم تفسير الصعوبات التي تنشأ من خلال حقيقة أن المعلم غالبًا ما يحاول تقديم المعرفة حول محتوى ما تتم دراسته ولا يهتم كثيرًا بكيفية التفكير والعقل (المرجع نفسه). ويتقاطع هذا التفسير مع فكرة أن تعقيد المهمة يرتبط بعدد العمليات التي يجب إتمامها لتحقيق النجاح. هذه التعريفات للصعوبة والتعقيد هي تعريفات نفسية إلى حد كبير؛ فهي مفيدة في التحليل النفسي لمحتوى مهام الاختبار.

لسنوات عديدة، كان المقياس التقليدي لصعوبة كل مهمة هو نسبة الإجابات الصحيحة في مجموعة من المواضيع، ويمثلها الرمز pj، حيث يشير الحرف j إلى رقم المهمة محل الاهتمام (1، 2، إلخ). ). على سبيل المثال، إذا تم تقييم الإجابات الصحيحة للمواضيع في المهمة الثالثة للاختبار بنقطة واحدة، والإجابات غير الصحيحة - بصفر، فيمكن العثور على قيمة مؤشر p3 من العلاقة الأولية:

P3 = R3/N،
حيث R3 يعني عدد الإجابات الصحيحة لمهمة معينة، وN هو العدد الإجمالي للمواضيع في المجموعة. الصيغة العامة لحساب نسبة الإجابات الصحيحة لأي مهمة (ي) لها الشكل التالي:

بيجاجول = ر ج / ن
المؤشر بي جي. وقد تم استخدامه منذ فترة طويلة كمقياس للصعوبة في ما يسمى بنظرية الاختبار الكلاسيكية (3). في وقت لاحق، تم إدراك عدم الدقة الدلالية الواردة فيه: بعد كل شيء، فإن الزيادة في قيمة PJ لا تشير إلى زيادة في الصعوبة، ولكن على العكس من ذلك، زيادة في السهولة، إذا كان من الممكن استخدام مثل هذه الكلمة. لذلك، في السنوات الأخيرة، أصبحت الإحصائيات المعاكسة - نسبة الإجابات غير الصحيحة (qj) - مرتبطة بمؤشر صعوبة المهمة. يتم حساب هذه النسبة من نسبة عدد الإجابات غير الصحيحة (Wj- من الكلمة الإنجليزية خطأ - غير صحيح) إلى عدد المواضيع (N):

ومن المفترض بطبيعة الحال أن pj + qj = 1. في نظرية الاختبار الكلاسيكية، لسنوات عديدة تم النظر فقط في المؤشرات التجريبية للصعوبة. في الإصدارات الجديدة من النظريات النفسية والتربوية للاختبارات، تم إيلاء المزيد من الاهتمام لطبيعة النشاط العقلي للطلاب في عملية أداء مهام الاختبار بأشكالها المختلفة (4).

لا يمكن أن يكون محتوى الاختبار سهلاً أو متوسطًا أو صعبًا فقط. هنا تتجلى بالكامل الفكرة المعروفة حول اعتماد نتائج الطريقة المستخدمة. عناصر الاختبار السهلة تمنح الطلاب مظهر المعرفة فقط لأنها تختبر الحد الأدنى من المعرفة. وفي هذا الصدد، يمكن الإشارة إلى أن تركيز هيئة إدارة التعليم الاتحادية على اختبار الحد الأدنى من المعرفة لا ولا يمكن، حتى بحكم التعريف، إعطاء فكرة عن المستوى الحقيقي للمعرفة، أي. توفير المعلومات التي يحتاجها المجتمع والسلطات الحكومية منذ فترة طويلة. إنه يشوه نتائج الاختبار واختيار المهام الصعبة بشكل واضح، ونتيجة لذلك ينتهي الأمر بأغلبية تلاميذ المدارس بالحصول على درجات منخفضة. غالبًا ما يُنظر إلى التركيز على المهام الصعبة كوسيلة لزيادة الدافع للتعلم. ومع ذلك، فإن هذا العلاج له آثار مختلطة. الواجبات الصعبة قد تدفع البعض إلى الدراسة، بينما قد تدفعهم أخرى بعيداً عنها. مثل هذا التوجه يشوه النتائج ويقلل في النهاية من جودة القياس التربوي. إذا تم بناء الاختبار بشكل صارم من المهام المتزايدة الصعوبة، فهذا يفتح الطريق لإنشاء أحد مقاييس القياس الأكثر إثارة للاهتمام - مقياس L. Gutman.

عند تحديد الاختبار، تمت الإشارة بالفعل إلى أن جميع مهام الاختبار، التي أود التأكيد عليها، بغض النظر عن محتوى المواضيع والأقسام والتخصصات الأكاديمية، مرتبة حسب الصعوبة المتزايدة. إن التوصية واسعة النطاق، حتى وقت قريب، بإدراج المزيد من المهام ذات الصعوبة المتوسطة في الاختبار لها ما يبررها من وجهة نظر تحديد موثوقية القياس باستخدام ما يسمى بالصيغ. نظرية الاختبار الكلاسيكية. تؤدي طرق تقييم موثوقية الاختبار الموجودة في هذه النظرية إلى انخفاض الموثوقية عندما يتم تضمين المهام السهلة والصعبة في الاختبار. في الوقت نفسه، يؤدي الانجراف في المهام ذات الصعوبة المعتدلة فقط إلى تشوه خطير في محتوى الاختبار: يفقد الأخير القدرة على عكس محتوى التخصص الذي تتم دراسته بشكل طبيعي، حيث يكون هناك دائمًا سهل وصعب مادة. وهكذا، في السعي لتحقيق موثوقية مجردة عالية من الناحية النظرية، يتم فقدان الصلاحية الموضوعية لنتائج الاختبار. غالبًا ما تكون الرغبة في زيادة صلاحية نتائج الاختبار مصحوبة بانخفاض في دقتها. تُعرف هذه الظاهرة نظريًا باسم مفارقة عالم القياس النفسي الأمريكي ف. لورد

إذا تم اختبار مجموعة ضعيفة من الطلاب، فقد اتضح أن عناصر الاختبار الصعبة ببساطة لا تعمل لأنه لا يمكن لأي طالب الإجابة عليها بشكل صحيح. تتم إزالة هذه المهام من معالجة البيانات الإضافية. لا يتم تقديمها في أنظمة التحكم التكيفية. سيختلف محتوى الاختبار للطلاب الضعفاء بشكل ملحوظ عن محتوى الاختبار للطلاب الأقوياء. بالنسبة للأخير، على العكس من ذلك، فإن المهام السهلة لا تعمل، لأن جميع الأشخاص ذوي المعرفة يجيبون على المهام السهلة بشكل صحيح. وبالتالي، فإن محتوى الاختبار التقليدي يختلف بشكل كبير اعتمادًا على مستوى استعداد تلك المجموعات من الطلاب الذين يهدف الاختبار إلى قياس معرفتهم.

يتطلب التعيين الأمثل لمحتوى المادة التعليمية في مهام الاختبار بمستوى الصعوبة المطلوب إمكانية اختيار النموذج المناسب. يتم التعبير عن محتوى الاختبار في أحد الأشكال الأربعة الرئيسية للمهام. هذه هي: 1) المهام مع اختيار واحد أو أكثر من الإجابات الصحيحة من بين تلك المقترحة؛ 2) المهام ذات الشكل المفتوح، حيث يكمل الموضوع الإجابة بنفسه، في المكان المخصص لذلك؛ 3) مهام إثبات الامتثال، و4) مهام تحديد التسلسل الصحيح للإجراءات.

الأدب
  1. زاخاروف أ.، ماتيوشكين أ.م. مشاكل أنظمة التعلم التكيفي // علم التحكم الآلي ومشاكل التعلم. - م: التقدم، 1970.- 389 ص.
  2. لاندا إل.ن. الخوارزمية في التدريب. م. التربية، 1966
  3. Gulliksen H. نظرية الاختبارات العقلية. ن - ي. وايلي. 1950 - 486 ص. و أكثر من ذلك بكثير إلخ.
  4. تاتسوكا، ك.ك. بناء العناصر والنماذج السيكومترية المناسبة للاستجابة المبنية. برينستون، نيوجيرسي، 1993. - 56 ص؛ فريدريكسن، ن.، ميسليفي آر جيه، بيجار آي جيه (محرران). نظرية الاختبار لجيل جديد من الاختبارات. لورانس إرلبوم الحمار. نشر. 1993، هيلزديل، نيوجيرسي، 404 صفحة. وإلخ.

صعوبة. صعوبة الاختبار هي درجة الصعوبة في مجمل المهام المتضمنة في الاختبار. أثناء عملية إنشاء الاختبار، يتم فحص مقياس الصعوبة بانتظام على عينة عشوائية من المجتمع الذي يهدف الاختبار إليه. في الاختبار المتوازن، عادة ما يحقق المؤلفون التوزيع الطبيعي بسهولة. مزيد من التحسين للاختبار يتبع مسار استبدال عدد من المهام والإجابات عليها

والتي تنتهك التوزيع الطبيعي. تؤثر صعوبة العنصر على الموثوقية والصلاحية. إذا كان الاختبار صعبا للغاية، فغالبا ما يضطر الطلاب إلى تخمين الإجابة الصحيحة، ولكن كلما لجأوا في كثير من الأحيان إلى التخمين، كلما اقترب توزيع نتائج الاختبار من التوزيع العشوائي. لذلك، فإن ملاءمة الاختبار لتقييم معرفة الكتلة بأكملها من الطلاب ستكون أقل، كلما كان الاختبار أكثر صعوبة. نفس التأثير على الوثوقية، ولكن لسبب مختلف، يحدث من خلال اختبار سهل نادرًا ما يخمن فيه الطلاب، وتكون إجاباتهم متسقة، ولكن لا يوجد فرق بينهم.

كفاءة. يتم تحديد فعالية الاختبار التربوي من خلال النهج الإبداعي للمجمعين لتطوير نظام المهام الذي يتوافق مع أهداف اختبار محددة.

حتى الآن، لا توجد وحدة في المجتمع التربوي في تصنيف الاختبارات. V. S. Avanesov، A. N. Mayorov، M. B. Chelyshkova، T. D. Makarova يرون علامات مختلفة لترسيم الحدود. ومع ذلك، وفقا لمنهجية إنشاء الاختبار، يحدد جميع المؤلفين بالإجماع: معايير مصممة لتحديد حقيقة عتبة إتقان المواد التعليمية؛ معياري، يوفر تصنيفًا للطلاب وفقًا لمستوى إتقان المادة مقارنة بالمعيار. بناءً على الخصائص المهنية، يمكنك تحديد: الاختبارات المعيارية وغير المعيارية.

من خلال تلخيص أبحاث العلماء، من بين مجموعة متنوعة من أنواع الاختبارات، سنسلط الضوء أولاً على تلك التي يمكن ربطها بأنواع التحكم: الوقائية، الحالية، النهائية. وهي بالتالي اختبارات تركيبية وتكوينية ونهائية. يكشف اختبار التثبيت عن المستوى الأولي لإعداد تلاميذ المدارس، ويحتوي على مهام سهلة وصعبة. ومن خلال قياس المستوى الأساسي للطالب، يستطيع المعلم مراقبة تطور كل طفل وإدخال عناصر التفرد في العملية التعليمية. يحدد الاختبار التكويني التقدم المحرز في التعلم. نقوم بتضمين الاختبارات الأساسية والتشخيصية في هذا النوع من الاختبارات. الأول يشمل المهام الإنجابية ويتم تنفيذها على مستوى تكوين المفهوم. والثاني يحتوي على مهام من الإنجاب إلى الإبداع ويكشف عن مستوى إتقان موضوع أو قسم من البرنامج. يجب أن يلبي الاختبار النهائي، والذي يطلق عليه بشكل شائع اختبار التحصيل الدراسي، جميع متطلبات الاختبار الموحد القائم على الأدلة.

بعد تحليل مجموعة متنوعة من تصنيفات مهام الاختبار المقدمة في الأدبيات ومقارنتها بالوثائق التنظيمية، يُنصح باقتراح تصنيف وفقًا لأنواع المهام وأنواعها: الأنواع - المغلقة (المهام مع اختيار الإجابة الصحيحة)، مفتوح (المهام مع إجابة مبنية بحرية)؛ الأنواع - مع اختيار إجابة واحدة صحيحة، مع اختيار أكثر من إجابة صحيحة، لإنشاء المراسلات، لإنشاء التسلسل الصحيح، للإضافة بإجابة قصيرة، للإضافة بإجابة مفصلة.

أحد اتجاهات تحديث التعليم هو إدخال امتحان الدولة الموحدة (USE). على الرغم من عدم وجود وجهة نظر واحدة بين المجتمع التربوي، فإن عددًا متزايدًا من المعلمين والإداريين على مختلف المستويات يدركون أن امتحان الدولة الموحدة هو أداة أكثر موثوقية لتقييم الإنجازات التعليمية لأطفال المدارس. تحدد نتائج الاختبار الشامل لعموم روسيا معايير إحصائية متوسطة للإنجازات التعليمية، والتي بموجبها يمكن لموضوعات العملية التعليمية تحديد هويتها الذاتية في مساحة تحكم وقياس واحدة. إن تحليل النجاحات وأوجه القصور مطلوب من قبل المؤسسات التعليمية وأنظمة الإدارة على كافة المستويات الهرمية لتصحيح العملية التعليمية. نظرا لأن امتحان الرياضيات إلزامي لجميع الخريجين، فيمكن اعتبار نتائج امتحان الدولة الموحدة بمثابة أساس معلومات لتنظيم مراقبة متعددة المستويات. نؤكد بشكل خاص على أن نظام التقييم المستقل الذي تم تقديمه، والذي يتم تنفيذه في إطار امتحان الدولة الموحدة، يعد أداة تعليمية قوية. ومن هنا تأتي وظيفة المراقبة التعليمية، والتي تتجلى بشكل غير مباشر.

إحدى المهام المهمة للتدريب هي تقييم معرفة الشخص بسرعة وبشكل موثوق. نحاول تطوير نظام لمؤشرات جودة المعرفة التي من شأنها تحديد شروط زيادة تحصيل الطلاب، وكذلك مستوى أهداف وغايات الرقابة التربوية.

لقد قمنا بتطوير منهج لتكنولوجيا بناء عدادات الاختبار حيث حددنا أربع مراحل: البحث والنمذجة والتشكيل والتقييم.

مرحلة البحث. ومن المهم للغاية أن تكون أنشطة تقييم المعلمين كافية وعادلة وموضوعية. في هذا الصدد، قمنا بتنظيم بحث عن أنواع موثوقة وفعالة من مهام الاختبار وطرق الاختبار باستخدام الوسائل التقنية وأجهزة الكمبيوتر الشخصية. يسمح لك استخدام جهاز الكمبيوتر بالانتقال إلى مراقبة المعرفة على مدى فترة طويلة من الزمن.

في هذه المرحلة، يتم تحديد حالة معرفة الطلاب باستخدام أجهزة قياس الاختبار. يعد الاختبار أحد أكثر أشكال التحكم الآلي تقدمًا من الناحية التكنولوجية مع معايير الجودة الخاضعة للرقابة. تتيح الطريقة الانتقائية عند إنشاء عناصر الاختبار استيعاب جميع أنواع الظواهر بسرعة، وفهم صفاتها العامة والمميزة بشكل أفضل، وتصنيف ظواهر وأنواع محددة من المعرفة بسهولة أكبر.

ومن ثم فإن الاختبار، أثناء قيامه بوظيفة التحكم في سياق تشخيص العملية التعليمية، يستخدم في نفس الوقت كوسيلة لتشخيص تعلم الطلاب. يعتبر التشخيص بمثابة تحديد دقيق لنتائج عملية التعلم، في حين يعتبر التدريب مستوى (درجة) تحقيق الهدف المقصود الذي تم تحقيقه في وقت التشخيص" (I.P. Podlasy).

في هذه المرحلة يتم تحديد المشاكل الرئيسية عند استخدام الاختبارات: جودة وصلاحية محتوى عناصر الاختبار، موثوقية نتائج الاختبار، عيوب معالجة النتائج وفق النظرية الكلاسيكية للاختبارات، عدم استخدام الأساليب الحديثة. نظرية معالجة مواد الاختبار باستخدام جهاز الكمبيوتر. إن العدد غير الكافي من الاختبارات المواضيعية للمراقبة المستمرة لمعرفة طلاب المدارس له تأثير سلبي على التعلم، ويمنع تفرده في سياق العملية التعليمية الجماعية. يجب حل المهام المعينة في إطار الاختبار الحالي والنهائي للطلاب.

مرحلة النمذجة. في المرحلة الثانية، يتم تطوير خوارزمية دورة التدريب ومفهوم التحكم في الاختبار. يجب أن تضمن دورة التعلم توجيهًا ثابتًا للتعلم نحو الأهداف المقصودة. وبفضل هذا الهيكل، تكتسب العملية التعليمية طابع "الكتلة". الكتلة - هندسة المعرفة التعليمية، والتي تسمح لك بإضفاء الطابع الرسمي على ضغط المعلومات التعليمية باستخدام إنجازات نظريات التعميم الهادف (V.V. Davydov وأتباعه)، وتوسيع الوحدات التعليمية (P.M. Erdniev)، ومفهوم تشكيل المعرفة المنهجية (L.L. زورينا) .

تحميل...تحميل...