Продукт, который демонстрирует человек в тестах достижений, является предметом анализа с позиции классической и современной теории тестов. Классическая теория тестов создала средства анализа тестовых заданий. Например, задается определенная степень сложности заданий; подсчитывается разница в успешности решения заданий испытуемыми с высоким и низким уровнями достижений; определяются корреляции, показывающие степень согласованности отдельных заданий; определяется распределение суммарных оценок, и, кроме того, имеется немало показателей надежности как для отдельных заданий, так и, главным образом, для суммарных оценок. Современная теория тестов также легко применима к тестированию уровня достижений. Теория анализа ответов в заданиях (IRT) содержит в себе много различных моделей. Они не совпадают с точки зрения тех характеристик, которым должны отвечать полученные данные. В случае строгих требований им может удовлетворить лишь небольшое число данных. Например, однопараметрическая модель Раша выглядит весьма привлекательно, но крайне мало данных могут подойти под предъявляемые ею требования. Для шкалы Моккена необходимо только монотонное возрастание заданий, следовательно, шкалированию в соответствии с этой моделью поддается большее число наборов заданий. Упрощенным примером применения теории анализа ответов в задании может служить конструирование шкалы, в которой тестируемым людям и заданиям придается организация порядковой шкалы. Место человека на такой шкале зависит от уровня его способности и от трудности задания. Задание можно охарактеризовать с помощью двух признаков: уровня трудности и дискриминативной силы. Под последней понимается степень связи, существующей между латентной способностью и возможностью дать хороший ответ в этом задании. Это не что иное, как крутизна характеристической кривой задания. Возьмем для примера два задания — одно, вероятность правильного решения которого при пятой позиции на шкале способностей составляет 50% и 80% при шестой позиции, и другое задание, в котором вероятность успешного решения составляет 55% при той же (шестой) позиции на шкале способности. В этом 168
случае дискриминативность первого задания будет больше, а характеристическая кривая задания — круче. Сочетание ответов в заданиях указывает на возможную предзадан-ность шкалы. Если задания не поддаются упорядочению в рамках одной шкалы, можно говорить, что результаты предлагают описание по более чем одному параметру. Таким образом, модель анализа ответов задания как бы изнутри проверяет конструктную валидность теста. С другой стороны, в рамках классической теории тестов разработаны понятия дивергентной и конвергентной валидности, которые опираются на сравнение с другими тестами, и здесь не требуется специальной модели измерения для тестов. — 119 —
|