В рамках этой концепции делаются некоторые допущения относительно истинных результатов и ошибок измерения. Последние принимаются в качестве независимого фактора, что, конечно, является вполне обоснованным предположением, так как случайные колебания результатов не дают ковариаций: rЕЕ=0. Предполагается, что корреляции между истинными баллами и ошибками измерения не существует: rEE=0. Суммарная ошибка равна 0, т.к. в качестве истинной оценки берется среднее арифметическое значение: Эти допущения приводят нас в итоге к известному определению надежности как отношения истинного результата к общей дисперсии или выражению: 1 минус отношение, в числителе которого ошибка измерения, а в знаменателе — общая дисперсия: , ИЛИ Из этой формулы определения надежности получаем, что дисперсия ошибки S2(E) равна общей дисперсии в числе случаев (1 – rXX'); таким образом, стандартная ошибка измерения определяется по формуле: После теоретического обоснования надежности и его производных необходимо определить индекс надежности того или иного теста. Существуют практические процедуры оценивания надежности тестов, такие как использование взаимозаменяемых форм (параллельные тесты), расщепление заданий на две части, повторное тестирование и измерение внутренней согласованности. Каждый справочник содержит индексы постоянства тестовых результатов: rXX’=r(x1, x2) где rXX’ — коэффициент стабильности, а x1 и x2 — результаты двух измерений. Понятие надежности взаимозаменяемых форм введено и разработано Гулликсеном (1950). Данная процедура достаточно трудоемка, поскольку связана с необходимостью создания параллельной серии заданий rXX’=r(x1, x2) где rXX’ — коэффициент эквивалентности, а x1 и x2 — два параллельных теста. 30
Следующая процедура — расщепление основного теста на две части А и В — более проста в использовании. Показатели, полученные по обеим частям теста, коррелируются. С помощью формулы Спирмена-Брауна оценивается надежность теста в целом: , где А и В — две параллельные части теста. Следующий метод — определение внутренней согласованности выполнения заданий теста. Этот метод основан на определении ковариаций отдельных заданий. Sg — дисперсия произвольно выбранного задания, и Sgh — ковариация двух произвольно выбранных заданий. Наиболее часто используемый коэффициент для определения внутренней согласованности — это «коэффициент альфа» Кронбаха. Используются также формула КР20 и ?—2 (лямбда-2). — 21 —
|