Значительно позже появились попытки теоретического осмысления этой концепции. Исходным пунктом всех построений является уже упоминавшийся тезис о неизбежности погрешности измерений и, как следствие, признание множественности возможных причин искажения истинного результата измерения. Как результат факторно-аналитического переосмысления концепции надежности и гомогенности теста родилась новая технология расчета коэффициента надежности теста. Ее появление надо рассматривать как реакцию на неприемлемость и искусственность ряда таких условий и ограничений, как, например, параллельность форм одного и того же теста, равенство дисперсий всех высказываний, одинаковая их коррелируемость друг с другом. Д. Армор использовал известный факт корреляции тестовых высказываний между собой и стал рассматривать ее как аргумент, статистической функцией которого является надежность теста. Если все высказывания измеряют один и тот же признак (свойство), то для фиксированного их числа чем больше корреляция между ними, тем более надежен тест. С другой стороны, высокая корреляция обеспечивает хорошую факторизуемость корреляционной матрицы (К) и, следовательно, является залогом выделения такого одного фактора, который может объяснить связь большей части дисперсии в R. Следовательно, надежность тестов должна быть связана с результатом факторного анализа. Предложенная Армором формула оказалась сравнительно простой (Armor D., 1974, с. 20): ? = где ? - коэффициент надежности теста; k— количество высказываний; ?1 - наибольшее значение корня, получаемое при решении характеристических уравнений вида /R - ? • J/ = 0. Помимо надежности в понятие «тест» входит и концепция валидности. Поскольку в психологии нередки случаи увлечения точностью измерения неточно выделенных свойств, соотношение между надежностью и валидностью можно образно представить в виде кучной стрельбы, но не в центр мишени, т. е. стрельба ведется из оружия вполне надежного, но прицел стрелок выбрал не совсем точно. Современный тест - это не только надежный, но и валидный тест, однако не на все случаи жизни, а разработанный для конкретной цели. Нет тестов вообще надежных и валидных. Эти качества характеризуют не только инструмент измерения, но обязательно характер, цель и время его применения. В историческом разрезе концепция валидности, так же как и надежности, начиналась с наивного предположения о том, что метод «работает», т. е. каждый создаваемый тест рассматривался как валидный, примерно так, как если бы каждая создаваемая социологами анкета годилась для решения поставленных задач. Первые же проявления действительно научной критики развенчали эту, по сути дела, «веру» в валидность. Они же стимулировали поиск. Привлечение известных ученых к созданию тестов было для научной общественности в начале нынешнего века гарантией убедительности обоснования валидности как бы по авторитету. Но это был дотеоретический, доэмпирический, по существу, донаучный этап оценки качества тестов. — 33 —
|