Помимо надежности в понятие «тест» входит и концепция валидности. Поскольку в психологии нередки случаи увлечения точностью измерения неточно выделенных свойств, соотношение между надежностью и валидностью можно образно представить в виде кучной стрельбы, но несколько в стороне от центра мишени, т. е. стрельба из оружия вполне надежного, но прицел стрелок выбрал не совсем точно. Современный тест — это не только надежный, но и валидный тест, однако не на все случаи жизни, а разработанный для конкретной цели. Нет тестов вообще надежных и валидных. Эти качества характеризуют не только инструмент измерения, но обязательно характер, цель и время его применения. В историческом разрезе концепция валидности, так же как и надежности, начиналась с наивного предположения о том, что метод «работает», т. е. каждый создаваемый тест рассматривался как валидный, примерно так, как если бы каждая создаваемая социологами анкета будто бы годилась для решения поставленных задач. Первые же проявления действительно научной критики развенчали эту, по сути, «веру» в валидность. Они же стимулировали поиск. Привлечение к созданию тестов известных ученых было для научной общественности в начале века гарантией убедительности обоснования валидности как бы по авторитету. Но это был дотеоретический, доэмпирический, по существу, донаучный этап оценки качества тестов. Поскольку в те годы тесты разрабатывались исключительно для решения практических проблем, эмпиризм и соответствующая-ему методология стали главными для обоснования качества инструментария. Это особенно проявилось в создании тестов для решения кадровых проблем: профотбора, профориентации, профконсультации, а также распределения принятого контингента по специальностям и отделениям внутри производства или учебного заведения. С точки зрения истории можно выделить два основных эмпирических подхода к валидизации тестов. Первый назовем прогностическим. Его логика такова. Если те, кто хорошо работают (по критерию Y), показывают высокие результаты по какому-либо тесту (X), значит, здесь есть связь, быть может и причинная. Иначе говоря. Y, вероятно, зависит от X. Отдавая предпочтение при приеме на работу тем, у кого выше результаты по X, предполагается, что они покажут и более высокую производительность труда. Ожидания такого рода часто сбываются, но в различной степени. Другой подход к эмпирической валидизации тестов основан на использовании экспертных оценок. Здесь логика еще проще — если эксперты (множество авторитетов) согласованно считают одних более способными, других — менее, значит «это так^. В случае, когда результаты теста указывают на сходную тенденцию, т. е. данные по тесту коррелируют с данными экспертизы, то принимается, что тест валидный и его можно далее применять и в других подобных ситуациях Так проводилась валидизация первого теста для измерения интеллектуальных способностей (Бине А. и Симон Т.), а в наше время — некоторых тестов для измерения социальных потребностей молодежи (Прогнозирование социальных потребностей молодежи, М., 1978). — 11 —
|