Как упоминалось выше относительно коэффициентов надежности, в нескольких (немногочисленных) руководствах используются эмпирические правила ранжирования коэффициента прогностической корреляции. Можно было бы остановиться на том, что целью является достижение значимых корреляций. Однако у исследователя обычно более высокие запросы. Он стремится объяснить большую часть дисперсии. Что это такое — «большая» часть? Наннелли и Бернштейн (1994, стр. 99—100) замечают, что эмпирически найденные корреляции редко бывают выше, чем 0,30—0,40. В какой-то степени это разочаровывает, но 324
авторы находят некоторое утешение в сравнении с достижениями других наук: Например, тест способности к школьному обучению не менее прогностичен для ступеней колледжа, чем метеорологический прогноз погоды на ближайшие десять дней (стр. 100). Этот раздел посвящен системе оценки тестов. Категории и пункты такой оценки соответствуют «Стандартам» 1974 г. Данная система привлекалась для работы с голландским вариантом WISC-R. Результаты применения этой системы согласуются с оценкой теста по голландской системе «Документации тестов и исследований тестов» (Evers, et al.1992, 539—562). 8.3. Качество диагностики: совершенствование «Стандартов» Не существует окончательного заключения о качестве психодиагностических средств. За последней по времени редакцией «Стандартов» (1985) вскоре последует шестая редакция. Чтобы дать представление о «Стандартах», ниже приводятся некоторые примеры, заимствованные из голландской редакции американской версии (1985). Для раздела «Валидность» существует 26 стандартов. Например, правило 1.12: Все критерии измерения и основания выбора этих критериев должны быть описаны детально, тщательно. Надежность и погрешности измерения содержат двенадцать стандартов. Например, правило 2.10: Коэффициенты надежности могут быть различными для разных популяций. Тест должен иметь коэффициенты надежности применительно к каждой популяции, для которой он рекомендован. В разделе «Усовершенствование теста» приводятся 23 стандарта. Например /3.23/: Когда при подсчете результатов по тесту играют роль субъективные оценки диагноста, должна быть полностью описана основа системы оценивания, а также тренировка, которая необходима для достижения достаточной степени согласованности разных мнений. «Шкалирование, нормы, и сравнение тестовых показателей» включает семь стандартов. Например/4.5/: Если можно ожидать,что тест будет использоваться для интерпретации результатов групп, а не отдельных лиц, то — 231 —
|