В условиях неопределенного количества типов наиболее адекватной процедурой является построение иерархической структуры. На рис. 2 представлен график, полученный с помощью математической модели расчетов евклидового расстояния полученных данных, относящихся к каждому из опрошенных нами в ходе тестирования пожилых респондентов. Евклидово расстояние является геометрическим расстоянием в многомерном пространстве и вычисляется следующим образом: Математическое обеспечение всей работы по кластерному анализу осуществлялось с применением компьютерной программы «STATISTICA». Как показали результаты иерархической кластеризации, представленные на рис. 2, данные большинства испытуемых в целом достаточно гомогенны, и существенных различий для большинства не обнаружилось, о чем свидетельствует плавнокаскадная структура графика и отсутствие отчетливо выделенных узлов (в которых и формируется кластер). При изучении графика установлено не более трех неявных узловидных образования, что и послужило основой для выдвижения гипотезы относительно числа кластеров (по наблюдениям). При этом мы констатировали, что в предполагаемых кластерах существует много схожих аспектов. Рис. 2. Вертикальная древовидная диаграмма результатов кластеризации данных В дальнейшей обработке мы использовали метод кластеризации К-средних, который позволил образовать ровно три кластера так, чтобы они были настолько различны, насколько это возможно. Это именно тот тип задач, которые решает алгоритм метода К-средних, который строит ровно К различных кластеров, расположенных на возможно больших расстояниях друг от друга. В таблице 12 представлены общие статистические характеристики полученных кластеров. Таблица 12 Евклидовы расстояния между кластерамиВ первый кластер изначально вошли 48 испытуемых выборки; во второй кластер объединились 15 испытуемых; в третий – 37 испытуемых. Для более точной идентификации испытуемых, прочно входящих в тип и отсева неопределенных данных, мы использовали метод введения некоторой «помехи». В нашем исследовании мы использовали пять таких помех в лице независимых переменных, а именно – «возраст», «семейное положение», «наличие трудностей», «доход», «отношение к религии». Таким образом, мы провели еще пять дополнительных процедур кластеризации К-средних, поочередно включая каждый раз по одной из упомянутых выше позиций (помех). При нескольких решениях всегда очевидно выделялось три группы испытуемых. Следует отметить, что принадлежность к группе при разных подходах в целом была довольно стабильна, и в любом случае тесно связанные по типу испытуемые всегда попадали в один кластер. Вариации были обусловлены неопределенными по принадлежности к какой-либо из групп (кластеров) испытуемыми. — 99 —
|