Логика мышления

Страница: 1 ... 678910111213141516 ... 95

pk=(x1k?xnk)T

Для любых двух признаков, на которых строится описание, можно посчитать величину, показывающую степень их совместного проявления. Эта величина называется ковариацией:

cov(pi,pj)=1n?k=1n(xki?p?i)(xkj?p?j)

Она показывает, насколько отклонения от среднего значения одного из признаков совпадают по проявлению с аналогичными отклонениями другого признака. Если средние значения признаков равны нулю, то ковариация принимает вид:

cov(pi,pj)=1n?k=1nxkixkj

Если скорректировать ковариацию на среднеквадратические отклонения, свойственные признакам, то мы получим линейный коэффициент корреляции, называемый еще коэффициентом корреляции Пирсона:

r(pi,pj)=cov(pi,pj)?(pi)?(pj)

Коэффициент корреляции обладает замечательным свойством. Он принимает значения от -1 до 1. Причем 1 означает прямую пропорциональность двух величин, а -1 говорит об их обратной линейной зависимости.

Из всех попарных ковариаций признаков можно составить ковариационную матрицу R, которая, как несложно убедиться, есть математическое ожидание произведения XXT:

R=E(XXT)

Будем далее полагать, что наши данные отнормированы, то есть имеют единичную дисперсию. В этом случае корреляционная матрица совпадает с ковариационной матрицей.

Так вот оказывается, что для главных компонент q справедливо:

Rq=?q

То есть главные компоненты, или, как еще их называют, факторы являются собственными векторами корреляционной матрицы R. Им соответствуют собственные числа ?. При этом, чем больше собственное число, тем больший процент дисперсии объясняет это фактор.

Зная все главные компоненты q, для каждого события x, являющегося реализацией X, можно записать его проекции на главные компоненты:

aj=qTjx

Таким образом, можно представить все исходные события в новых координатах, координатах главных компонент:

x=Qa=?j=1majqj

Вообще различают процедуру поиска главных компонент и процедуру нахождения базиса из факторов и его последующее вращение, облегчающее трактовку факторов, но так как эти процедуры идеологически близки и дают похожий результат, будем называть и то и другое факторным анализом.

За достаточно простой процедурой факторного анализа кроется очень глубокий смысл. Дело в том, что если пространство исходных признаков – это наблюдаемое пространство, то факторы – это признаки, которые хотя и описывают свойства окружающего мира, но в общем случае (если не совпадают с наблюдаемыми признаками) являются сущностями скрытыми. То есть формальная процедура факторного анализа позволяет от явлений наблюдаемых перейти к обнаружению явлений, хотя непосредственно и невидимых, но, тем не менее, существующих в окружающем мире.

— 11 —
Страница: 1 ... 678910111213141516 ... 95