Дж. С. Дэвис. Статистический анализ данных в геологии. Книга 2
Соотношения между самими переменными также не изменяются при вращении, хотя поло-
жение индивидуальных объектов в пространстве, определенном факторными осями, изменяется. На
рис. 6.38 нанесены факторные метки, аналогично меткам главных компонент, представленным на
рис. 6.27. Заметим, что два множества факторных осей представлены на диаграмме, одно для фак-
торных меток до вращения и другое – для меток после варимаксного вращения. Оказывается, что
первый фактор на самом деле отражает все размеры блоков, так что меньшие блоки располагаются
слева, а большие – справа. Второй фактор разделяет формы одинакового размера на верхушке с уп-
лощениями и удлинениями ниже относительно второго фактора. В этом случае варимаксное враще-
ние, возможно, не даст вклад в нашу интерпретацию факторов. Никакая из схем факторных меток
сильно не отличается от полученных методом главных компонент, хотя относительная важность
первой и второй факторных осей меняются местами по сравнению с осями метода главных компо-
нент.
Графическое изображение факторных меток (до вращения или после него) более сложно,
чем в методе главных компонент. Главные компоненты получаются в результате применения ли-
нейных преобразований, в то время как факторные значения представляют оценки вкладов различ-
ных факторов в каждое исходное наблюдение. Так как факторы находятся по тем же данным, вы-
числение факторных нагрузок – в некотором роде циклический процесс, и потому результаты могут
оказаться неоднозначными. Одно из наилучших изложений этого вопроса принадлежит Моррисону
[51] (см. также процедуры, описываемые Харманом [22]). В психометрии факторы обычно пред-
ставляют самостоятельный интерес, а факторные метки совсем не используются, поэтому вычисле-
нию факторных меток до сих пор уделялось мало внимания. Вероятно, факторные метки могут иг-
рать значительную роль в применениях факторного анализа в геологии и потому важно уметь их
вычислять.
Предположим, что наши исходные данные представлены в виде матрицы [Х] порядка nm,
где n – число строк, или наблюдений, а m – число столбцов, или переменных. По аналогии с МГК
можно вычислить матрицу факторных меток [S
R
], умножая матрицу исходных данных на матрицу
факторных нагрузок [А
R
], т.е. выполняя операцию [X] [А
R
] = [S
R
]. Если мы сохраняем р факторов,
то матрица нагрузок [А
R
] будет матрицей порядка mр, а матрица факторных значений [S
R
] будет
иметь порядок nр. Напомним, однако, что исходные данные представлены не только с помощью
факторов, но и с помощью специфической переменной (см. формулу 6.51), поэтому матрица фак-
торных значений, вычисленная таким образом, частично отражает ковариационную структуру за-
данного набора m переменных, а также структуру р факторов. Действительно, для того чтобы полу-
чить истинные факторные значения, специфическую компоненту исходных переменных необходи-
мо отделить. Это делается с помощью умножения указанного уравнения на матрицу, обратную мат-
рице ковариаций:
][][][][
12 RR
SAsX
(6.59)
Обратная матрица имеет порядок mm, а матрица факторных нагрузок – порядок mр, так
что матрица «истинных» факторных значений [S
R
] будет порядка nр, что и следовало ожидать. В
результате выполнения этой операции мы получаем факторные метки, свободные от специфической
компоненты; имеющейся в каждом из исходных наблюдений.
Несмотря на простоту, этот метод нахождения факторных меток не используется на практи-
ке. Матрица [s
2
] может быть очень большой, в особенности в Q-методе факторного анализа, на ко-
тором мы остановимся ниже, и ее обращение может оказаться очень сложным. Однако, используя
алгебраические соотношения, можно обратить матрицу ковариаций порядка рр, построенную по
факторам, и в результате получить тот же результат. Обычно р бывает значительно меньше m, что
позволяет упростить вычисления, хотя число матричных преобразований при этом возрастает.
Вычислим сначала матрицу [S], умножая матрицу факторных нагрузок на ее транспозицию
][][][ SAA
RR
(6.60)
Так как транспонированная матрица [А
R
]' имеет порядок рm, то в результате умножения
получится квадратная матрица порядка рр. Эта матрица обращается и умножается на матрицу фак-
торных нагрузок, что дает нам некоторую вспомогательную матрицу [В]:
][][][
1
BSA
R
(6.61)
которая затем используется для вычислений истинной матрицы факторных значений по формуле