Дж. С. Дэвис. Статистический анализ данных в геологии. Книга 2
МЕТОД ГЛАВНЫХ КОМПОНЕНТ
Первая важная процедура, которую мы рассмотрим в этoм разделе – это метод главных ком-
понент (МГК). Главные компоненты – это не что иное как собственные векторы ковариационной
матрицы. Сами по себе они позволяют глубже проникнуть в структуру матрицы, но часто их можно
интерпретировать и как факторы. Многие современные схемы факторного анализа используют ме-
тод главных компонент в качестве отправного пункта для анализа. По этой причине, а также в силу
того что доказательства и интерпретация метода главных компонент весьма просты, мы начнем с
его рассмотрения.
Как уже отмечалось, геологи часто испытывают неудобство от пользования этой терминоло-
гией; большинство из опубликованных работ показывает, что геологи называют «факторным анали-
зом» метод главных компонент. «Факторы», встречающиеся в этих работах, на самом деле нужно
называть компонентами. Некоторые авторы испытывают столь большую неловкость от этой пута-
ницы, что нашли выход в том, что ввели для факторного анализа, в отличие от компонентного, на-
звание «истинный факторный анализ» [33].
Предположим, что измерены две переменные на множестве объектов, например длина и ши-
рина раковин брахиопод. Полученные данные приведены в табл. 6.19 и графически изображены на
рис. 6.18. Дисперсия переменной Х
1
равна 20,3, переменной Х
2
– 24,1, а ковариация равна 1566. Это
можно представить в виде ковариационной матрицы
1,246,15
6,153,20
2
s
В гл. 3 указывалось, что матрицу можно представить геометрически в многомерном пространстве
как множество векторов. Будем считать, что каждая строка матрицы дает координаты концевых то-
чек вектора, представляющего эту строку. Матрицу порядка 22 можно представить на плоской
диаграмме, как это сделано на рис. 6.19. Более того, эти векторы можно считать произвольными
осями m-мерного эллипсоида. Собственные векторы матрицы дают ориентацию главных осей эл-
липсоида, а собственные значения представляют длины каждой из последовательных главных полу-
осей. В гл. 3 так были интерпретированы произвольные матрицы, но очевидно, что ковариационные
матрицы легко можно интерпретировать так же. Метод главных компонент сводится к нахождению
этих осей и измерению их длин.
Если проведены измерения переменных на некотором множестве объектов, то для них мож-
но вычислить матрицу ковариаций порядка mm – [s
2
]. Найдем m ее собственных векторов и m соб-
ственных значений. Так как ковариационная матрица всегда симметрична, то эти m собственных
векторов будут ортогональными, т.е. углы между ними будут прямыми.
Вычислим собственные векторы и собственные значения нашей матрицы [s
2
] порядка 22 и
изобразим полученные векторы графически. Первый собственный вектор имеет координаты
75,0
66,0
I
что означает, что первый собственный вектор, соответствующий I главной оси эллипсоида, откло-
няется на 0,66 единиц по S
1
2
для каждых 0,75 единиц по S
2
2
. Первое собственное значение равно 37,9
и является длиной главной полуоси. Второй собственный вектор имеет координаты
66,0
75,0
II
Ясно, что он образует прямой угол с первым. Собственное значение, соответствующее этому векто-
ру, т.е. длина II главной полуоси, равна 6,5. Эти геометрические соотношения показаны на рис. 6.20.
Обратите внимание на то, что на диаграмму нанесены векторы ковариационной матрицы и поэтому
измерения на диаграмме даны в тех же единицах, что и в дисперсии, или, как в этом примере, в
квадратах единиц длины.