Занятие 6
Метод главных компонент и дискриминантный анализ
I. Метод главных компонент
Запустите программу STATISTICA. В появившемся меню выберите
пункт Factor Analysis. (Если такого пункта нет, то в верхней строке ме-
ню выберите Analysis, затем пункт Other Statistics и выберите пункт
Factor Analysis.) Щелкните по переключателю модулей (Switch to). По-
сле запуска программы STATISTICA обычно появляются последние дан-
ные,
с которыми работал этот модуль программы. Для открытия нужного
вам файла выберите в меню File, затем пункт Open Data. Далее стан-
дартным образом указывается, откуда будут взяты данные, с которыми
вы будете работать. Проверьте, что открыты именно ваши данные. В
верхней строке меню выберите Analysis, затем пункт Resume Analysis.
Выберите переменные (Variables), по которым будет проводиться анализ
(С,
PHS, IL, G, V). В поле Input file выберите тип Raw date (исходные
данные; программа может работать также с матрицей расстояний). Нажа-
тие кнопки ОК приведет к открытию следующей панели. Эта панель дает
информацию о выбранных ранее условиях (число случаев, число пере-
менных, наличие пропусков данных и способ их ликвидации), позволяет
перейти на панель описательной статистики и корреляций (Review
corrs/means/sd) или множественной регрессии (Perform multiple regres-
sion).
Здесь же дается возможность выбора между двумя видами анализа:
МГК (Principal components) и факторного анализа. Отметьте точкой
МГК, укажите число компонент (Maximum no of factors), равное 3, и
минимальное собственное число (Minimum eigenvalue), равное 0,7 . На-
жмите ОК.
Верхняя часть открывшей панели содержит информацию о выбранном
методе, детерминанте корреляционной матрицы, числе компонент и зна-
чениях собственных чисел. Нижняя часть этой панели делится на три
смысловых поля. Первое поле называется «Объясненная дисперсия»
(Explained variance). Здесь может быть выведена таблица собственных
чисел (кнопка Eigenvalues), которые представляют собой полную дис-
персию, объясняемую каждой компонентой, а также общности (Сот-
munalities), остатки (Reproduced/residual corrs.) и графическое изобра-
жение критерия «каменистой осыпи» (Scree plot). Выведите таблицу
собственных чисел (кнопка Eigenvalues), для своих данных и скопируйте
ее в файл Excel с отчетом.
Второе поле объединяет кнопки, связанные с факторными нагрузками
(Factor loadings), то есть корреляциями между исходными переменными
и факторами ( в нашем случае - главными компонентами). Нажмите