Задача «Классифицировать объекты»
233
Общая модель компонентного анализа примет вид:
mmiil
xaxaxaxaГК ⋅++⋅++⋅+⋅= ......
2211
,
где l – номер компоненты, l = 1, 2,… k (значимых компонент все-
гда меньше, чем признаков, k ≤ m).
Как же практически можно определить, какую долю каких
факторов содержит в себе каждое значение исходных признаков,
т. е. чему равны конкретные значения коэффициентов a
j
(факторных
нагрузок) и как их вычислить? Для упрощения объяснения на пер-
вых порах придется несколько пожертвовать строгостью понятий.
Сначала зададимся более простым вопросом – как опреде-
лить долю участия некоего внешнего фактора в каких-либо двух
изучаемых признаках (например, масса и размеры особи)? Если не-
кий фактор будет действовать на оба признака одновременно, это
значит, что изменения значений вариант от объекта к объекту будут
происходить более или менее синхронно, сопряженно. Поскольку
известно, что сопряженное варьирование двух признаков лучше все-
го оценивать с помощью корреляционного анализа, значит, коэффи-
циент корреляции и покажет, чтó в варьировании двух признаков
есть общего и какова степень этой общности. Корреляция на уровне
r = 1 свидетельствует о том, что оба изучаемых признака абсолютно
детерминированы друг другом или единственной внешней причи-
ной. Говоря упрощенно, коэффициент корреляции r = 0.5 свиде-
тельствует, что примерно половинная доля значений каждой из ва-
риант обоих признаков определяется действием некоего общего
фактора, а другие «половинки значений» сформированы под влия-
нием иных обстоятельств. Такой уровень корреляции как раз харак-
терен для связи вес – размеры особи. Любой коэффициент корреля-
ции будет отражать то общее, что есть между каждой парой изучае-
мых признаков, что заставляет их сопряженно изменяться от вари-
анты к варианте.
Коэффициенты в уравнениях главных компонент – это анало-
ги коэффициентов корреляции между признаками, они названы
факторными нагрузками (отличия между коэффициентами корре-
ляции и факторными нагрузками показаны ниже). Это удачное на-
звание показывает, во-первых, какой эффект данный l-й фактор ока-
зал на данный j-й исходный признак, а также, во-вторых, какой
вклад вносит данный признак в значение данной главной компонен-