Задача «Классифицировать объекты»
241
явление – противопоставление общих размеров тела (большие по-
ложительные корреляции) длине хвоста (большие отрицательные
корреляции). График первой главной компоненты (рис. 9.6) также
похож на график первой корреляционной компоненты (рис. 9.5) и
характеризует «общие размеры тела» (объединяя два признака – W и
Lt). В то же время достаточно высокий вклад переменной «длина
хвоста» (–0.47) заставляет включить и этот признак в название ком-
поненты, обозначая направление изменчивости «рост размеров при
уменьшении хвоста».
Вторая главная компонента отличается от своего корреляци-
онного аналога. Нагрузка для переменной «длина хвоста» остается
высокой (0.863), но для первых двух признаков значения факторных
нагрузок существенно ниже корреляционных (0.191 и 0.467 против
0.976 и 0.923). Эти небольшие коэффициенты свидетельствуют о
том, что половой диморфизм сказывается и на общих размерах тела,
но в меньшей степени, чем размер хвоста. Причины несовпадения
коэффициентов корреляции и факторных нагрузок состоят в том,
что первичные коэффициенты корреляции отражают, вообще гово-
ря, действия всего множества факторов сопряженного варьирования
исходных признаков, «смесь». Сильные факторы определяют уро-
вень коррелированности в большей мере, слабые – в меньшей. Фак-
торные же нагрузки вычленяют эффект действия своего фактора «в
чистом виде». Изменчивость второй главной компоненты менее оп-
ределена, чем второй корреляционной компоненты. Однако вместе с
первой они хорошо дифференцируют особей разного пола на две
изолированные группы: в осях двух главных компонент самки «рас-
положены» справа внизу, самцы – слева вверху.
Информативность и значимость компонент
Следует отметить, что участие двух компонент в дифферен-
циации объектов неодинаково. Первая компонента имеет наиболь-
шую дисперсию (2.1) и на 70% исчерпала информацию об изменчи-
вости признаков (табл. 9.9), тогда как на долю второй приходится
всего 24%. Получается, что роль этой компоненты ниже, чем роль
любого из исходных признаков (на каждый из них приходится по
33%), и вторая компонента (как и третья) не должна бы участвовать
в дальнейшем рассмотрении. В компонентном анализе обычно ис-