
Несмотря на важность евклидовой и других метрик, они
имеют серьезные недостатки. Наиболее важный состоит в том,
что оценка сходства сильно зависит от различий в сдвигах дан-
ных. Переменные, у которых одновременно велики абсолютные
значения и стандартные отклонения, могут подавить влияние
переменных с меньшими абсолютными размерами и стандарт-
ными отклонениями. Более того, метрические расстоящм изме-
няются под воздействием преобразованной шкалы измеренрш
переменных, при которых не сохраняется ранжирование по евк-
лидову расстоянию. Чтобы уменьшить влияние относительных
величин переменных, обычно перед вычислением расстояния
переменные нормируют к единичной дисперсии и нулевому
среднему.
В отличие от евклидовой и других аналогичных метрик мет-
рика расстояния Махаланобиса с помощью матрицы дисперсий-
ковариаций связана с корреляциями переменных. Когда корре-
ляция между переменными равна нулю, расстояние Махалано-
биса эквивалентно квадратичному евклидову расстоянию.
Для графической интерпретации результатов кластерного
анализа приводится график расположения исходных объектов в
пространстве первых двух главных компонент. При этом объек-
ты,
попавшие в один кластер, отображаются одним цветом.
Иногда объекты из разных кластеров расположены столь близко,
что может создаться иллюзия неправильной классификации. Это
связано с тем, что классификация проводится по большому чис-
лу переменных, а фафик строится по двум координатам, хотя и
отражающим основные особенности данных, поэтому расхожде-
ния между результатом классификации и фафическим отобра-
жением неизбежны.
Частотный анализ. Вместе с долговременными изменениями
во временных рядах часто появляются некоторые регулярные
колебания, изменения наблюдаемых значений которых могут
бьггь строго периодическими или близкими к таковым, оценива-
ясь в частотном аспекте. Для вьювления наличия и устойчивости
периода этих колебаний обычно используется математический
аппарат частотного анализа: гармонический анализ, спектраль-
ный анализ, частотная фильтрация, кросс-спектральный анализ,
который в совокупности позволяет с разных позиций анализи-
ровать исследуемый показатель, но он эффективен лишь при
достаточно большом объеме данных (желательно иметь 200—
300 наблюдений, но не менее 50 наблюдений), из которых пред-
185