19
Предположим, что измерено семь переменных на каждом из
трех объектов. Ими могут быть, например, определенные химиче-
ские анализы у трех пациентов. Если нанести каждое измерение
на график так, как это показано на рис. 1.3, можно убедиться в
том, что соотношения между переменными в двух объектах сход-
ны. Им соответствуют более или менее параллельные графики А и
В на диаграмме. У третьего графика другой вид, но он значитель-
но ближе к графическому представлению множества измерений,
соответствующего одному из двух других объектов. В этом при-
мере А и В сильно коррелированы, т. е. имеют высокие линейные
связи, но зато расстояние между В и С минимально. Если бы в
качестве переменных были выбраны исходные данные пациентов
(рост, вес, объемы различные и т. п.), то это привело бы к выводу,
что А и В имеют близкую форму, а В и С – сходные размеры. Если
бы в качестве переменных были выбраны содержания тяжелых
элементов в пробах, то можно сделать вывод, что образцы А и В
аналогичны по составу, но А обладает пониженными содержа-
ниями по сравнению с В. Содержания элементов в В и С близки,
но их отношения различны.
Необходимо пояснить, что коэффициент корреляции указы-
вает на наибольшее сходство в тех случаях, когда он имеет высо-
кое положительное значение, в то время как расстояние указывает
на наибольшее сходство в тех случаях, когда оно наименьшее.
Поэтому коэффициент корреляции выявляет наличие связи при
его высоких значениях, а расстояние – при низких.
Критерий объединения двух объектов в группу требует, что-
бы оба они имели наибольшую корреляцию относительно друг
друга. Возможны также и другие критерии. Так, известен простой
метод образования групп, называемый простым объединением и
основанный на использовании наивысшего коэффициента сходст-
ва между некоторым фиксированным объектом и любым объек-
том группы. Результаты анализа групп этим методом по корреля-
ционной матрице, приведенной в табл. 1.4, изображены на рис.
1.4. Так как объекты вводятся в группу на основании наивысшего
значения коэффициента корреляции с любым объектом, уже при-
надлежащим группе, то теснота связи в этом случае оказывается
более высокой, чем в методах группового объединения. При этом
кроме сжатия дендрограммы, возникают и другие отличия. На-