
8. ( )
§ 1. `m`khg jnppek“0hnmmni l`Šph0{
leŠndnl jnppek“0hnmm{u oke“d
Этот метод относится к группе методов, включающих
в себя самые простые приемы изучения структуры иссле-
дуемых систем. Впервые его применил в 1925 г. для ана-
лиза геохимических систем П.В.Терентьев и назвал мето-
дом корреляционных плеяд. В 1944 г. этот метод в несколь-
ко модифицированном виде был предложен Ф.Сэттэлом и
назван методом ветвящихся связей.
Метод удобнее описывать в терминах теории графов.
Определим для этого некоторые основные понятия.
Пусть дано конечное множество А = {а
1
а
2
, ..., а
n
},
между элементами которого существует вполне опреде-
ленное соотношение R
g
. Каждому элементу а
i
можно по-
ставить в соответствие точку на плоскости. Любые две
точки а
k
и а
l
соединим прямыми, если выполняется между
ними соотношение а
k
R
g
а
l
. Полученная таким образом гео-
метрическая схема называется графом G(А). Элементы
множества А называют вершинами графа, а соединяющие
их линии - ребрами. Различают неориентированные ребра,
если отношение R
g
симметрично, и ориентированные реб-
ра, если R
g
антисимметрично. Ориентированные ребра на-
зывают еще дугами, на схеме их обозначают линией со
стрелкой. Неориентированное ребро всегда можно пред-
ставить в виде двух противоположно ориентированных
дуг. С этой точки зрения графы можно разделить на нео-
риентированные (к ним относятся и графы, построенные
по корреляционной матрице), ориентированные и сме-
шанные.
Вершины а
k
и а
l
, соединенные ребром g
kl
, называют
смежными. Говорят, что вершины а
k
и а
l
инциндентны
ребру g
kl
, и наоборот, ребро g
kl
инциндентно вершинам а
k
и а
l
. Вершина, которая не инциндентна никакому ребру,
называется изолированной,а соответствующий граф - нуль-
графом.
Если все вершины смежные и при этом реализованы
все возможные для данного набора вершин соединения, то
граф называется полным. Последовательность ребер {...,
g
kl
, g
lm
, ...}, позволяющая обойти более чем две вершины,
называется цепью. Цепь называется элементарной, если в
ней ни одна из вершин не повторяется дважды. Последо-
вательность вида {g
kl
... g
mk
} называется циклом.
Условимся, что если все множества точек разбиты на
изолированные цепи, циклы и графы, то такие множества
будем называть подграфами G
(1)
(А), G
(2)
(А), ..., G
(n)
(А)
графа G(А).
Если теперь элементы корреляционой матрицы пред-
ставить вершинами, отношение R
g
положить равным r
a
,
критическому значению выборочного коэффициента кор-
реляции
1
, то, заменяя |ℜ
ij
|, которые больше r
a
, единицами,
а все остальные - нулями, получим матрицу смежности G,
состоящую из групп нулей и единиц.
Если получилось так, что каждый из элементов матри-
цы смежности равен единице, то граф G(А), построенный
на основе данной матрицы, будет полным, и, следователь-
но, можно сделать вывод, что все элементы множества А
принадлежат одному классу.
Последний может рассматриваться либо как класс
эквивалентности, если судить о нем с позиции матрицы
смежности, либо как класс толерантности, если помнить,
что исходные выборочные коэффициенты корреляции не
обладают свойством транзитивности.
Есть другой предельный вариант, когда вся матрица
смежности G состоит из нулей, т.е. все вершины G(А) изо-
лированы, что ведет к построению нуль-графа. Тогда весь
набор экспериментальных данных разбивается на р клас-
сов, каждый из которых состоит только из одного элемен-
та а
ij
. Однако на практике чаще всего наблюдается ситуа-
ция, как бы промежуточная между описанными. В этом
случае встает вопрос о выделении обособленных групп,
решение которого частo оказывается сложной проблемой
и, заметим, большей частью неоднозначно.
Эта трудность связана с нетранзитивностью коэффици-
ентов выборочной корреляции ℜ, что ведет к многовари-
антности результатов группирования.
Анализ матрицы смежности G целесообразно начать с
выделения компонент связности. Если последние будут
полными подграфами, то они одновременно будут считать-
ся максимальными. В этом случае имеем для выбранного
порогового значения r
a
однозначное разбиение множества А
на классы связности.
Здесь возможны два варианта продолжения анализа.
Первый ориентируется на матрицу смежности G и вклю-
чает алгоритм нахождения полных подграфов. Другой ос-
нован на применении коэффициентов Танимото и описан
в работе Р.Бонера [1969], его рассмотрим более подробно.
На базе уже построенной матрицы G сформулируем
максимально обособленные группы. Для этого будем рас-
сматривать матрицу G как совокупность таких р векторов
g
1
, g
2
, ... g
з
, в которых g
k
= {g
1k
, g
2k
, ..., g
nk
}, и введем меру
близости между парами подобных векторов, основанную
на коэффициенте Танимото:
1
Критическое значение выборочного коэффициента корреляции r
a
можно
положить равным уровню значимости по любому из критериев Фишера
(табл. 7.8) для соответствующего количества N экспериментальных дан-
ных.
133