играет
инициатива
исследователя.
В
литературе
описаны
сотни
методов
кластерного
анализа
.
Многообра
'
зие
их
проистека
'
ет
из
того,
что
выявле
ние
кластеров
во
многих
отношениях
.является
«искусством:.
.
Многие
из
тех,
кто
использует
приемы
этого
анализа,
сами
создают
новый
метод
.
Разновидности
кла
'
стерного
а
'
на
'
лиза
определяются
многими
причина
·
ми.
Они
связаны
как
с
хара
'
ктером
а
'
нализируемых
данных,
так
и
с
приема
'
ми
образования
групп
по
количественному
сходству
.
Среди
показателей
количественного
сходства
следует
в
первую
очередь
выделить
меру
сходства
или
меру
расстояния
между
объектами
либо
кластерами
.
На
этой
мере
построено
большинство
алгоритмов
кластери
зации
.
В
этом
случае
классифицируемые
образы
задаются
в
виде
числовых
векторов
.
I(роме
подхода,
основанного
на
понятии
расстояния
,
исполь
зуются
и
другие.
В
частности,
возможен
теоретико-графовый
подход,
связанный
с
использованием
ряда
фундаментальных
понятий
теории
графов
.
В
литературе
описано
много
мер
сходства,
в
основу
которых
положено
понятие
расстояния.
I(ла
'
стеры
выбираются
так,
чтобы
расстояния
между
отдельными
образами
в
каждом
кластере
минимизировались
,
а
расстоя
ния
между
образами,
относящимися
к
двум
разным
классам,
были
как
можно
больше
.
Эти
меры
основаны
на
геометрических особенностях
кластеров
в
многомерном
пространстве
и
могут
быть
охарактеризованы
расстоянием
между
центрами
.
кластеров,
количеством
образов
,
вошедших
в
каждый
кластер,
внутрикластерными
и
межкластерными
дисперсиями,
ближайшим
и
наиболее
удаленным
от
центра
кластера
образами,
мини
мальным
,
и
максимальным
расстояниями
между
кластерами
и
т
.
д.
I(ритерии
кластериза
"
ции
весьма
разнообразны,
что
порождает
в
свою
очередь
множество
методов
анализа
.
I(ритерии
.
кластеризации
либо
.вос
производят
некие
эвристические
соображения,
либо
основываются
на
ми
нимизации
(или
максимизации)
какого-либо
показателя
качества.
В
кластерном
анализе
не
существует
однозначного
количественного
крите
рия,
подобного
ошибке
кла
'
ссификации
в
дискриминантном
а
·
нализе.
При
эвристическом
подходе
решающую
роль
играют
интуиция
и
опыт
.
При
та
'
ком
подходе
предусматривается
задание
набора
правил,
которые
обес
печивают
использование
выбранной
меры
сходства
для
отнесения
образов
к
одному
из
кла
·
стеров
.
Евклидово
расстояние
хорошо
приспособлено
для
подобного
подхода
.
Этими
пра
'
вила
'
ми,
на
'
пример,
может
диктова
'
ться
отнесение
двух
объ
ектов
к
одному
классу,
если
расстояние
между
ними
не
превышает
неко
торой
пороговой
величины,
которая
тем
самым
определяет
максимально
допустимый
диаметр
подмножества,
образующего
кластер
.
Может
быть
также
использовано
правило,
согласно
которому
среди
всех
возможных
объединений
кластеров
(а
'
ими
могут
быть
и
отдельные
объекты)
выби
раются
такие
два,
что
максимальное
расстояние
между
точками
одного
кластера
и
точками
другого
минимально
(алгоритм
максиминного
рас
стояния).
Таких
примеров
можно
привести
много.
Подход
к
кластериза
'
ции,
предусма
'
трива
'
ющий
использование
пока
за
'
теля
ка
'
чества
'
,
связа
'
н
с
ра
'
зра
'
боткой
процедур,
которые
обеспечива
'
ют
минимиза
'
цию
"
или
ма
'
ксимиза
'
цию
выбра
'
нного
пока
'
за
'
теля
ка
·
чества
·
.
Од-
178