37
Многообразие алгоритмов кластерного анализа обусловлено также
множеством различных критериев, выражающих те или иные аспекты
качества автоматического группирования. Функционалы качества и
конкретные алгоритмы автоматической классификации достаточно полно
и подробно рассмотрены в специальной литературе. Эти функционалы и
алгоритмы характеризуются различной трудоемкостью и подчас требуют
ресурсов высокопроизводительных компьютеров. Разнообразные
процедуры кластерного анализа входят
в состав практически всех
современных пакетов прикладных программ для статистической обработки
многомерных данных.
Поскольку методы кластерного анализа формализованы и дают легко
воспроизводимые способы создания классификаций, они пользуются
широкой популярностью.
Целью изучения кластерного анализа является выявление и
диагностирование состояния объектов (процессов) на основе измерения
нескольких непрерывных переменных.
Все методы классификации состояния процесса
по сходству и
различию соответствующих параметров имеют две главные особенности:
• каждый метод требует количественного определения, или меры,
относительного сходства между состояниями процесса;
• при заданных количественных показателях сходства требуется
алгоритм для вычисления коэффициентов сходства, чтобы обнаружить
однородные группы или классы.
Для любого метода определения сходства при наличии многих
переменных существует ряд различных алгоритмов классификации.
1.12.1. Метод построения эталонов
Для каждого класса
miK
i
,1, = по обучающей выборке строится
эталон
i
E , имеющий значения признаков. Эталон – это усреднённый по
обучающей выборке абстрактный объект. Абстрактным он называется
потому, что может не совпадать не только ни с одним объектом
обучающей выборки, но и ни с одним объектом генеральной совокупности.
Распознавание осуществляется следующим образом. На вход
системы поступает объект
, принадлежность которого к тому или иному
классу системе неизвестна. От этого объекта измеряются расстояния до
эталонов всех классов
miSEd
i
,1),,( = , и система относит объект к тому
классу, расстояние до эталона которого минимально
),(___min, S
i
EdiKS
i
=∈ . Расстояние измеряется в той метрике, которая
введена для решения определённой задачи классификации.
1.12.2. Метод дробящихся эталонов
Этот метод отражает стремление к безошибочному распознаванию
обучающей выборки, с использованием покрытий обучающей выборки