11
С. Н. Грицюк, Е. В. Мирзоева, В. В. Лысенко
Если число кластеров заранее не задано и неизвес-
тны их типичные представители, то их число прини-
маем условно равным С. Каждый из объектов следует
отнести к тому из С-классов, с которым он имеет ми-
нимальную (по сравнению с другими классами) вели-
чину функции близости (расстояния).
Так как во втором случае число С неизвестно, оно
подбирается методом перебора. Этот метод включает:
•
определение функции расстояния каждого объек-
та с каждым (Ф
jk
);
•
установление порогового значения функции рас-
стояния (Ф
пор
);
•
объединение объектов в один кластер, когда рас-
стояние между ними меньше, чем пороговое. В ре-
зультате объединения получается некоторое число
кластеров, но часть объектов может остаться вне
кластеров;
•
нахождение центров тяжести по сформированным
кластерам;
•
определение функции близости между центрами
тяжести образованных кластеров, между центра-
ми тяжести и значением признаков по отдельным
объектам, между необъединенными объектами.
Принцип последующего объединения остается
прежним: объединение проводится при меньшем
значении функции расстояния, чем пороговое зна-
чение. Процесс объединения завершается, когда
все значения функции расстояния будут больше,
чем пороговое значение. Классификацию на осно-
ве перебора можно осуществить и без установле-
ния порогового значения. По такому алгоритму на
этом шаге итерации объединяются в один кластер
два (несколько) объекта, имеющие минимальную
величину функции расстояния. На втором шаге
находится центр тяжести по образованному клас-
теру и вновь определяются значения функции
расстояния. Объединяются объекты (кластеры) с
минимальным значением функции расстояния. На