1) предполагает пересчет центра тяжести кластера после каждого изменения
его состава;
2) лишь после того, как будет завершен пересмотр всех данных.
В обоих случаях итеративный алгоритм этого метода минимизирует внутри
каждого кластера.
Т6 1. Классификация с обучением
Дискриминантный анализ как раздел многомерного статистического
анализа включает в себя статистические методы классификаций
многомерных наблюдений ситуаций, когда исследователь наблюдает так
называемыми обучающими выборками (классификация с «учителем»). В
общем случае задача различения (дискриминаций) формулируется
следующим образом. Пусть результатом наблюдения над объектом является
реализация К-мерного случайного вектора:
Х=(Х
1
, Х
2
,…Х
n
)
T
.
Требуется установить правила согласно которому по наблюдаемому
значению вектора Х объект относят к одной из возможных совокупностей П
i
I=1,2,3,…l. Для построения правила дискриминации всё выборочное
пространство R значений вектора Х разбивается на области R
i
=(1,2,..l). Так
что при попадании Х в R
i
объект относят к совокупности П
i
. Правило
дискриминации выбирается в соответствии с определенным принципом
оптимальности. На основе априорной информации о совокупности Р
i
извлечение объекта из П
i
при этом следует учитывать размер убытка от
неправильной дискриминации. Априорная информация может быть
представлена либо в виде некоторых сведений, а функции К-мерного
распределения признаков в каждой совокупности либо в виде выборов из
совокупностей.
Постановка задачи дискриминантного анализа в случае когда исходная
информация о распределении представлена выборка из них (наиболее важная
ситуация в дискриминантном анализе).
Пусть Х
1
(i)
, Х
2
(i)
,…Х
J
(i)
,…Х
ni
(i)
выборка совокупностей П
i
i=(1,l), j=(1,n
i
).
Причем каждый j объект выборки представлен К-мерным вектором
параметров:
X
J
(i)
=(X
i1
(i)
, X
i2
(i)
,…,X
iq
(i)
,….,X
ik
(i)
)
Произведено дополнительное наблюдение Х=(Х
1
,…,Х
к
)
т
над объектом,
который принадлежит одной из совокупностей П
i
. Требуется построить
правило отношения наблюдения Х к одной из этих совокупностей.
Обычно в задаче различения переходят от вектора-признака,
характеризующий объект линейной функции от них, дискриминантные
функции – гиперплоскости, наилучшим образом разделяющей совокупность
выборочных точек.
Т6 2. Линейный дискриминантный анализ(ЛДА)
Предположения линейного ДА
1) имеются различные классы объектов.