– 19 –
Выбор числа компонент k Разведочный анализ. Визуальное оценивание числа
сгустков с помощью целенаправленного проектирования или многомерного шкали-
рования.
Критерий «крутого обрыва» для функции правдоподобия.
Иерархический алгоритм EM ( HEM) .
1.3.2 Метод радиальных базисных функций
До сих пор мы рассматривали задачу разделения смеси распределений, забыв
на время о том, что выборка состоит из объектов разных классов. Теперь вернёмся
к задаче классификации. Пусть каждый класс y имеет свою плотность распределе-
ния p
y
(x), и, соответственно, свою часть выборки X
`
y
= {x
i
∈ X
`
| y
i
= y}.
Гипотеза 1.8 Функции правдоподобия классов p
y
(x), y ∈ Y , представимы в виде
смеси k
y
компонент — n-мерных сферических гауссианов с параметрами µ
yj
, σ
yj
:
p
y
(x) =
k
y
X
j=1
w
yj
p
yj
(x),
k
y
X
j=1
w
yj
= 1, w
yj
> 0;
p
yj
(x) = (σ
yj
√
2π)
−n
exp
¡
−
1
2
σ
−2
yj
kx − µ
yj
k
2
¢
, j = 1, . . . , k, y ∈ Y.
Гипотеза 1.8 — это эвристика, которая часто срабатывает благодаря способ-
ности смеси гауссианов аппроксимировать произвольные непрерывные плотности.
В то же время, существует обширный класс задач, в которых гауссовские смеси
не работают, например, задачи с дискретными признаками.
Гипотеза 1.8 неявно предполагает, что евклидова метрика адекватно оценивает
близость векторов в признаковом пространстве, и близкие объекты чаще принадле-
жат одному классу, чем разным (гипотеза компактности).
Алгоритм классификации Запишем байесовское решающее правило (1.3):
a(x) = arg max
y∈Y
λ
y
P
y
k
y
X
j=1
w
yj
p
yj
(x).
Оно имеет вид суперпозиции, состоящей из трёх уровней (слоёв). Первый слой обра-
зован
P
y∈Y
k
y
гауссианами с параметрами µ
yj
, σ
yj
. На входе они принимают описание
объекта x, на выходе выдают значения плотностей компонент в точке x. Второй слой
состоит из |Y | сумматоров, вычисляющих взвешенные средние с весами w
yj
. На вы-
ходе второго слоя появляются значения плотностей классов в точке x. Третий слой
состоит из единственного блока arg max, принимающего решение о принадлежности
объекта x одному из классов.
Описанная многослойная схема вычислений называется сетью радиальных ба-
зисных функций или RBF-сетью (radial basis functions). Это одна из разновидностей
нейронных сетей.
Обучение RBF-сети Один из самых эффективных способов настройки RBF-сетей
основан на использовании EM-алгоритма. Он сильно выигрывает в производитель-
ности по сравнению с градиентными методами, которые чаще используются для на-
стройки нейронных сетей.