Новосибирск: Изд. Института математики, 2005. — 218 с. — ISBN
5-86134-130-3.
Монография посвящена теоретическим и алгоритмическим вопросам
построения деревьев решений для различных задач анализа данных
(Data Mining). Основное внимание уделено решению проблемы
устойчивости получаемых решений, т.е. изучению зависимости качества
решения от сложности класса распределений, сложности используемого
класса решающих функций и объема выборки.
В книге рассматриваются основные понятия и существующие подходы к решению указанной проблемы. В рамках байесовского подхода
достаточно подробно исследуется поведение критерия качества в случае конечного множества событий для задач распознавания образов. Получены интервальные оценки качества. С использованием оригинального рекурсивного метода построения деревьев решений рассматриваются задачи распознавания образов, регрессионного анализа, группировки объектов, прогнозирования многомерной разнотипной переменной, анализа многомерных разнотипных временных рядов, прогнозирования экстремальных событий. На основе полученных результатов исследования устойчивости формулируется подход к выбору оптимального дерева решений. Кроме этого, рассматриваются методы анализа данных, представленных экспертными логическими высказываниями («знаниями»). Монография позволит студентам, аспирантам и научным работникам ознакомиться с новыми результатами исследований в области анализа данных.
В книге рассматриваются основные понятия и существующие подходы к решению указанной проблемы. В рамках байесовского подхода
достаточно подробно исследуется поведение критерия качества в случае конечного множества событий для задач распознавания образов. Получены интервальные оценки качества. С использованием оригинального рекурсивного метода построения деревьев решений рассматриваются задачи распознавания образов, регрессионного анализа, группировки объектов, прогнозирования многомерной разнотипной переменной, анализа многомерных разнотипных временных рядов, прогнозирования экстремальных событий. На основе полученных результатов исследования устойчивости формулируется подход к выбору оптимального дерева решений. Кроме этого, рассматриваются методы анализа данных, представленных экспертными логическими высказываниями («знаниями»). Монография позволит студентам, аспирантам и научным работникам ознакомиться с новыми результатами исследований в области анализа данных.