21
2. С использованием литературных источников, перечисленных в конце
настоящих методических указаний, составить краткое описание
алгоритмов решения задач:
2.1. подготовка данных для автоматизированного анализа
(алгоритмы очистки данных, объединения и
трансформации, понижения порядка, нахождения
«выбросов» (Outlier Detection));
2.2. классификации и регрессии (1R-алгоритм, Naive Bayes,
алгоритмы построения деревьев решений: TDIDT, ID3, C4.5);
2.3. поиска ассоциативных правил
(алгоритм Apriori);
2.4. кластеризации (агломеративные и дивизимные алгоритмы,
алгоритм k-means, BIRCH-алгоритм, CLIQUE-алгоритм
кластеризации данных с высокой размерностью).
2.5. Text Mining (алгоритмы определения новизны текста (Novelty
Mining), алгоритмы определения событий и тенденций (Event,
Trend Detection) ).
СОДЕРЖАНИЕ ОТЧЕТА
Краткие теоретические сведения по теме работы, необходимые для ее
выполнения, включая определение терминов и описание используемых
понятий.
СПИСОК
ЛИТЕРАТУРЫ
1. Bramer M. Principles of Data Mining / M. Bramer. – London: Springer-
Verlag London Limited, 2007. – 342 p.
2. Chakrabarti S. Data Mining: Know it All / S. Chakrabarti et al. – Burlington:
Morgan Kaufmann Publishers by Elsevier Inc., 2009. – 477 p.
3. Han J. Data Mining: Concepts and Techniques / J. Han, M. Kamber. – San
Francisco: Elsevier Inc., 2006. – 772 p.
4. Maimon O. Data Mining And Knowledge Discovery Handbook / O.
Maimon, L. Rokach. – New York: Springer Science+Business Media, Inc.,
2005. – 1378 p.
5. Michael W. Berry Text Mining : Applications and Theory / M. Berry, J.
Kogan. – Cornwall: John Wiley & Sons, Ltd, 2010. – 223 p.