• формат doc
  • размер 701,50 КБ
  • добавлен 28 декабря 2011 г.
Геппенер В.В. Анализ и интерпретация данных
Санкт-Петербургский государственный электротехнический университет, 2008, 101с.
Содержание
Введение в анализ данных
Проблема обработки данных
Матрица данных
Гипотеза компактности и скрытых факторов
Структура матрицы данных и задачи обработки
Матрица объект – объект и признак – признак, расстояние и близость
Измерение признаков
Основные типы шкал
Классификация данных
Постановка задачи
Статистические методы классификации
Постановка задачи классификации как статистической задачи при известных вероятностных распределениях
Построение классификации для нормального распределения
Числовые примеры
Оценка качества классификации
Классификация на основе оценки апостериорной вероятности
Классификация двух нормальных распределений с неравными матрицами ковариации
Классификация нормально распределенных векторов при неизвестных параметрах распределения
Задача статистической классификации для количества классов больше
Линейная дискриминантная функция Фишера
Обучаемые классификаторы. Детерминистский подход
Общие свойства линейных дискриминантных функций в детерминистской постановке
Персептронный алгоритм получения линейных решающих правил
Правила поиска решения, основанные на минимизации градиента функции качества
Формальный вывод персептронного алгоритма
Кластерный анализ
Постановка задачи группировки данных
Пример
Критерии качества разбиения на классы
Основные типы кластерных процедур. Основные задачи кластерного анализа
Построение последовательной процедуры итеративной оптимизации
Базовая процедура кластеризации (базовая минимальная квадратичная ошибка)
Параллельная процедура. Базовые изоданные
Описание процедуры: Базовые изоданные
Алгоритм К - внутригрупповых средних (это базовые и заданные)
Иерархические процедуры группировки
Агломеративная процедура
Статистические модели группировки
Алгоритм автоматической классификации на основе использования кластер-анализа
Методы снижения размерности
Методы отбора признаков по заданному критерию
Метод главных компонент
Факторный анализ
Модель факторного анализа
Структура факторных уравнений
Неоднозначность факторного решения
Метод главных факторов
Метод центроидных факторов
Многомерное шкалирование
Дистанционная модель для различий
Модель Торгерсона
Поворот
Объективные повороты
Ручные повороты
Размерность
Интерпретация
Выводы
Литература