Российское хемометрическое общество http://rcs.chph.ras.ru/,
2011
В этом документе рассмотрены наиболее популярные методы классификации, применяемые в хемометрике. Текст ориентирован, прежде всего, на специалистов в области анализа экспериментальных данных: химиков, физиков, биологов, и т.д. Он может служить пособием для исследователей, начинающих изучение этого вопроса. Продолжить исследования можно с помощью указанной литературы.
В пособии интенсивно используются понятия и методы, описанные в других материалах по хемометрике: статистика, матрицы и векторы, метод главных компонент. Читателям, которые плохо знакомы с этим аппаратом, рекомендуется изучить, или, хотя бы просмотреть, эти материалы. Кроме того, здесь интенсивно используется специальная надстройка (Add-In) к программе Excel, которая называется Chemometrics.xla. Подробности об этой программе можно прочитать в пособии Проекционные методы в системе Excel.
Изложение иллюстрируется примерами, выполненными в рабочей книге Excel Irix.xls, которая сопровождает этот документ. Предполагается, что читатель имеет базовые навыки работы в среде Excel, умеет проводить простейшие матричные вычисления с использованием функций листа, таких как МУМНОЖ, ТЕНДЕНЦИЯ и т.п.
В отличие от других пособий из серии, здесь не удается один раз провести проекционные вычисления, а затем использовать их в разных методах. Поэтому некоторые листы книги Iris.xls не будут работать без использования Chemometrics Add-In.
Содержание
Введение
Базовые сведения
Постановка задачи
Обучение: с учителем и без
Типы классов
Проверка гипотез
Ошибки при классификации
Одноклассовая классификация
Обучение и проверка
Проклятие размерности
Подготовка данных
Данные
Пример
Данные
Рабочая книга Iris.xls
Анализ данных методом главных компонент
Классификация "с учителем"
Линейный дискриминатный анализ (LDA)
Квадратичный дискриминатный анализ (QDA)
PLS дискриминация (PLSDA)
SIMCA
K-ближайших соседей (KNN)
Классификация без учителя
Опять PCA
Кластеризация с помощью k-средних (kMeans)
Заключение
Файл в формате *.mht
В этом документе рассмотрены наиболее популярные методы классификации, применяемые в хемометрике. Текст ориентирован, прежде всего, на специалистов в области анализа экспериментальных данных: химиков, физиков, биологов, и т.д. Он может служить пособием для исследователей, начинающих изучение этого вопроса. Продолжить исследования можно с помощью указанной литературы.
В пособии интенсивно используются понятия и методы, описанные в других материалах по хемометрике: статистика, матрицы и векторы, метод главных компонент. Читателям, которые плохо знакомы с этим аппаратом, рекомендуется изучить, или, хотя бы просмотреть, эти материалы. Кроме того, здесь интенсивно используется специальная надстройка (Add-In) к программе Excel, которая называется Chemometrics.xla. Подробности об этой программе можно прочитать в пособии Проекционные методы в системе Excel.
Изложение иллюстрируется примерами, выполненными в рабочей книге Excel Irix.xls, которая сопровождает этот документ. Предполагается, что читатель имеет базовые навыки работы в среде Excel, умеет проводить простейшие матричные вычисления с использованием функций листа, таких как МУМНОЖ, ТЕНДЕНЦИЯ и т.п.
В отличие от других пособий из серии, здесь не удается один раз провести проекционные вычисления, а затем использовать их в разных методах. Поэтому некоторые листы книги Iris.xls не будут работать без использования Chemometrics Add-In.
Содержание
Введение
Базовые сведения
Постановка задачи
Обучение: с учителем и без
Типы классов
Проверка гипотез
Ошибки при классификации
Одноклассовая классификация
Обучение и проверка
Проклятие размерности
Подготовка данных
Данные
Пример
Данные
Рабочая книга Iris.xls
Анализ данных методом главных компонент
Классификация "с учителем"
Линейный дискриминатный анализ (LDA)
Квадратичный дискриминатный анализ (QDA)
PLS дискриминация (PLSDA)
SIMCA
K-ближайших соседей (KNN)
Классификация без учителя
Опять PCA
Кластеризация с помощью k-средних (kMeans)
Заключение
Файл в формате *.mht