126
В данном разделе приведено описание основных методов, используемых в
статистическом анализе социально-экономических явлений.
Глава 10. Дисперсионный анализ
В § 9.4 была рассмотрена проверка значимости различия выборочных
средних двух совокупностей. На практике часто возникает необходимость
обобщения задачи на случай нескольких (более чем двух) совокупностей. Эта
проблема решается с помощью дисперсионного анализа. Идея дисперсионного
анализа, как и сам термин «дисперсия», принадлежит английскому статистику
Р. Фишеру. Метод был разработан в 1920-х годах.
Дисперсионный анализ позволяет оценивать влияние на количественный
отклик Y неколичественных факторов (X
1
, … , X
n
) с целью выбора среди них
наиболее важных. Такими качественными факторами могут быть тип оборудо-
вания или технологического процесса, вид сырья, способ обработки и другие
условия, влияющие на выходные характеристики изделия.
10.1. Основные понятия дисперсионного анализа
Определение 10.1. Дисперсионный анализ – метод статистического анали-
за, позволяющий определить достоверность гипотезы о различиях в средних
значениях на основании сравнения дисперсий распределений.
В процессе наблюдения за исследуемым объектом качественные факторы
произвольно или заданным образом изменяются. Конкретная реализация фак-
тора (например, определенный температурный режим, выбранное оборудова-
ние или материал) называется уровнем фактора или способом обработки. Мо-
дель дисперсионного анализа с фиксированными (или систематическими)
уровнями факторов называют моделью I, модель со случайными факторами –
моделью II. Благодаря варьированию фактора можно исследовать его влияние
на величину отклика. В настоящее время общая теория дисперсионного анализа
разработана для моделей I.
Пример 10.1. Пусть необходимо выяснить, имеются ли существенные раз-
личия между партиями изделий по некоторому показателю качества, т.е. прове-
рить влияние на качество одного фактора – партии изделий. Если включить в
исследование все партии изделий, то влияние уровня такого фактора система-
тическое (модель I), а полученные выводы применимы только к тем отдельным
партиям, которые привлекались для исследования; если же включить только
отобранную случайно часть партий, то влияние фактора случайное (модель II).
Дисперсионный анализ основан на разложении общей дисперсии (вариа-
ции) отклика на независимые слагаемые, каждое из которых характеризует
влияние того или иного фактора или их взаимодействия. Оценив влияние фак-
торов, дисперсионный анализ позволяет выбрать среди них наиболее важные.