7
Начальные сведения по математической статистике
Кафедра высшей математики КузГТУ Конспекты проф. Д. В. Алексеева
Проверка гипотезы о законе распределения
Для проверки гипотезы о законе распределения результатов измерений используется
представление выборки в сгруппированном виде, называемом гистограммой. Это пред-
ставление данных строится следующим образом:
Выбирается тестируемый (гипотетический) закон распределения (в рассматривае-
мом случае базовой модели это нормальное распределение
с парамет-
рами, оцененными по исходной выборке).
Интервал допустимых значений случайной величины разбивается на несколько ин-
тервалов, - «карманов».
Подсчитываются «наблюдаемые частоты», - число элементов выборки, попадаю-
щих в каждый из карманов.
На основе тестируемого закона распределения вычисляются «расчетные часто-
ты», - число элементов выборки, попадающих в каждый карман.
Проводится сравнение наблюдаемых и расчетных частот.
Сгруппированные данные выборки наглядно представляются в виде системы прямоуголь-
ников, ступенчатой фигуры, называемой гистограммой. Ширина основания отдельного
прямоугольника равна ширине кармана, а его площадь, - частоте попаданий данных в
карман (наблюдаемой или расчетной).
Проблема выбора числа карманов и их ширины является достаточно нетривиальной. Не-
правильный выбор карманов может полностью обесценить результаты статистического
сравнения расчетных и наблюдаемых частот.
Для нормального распределения, и других распределений непрерывных и неограничен-
ных случайных величин, карманы выбирают на основе рекомендаций У. Кокрена:
Число карманов определяется объемом выборки по правилу
,
Границы крайних карманов (для распределений неограниченных случайных вели-
чин) определяются условием: «расчетная частота попадания в крайний карман
равна единице»,
Все остальные карманы имеют равную ширину.
Перечисленные рекомендации опираются на большой опыт практического тестирования
гипотез о законе распределения.
Статистический критерий сравнения наблюдаемых и расчетных частот опирается на рас-
смотрение случайной величины
m
k
k
kk
np
npn
1
2
2
ˆ
ˆ
,
которая характеризует суммарное квадратичное отклонение наблюдаемых частот
от
расчетных частот
(
p F a F a
k k k
( ) ( )
1
, - вероятность попадания элемента вы-
борки в карман с границами
, рассчитываемая по функции распределения тести-
руемого закона). В частности, для нормального распределения левая граница крайнего ле-
вого кармана равна
, а правая граница крайнего правого кармана, -
.
Случайные величины
описывают число попаданий элементов выборки в k-й карман.
Из
случайных величин
только
являются независимыми, что обусловлено