Приложение 4. Уровень значимости и мощность
тестов
Пусть имеются две гипотезы о распределении наблюдений:
H
1
= {F = F
1
}, H
2
=qH
1
= {F 6= F
1
}.
По определению, ошибкой i-го рода теста называется вероятность отвержения
гипотезы H
i
при условии, что на самом деле она верна. Формально,
α
i
= P (не принять H
i
|H
i
верна) .
В нашем случае сложной альтернативной гипотезы специального вида H
2
=qH
1
отвержение H
i
автоматически означает принятие H
j
, поэтому
α
i
= P (принять H
j
|верна H
i
)
Далее, по определению, уровнем (или размером) значимости теста называ-
ется ошибка первого рода, т.е. число α
1
. Мощностью теста называется число
1 − α
2
. В нашем случае
1 − α
2
= 1 − P (принять H
1
|верна H
2
) = P (принять H
2
|верна H
2
) .
Понятно, что мощность есть нечто, что мы бы хотели сделать побольше, а уро-
вень значимости — наоборот, поменьше (об этом не надо забыв ат ь: тест, при
прочих равных, тем лучше, чем меньше уровень значимости). Будем называть
H
1
нулевой гипотезой, H
2
— альтернативной.
Посмотрим на тестирование нулевой гипотезы о незначимости коэффициен-
та в регрессио нной модели. Если t есть расчётное значение статистики, а t
α
есть
α·100%-ная точка распределения Стьюдента, то, как мы знаем, нулевая отверга-
ется при |t| > t
α
. Т.е. нулевая отвергается при «достаточно больших» значениях
статистики. Область, в которой принимается альтернативная гипотеза, назы-
вается критической областью. Заметьте, что процентная точка возрастает при
увеличении уровня значимости, так что область, где принимается нулевая гипо-
теза, расширяется. Интуиция: чем меньше вероятность ошибки перво го рода,
т.е. чем меньше вероятность того, что мы примем неверную альтернативную
гипотезу, тем меньше должна быть критическая область. Если мы вообще не
хотим допускать ошибок первого рода, т.е. требуем, чтобы значимость теста
была равна нулю, то это произойдёт в случае, если t
α
будет достаточно боль-
шой (равной +∞), так чтобы статистика никогда по абсолютному значению её
60