85
11. Критерий Смирнова. 0-гипотеза – распределения дат в выборках иден-
тичны; предполагается взаимная независимость значений, непрерывность рас-
пределений. Используется третий критерий Смирнова, D(m,n) (максимум моду-
лей разниц между эмпирическими распределениями). Критерий обнаруживает
любые различия в выборках (смещение средних, неравенство дисперсий, асим-
метрий). Используются табличные значения [15, стр. 350] при размерах выборок
менее 21 значения, и приближение критерием Колмогорова при больших выбор-
ках.
12. Критерий Ансари-Брэдли. 0-гипотеза – дисперсии выборок равны. Сво-
бодный от распределения ранговый критерий для проверки различия в мерах рас-
сеяния двух выборок произвольного размера. Обе выборки должны иметь извест-
ные и равные медианы; если различие медиан превышает 10%, выборки коррек-
тируются вычитанием выборочных медиан, но в этом случае критерий Ансари-
Брэдли становится
асимптотически свободным от распределения. Используются
методы вычислений, изложенные в [5, стр. 101-108]. Тестовый массив из этой
книги – HOLL2x20.dat, еще один тестовый массив – TWO2x12.dat из книги
И.Гайдышева “Анализ и обработка данных”. В качестве критерия для теста равен-
ства дисперсий используется приближение для больших выборок нормальным
распределением.
13. Критерий Сигела-Тьюки-Уилкоксона. 0-гипотеза – дисперсии выборок
равны. Свободный от распределения ранговый критерий для проверки различия в
мерах рассеяния двух выборок произвольного размера [54, 55].
Если в отношении каких-либо данных критерии не проявляют единодушия,
следует посмотреть график "Гистограммы выборок" и принять субъективное ре-
шение, исходя из характера данных.
Немаловажным этапом анализа является выбор контр-гипотезы, которая
может быть односторонней и двусторонней. Если предполагается
неравенство
средних (дисперсий, ранговых сумм, медиан) – это двусторонняя контр-гипотеза,
для нее используются более "строгие" табличные значения с половинным уров-
нем значимости (например, 0,05/2=0,025); если же исследователь из каких-либо
соображений предполагает, что среднее (дисперсия, ранговая сумма, медиана)
одной выборки
больше среднего (дисперсии, ранговой суммы, медианы) другой
выборки – это односторонняя контр-гипотеза, используются табличные значения
с заданным уровнем значимости, 0,05.