
Но сравнивать непосредственно эти части мы не можем, так как сортов всего два, а повторностей было шесть; из-
вестно же, что дисперсия возрастает пропорционально числу степеней свободы, т. е. числу независимых друг от друга
направлений изменчивости. Сортов имеется два: так как мы берем изменчивость около среднего арифметического, то,
очевидно, что у сортов имеется только одна степень свободы, так как после того, как один из сортов изменился в том
или ином направлении, значение другого сорта определяется точно из значения первого и среднего арифметического
для обоих сортов. Для повторностей мы имеем, очевидно, 5 степеней свободы (6—1), а всего имеем 11 степеней сво-
боды (12—1), таким образом, на ошибку остается 5 степеней свободы Для сравнения разных категорий изменчивости
мы и должны сумму квадратов данной категории изменчивости разделить на соответствующее число степеней свобо-
ды,. и получим средний квадрат, соответствующий данной категории изменчивости. Если, положим, исследуемые
нами варианты (сорта) не представляют между собой существенных различий, то изменчивость, вызванная в нашем
материале сортами, не будет существенно отличаться от чисто случайной изменчивости или изменчивости, связанной
с ошибкой опыта: она может быть несколько меньше или несколько больше, но не превосходить ее во много раз. Вер-
нее говоря, чем больше отношение дисперсии исследуемой нами категории изменчивости и дисперсии ошибки опыта,
тем менее вероятно случайное возникновение такого отношения. Отношение это именуется (тета), и существуют
таблицы Снедекора (приведены у Ю. Л. Поморского, В. И. Романовского, Н. Ф. Деревицкого), по которым можно су-
дить, какова вероятность того, что при данном числе степеней свободы наблюдаемая нами величина могла возник-
нуть в силу чисто случайной изменчивости. В этих таблицах по горизонтальной верхней линии показано число степе-
ней свободы большей вариансы, а по вертикали слева—число степеней свободы меньшей вариансы, и в клетке, нахо-
дящейся на пересечении этих двух граф, мы находим три цифры: верхняя, наименьшая, показывает величину , веро-
ятность случайного возникновения которой при данном числе степеней свободы равна 0.05, вторая — для вероятности
0.01 и третья — для вероятности 0.001. Обычно принимают, что если вероятность случайного возникновения разли-
чий больше 1/20, т. е. если наблюдаемые различия могли возникнуть в силу чисто случайных причин чаще, чем один
раз на двадцать испытаний, то мы вправе считать полученный результат совершенна несущественным. Поэтому зна-
чение тета в верхней строке считается минимальным для того, чтобы признать наличие достаточно существенных
указаний на наличие различий.
Следует отметить, что первоначальным критерием Р. А. Фишера была так называемая функция Z, которая является
не чем иным, как половиной натурального логарифма : так как вычисление гораздо проще вычисления Z, то при-
менение в находит сейчас все большее распространение.
В нашем случае мы имеем чрезвычайно высокие значения теты: 173.57 — для сортов и 246.14 — для повторностей.
Если возьмем цифры для вероятности 0.001, то увидим, что при 1 и 5 степенях свободы достаточна тета, равная
4704, а при 5 и 5 степенях свободы — 29.75. Таким образом, вероятность случайного возникновения различий для
обоих исследованных категорий изменчивости (рост и повторность) является исчезающе малой и надежность разли-
чий между повторностями доказывается даже сильнее, чем для сортов. Не следует, конечно, думать, что путем дис-
персионного анализа мы получаем более надежное различие, чем путем примененных ранее способов (второй и тре-
тий): там использовалась функция t — отношение средних ошибок, а здесь функция — отношение квадратов сред-
них ошибок, Для сортов, где имеется всего одна степень свободы, требуемая тета, в частности, равна квадрату t и мы,
следовательно, получаем
, в точности совпадающее с величиной, полученной вторым и третьим спо-
собами. Таким образом, анализ вариансы дает в данном случае то же, что и второй способ, несколько уступая по точ-
ности третьему способу (поскольку там ошибка основана на 9, а не на 5 степенях свободы), но зато имеет перед треть-
им способом два преимущества: 1) дает возможность судить об изменчивости и по повторностям; 2) может приме-
няться не только для парных сопоставлений, но и для таких, где испытывается одновременно большое число вариант,
в этом .последнем случае преимущества анализа вариансы становятся совершенно очевидными.
Из таблицы 6 анализа вариансы можно показать и путь, соответствующий первому способу. В этом случае мы сме-
шиваем две категории изменчивости по повторностям и ошибку, т. е. суммируем (согласно основной теореме адди-
тивности вариансы) 1723 и 7. Получаем 1730, соответствующую 10 степеням свободы или 173 на одну степень свобо-
ды (средний квадрат). Деля на 173 средний квадрат по сортам (243), получим =1,405 или
, опять-
таки совпадающее с полученным первым способом.
Анализ вариансы не является, таким образом, каким-то математическим измышлением, придуманным для того,
чтобы «вымучить» из материала выводы, недоступные другим методам это — обобщение и расширение известных
методов на случаи, где прежние методы непосредственно не могли прилагаться.
Вместе с тем сразу выясняется и еще крупное достоинство .дисперсионного анализа — он позволяет маневрировать
при определении размеров средней ошибки. В самом деле, изменчивость, связанная с повторностью, выделяется нами
в особую категорию, потому что часто, как в данном случае, она смазывает различия испытываемых нами вариантов.
Этим путем в данном случае мы огромную часть изменчивости, смешанную при вычислении по первому способу с
ошибкой, выделяем в особую категорию, и хотя число степеней свободы тоже уменьшается, но выигрыш в надежно-
сти выводов получается чрезвычайно большой. Но если бы анализ вариансы показал, что средний квадрат, соответст-
вующий повторностям, не больше или немногим больше, чем средний квадрат ошибки, то это означало бы, что нет
существенной разнородности в пределах повторности, что эта изменчивость тоже по существу случайная и, следова-
тельно, мы имеем право объединить обе эти категории: выигрыш будет заключаться в том, что объединенная измен-
чивость при том же или немногим большем среднем квадрате будет базироваться на большом числе степеней свобо-
ды.
Проделанный выше способ вычислений с возведением в квадрат оригинальных дат и с внесением потом значитель-
ной поправки наиболее удобен тогда, когда в нашем распоряжении имеются счетные машины (арифмометры или кла-
вишно-счетная машина КСМ с электрическим приводом). Тогда большие размеры поправки нас не могут смущать, и
все вычисления проходят очень быстро. Если мы работаем без машины, то следует избегать оперировать с многознач-