взятый индивид совокупности будет отстоять от арифметического среднего (в ту или другую сторону) не менее чем на
три средних квадратичных отклонения, равна приблизительно 0,003.
Всякая математическая формула справедлива, конечно, только при соблюдении тех условий, которые были положе-
ны в ее выводе. Так как эти условия строго никогда ; не соблюдаются, то формулы применяются и при отклонении от
принятых условий, но только, конечно, если эти отклонения не будут очень велики. В практической работе исследуе-
мая выборка из общей совокупности, конечно, никогда не бывала бесконечной, а иногда состояла всего из нескольких
экземпляров. Естественно, что применимость формул классической математической статистики к подобным случаям
вызывала большие сомнения, и, например, в прекрасном руководстве Е. Е. Слуцкого (1912) по теории корреляции не
рекомендовалось вычислять коэффициенты корреляции менее чем для 30 наблюдений, причем и это число устанавли-
валось на глаз. Имелись и работы, прямо доказывавшие, что применимость критериев ошибки, выработанных для вы-
борок большого объема к малым выборкам, приводит к грубо ошибочным суждениям.
Работы Стьюдента (1942) и Фишера (1937а, b) в этом отношении составили эпоху в математической статистике, так
как при соблюдении определенных ограничений (именно наличие закона нормального распределения в генеральной
совокупности) они дали возможность определить вероятность отклонения определенного размера для выборок любо-
го объема. На основе теории составлены таблицы, приводимые во всех новейших руководствах по вариационной ста-
тистике. Из этих таблиц ясно, что если для получения минимальной значимости (доверительная вероятность, равная
0,05) отношение величины к своей средней ошибке должно равняться 1,96 при бесконечном числе испытания, 2,00
при 60 степенях свободы, 2,042 при 30 степенях свободы (разница, как видим, очень небольшая, позволяющая даже
число 30 признавать достаточно большим), то для пяти степеней свободы мы имеем t, равное уже 2,57, для трех—
3,18, для двух — 4,3 и для одной степени свободы (т. е. при наличии, например, только двух исследованных индиви-
дов совокупности) t возрастает до 12,71. Мы видим, что для очень малых выборок совершенно неприложимо правило,
применимое для больших выборок, что точность вывода возрастает пропорционально корню квадратному числа ис-
следованных: выигрыш точности при переходе от одной степени свободы к двум оказывается неизмеримо большим,
почему при простых сопоставлениях работать с одной повторностью совершенно не рекомендуется. При использова-
нии коэффициента корреляции ограничение, выдвигаемое Е. Е. Слуцким (1912) (наличие не менее 30 дат), отпадает.
Можно работать с любым количеством данных, но значимость вывода будет очень различна. Так, если мы имеем сто
наблюдений двух признаков, то коэффициент корреляции между ними, равный 0,19, уже достигает минимального
уровня значимости (доверительная вероятность 0,05 или коэффициент доверия 0,95); при 30 степенях свободы (32
наблюдения двух признаков) для получения того же коэффициента доверия требуется коэффициент корреляции, рав-
ный уже 0,35, при восьми наблюдениях (шесть степеней свободы) — 0,707, при пяти наблюдениях (три степени сво-
боды) — 0,878, при двух степенях свободы — 0,950 и при одной — 0,997. Ясно, что при наличии трех наблюдений
минимально надежный вывод о наличии корреляции можно сделать только в случае исключительно высокой корре-
ляционной связи.
Насколько мне известно, теория малых выборок пользуется бесспорным признанием среди лиц, разбирающихся в
математических основах этой теории. Она же послужила основой для развития всей системы дисперсионного анализа,
чрезвычайно повышающего эффективность и экономичность наших исследований: внимательный читатель в этом
убедится из содержания данной книги. Тем более удивительными являются те возражения, которые выдвигаются в
силу недоразумений авторами обоих указанных руководств по полевому методу, — П. Г. Лобашевым (1939) и П. Н.
Константиновым (1939). Эти авторы выдвигают следующие возражения против теории малых выборок: 1) теория ма-
лых выборок предъявляет чрезмерно строгие требования и часто приводит к тому, что вполне зарекомендовавшие
себя методы оказываются опороченными как недоказанные; 2) теория малых выборок стремится путем математиче-
ских операций улучшить качественно негодный материал; 3) теория малых выборок родилась из стремления постро-
ить опыт на очень мелких делянках. Разберем эти возражения по очереди.
2.1.1. Чрезмерная строгость теории малых выборок
П. Н. Константинов (1939, с. 136) указывает, что, пользуясь таблицей Стьюдента—Фишера, якобы совершенно не-
возможно получить достаточной достоверности вывода при трех повторениях, «между тем каждый опытник знает, что
не только трех, но и двух повторений при оптимальной учетной площади, например, в 0,05—1,0 га, часто достаточно,
чтобы получить совершенно достоверные результаты». Здесь целый ряд недоразумений. Таблица t у П. Н. Константи-
нова приведена только для значений t, не превышающих 6,1, и при таком значении действительно трех повторностей
недостаточно для получения вывода высокой надежности, но сам автор приводит примеры сортоиспытания, где при
трех повторностях t достигает 11,0—14,3 и выводы приобретают высокую статистическую надежность. Очень часто
ссылаются, например у П. Г. Лобашева (1939), на данные Ставропольской станции, где якобы обработка не выявила
надежной разницы даже для вполне оправдавших себя приемов. Эти данные, по-видимому, не попали в печать, и по-
тому о них судить, вообще говоря, трудно, но все такие выводы (ненадежность статистической разницы при несо-
мненном наличии разницы вариантов) объясняются неумелой обработкой материала. В главе о факториальном анали-
зе можно видеть разбор примера, взятого из руководства П. Н. Константинова (1939), где различие урожая для сроков
посева только при выбраковке значительной части материала приводит к выводам удовлетворительной надежности,
при правильной обработке без всякой браковки и при пользовании теорией малых выборок приводит к результатам
исключительной надежности.
Такие неудачные выводы из хорошего материала объясняются двумя основными ошибками: 1) неумением выделить
изменчивость, связанную с повторениями опыта (путем взятия вместо разности средней — средней разности) приме-
нением корреляционного метода или дисперсионного анализа; 2) неумением объединять материал. Например, опыт
велся в течение пяти лет и за каждый год вариант А давал больший урожай, чем вариант В. При неумелой обработке
сравниваются варианты за каждый год порознь, где разность сама по себе ненадежна, и если даже во всех пяти случа-
ях разность одного знака, то такая однозначность результата (которая и служит основанием для вывода о бесспорной