ОЦЕНКА ЗАВИСИМОСТИ МЕЖДУ ПРИЗНАКАМИ
Изложенные выше методы статистического анализа дают возможность
изучать изменчивость биологических объектов по отдельным признакам –
весу, размерам, плодовитости, физиологическим показателям и др. Однако в
ряде случаев важно знать, какова зависимость между вариацией двух или не-
скольких признаков, изменяются ли две переменные самостоятельно, незави-
симо друг от друга, или варьирование одного признака в какой-то степени
связано с изменчивостью другого. В качестве второй переменной часто вы-
ступает какой-либо фактор среды.
Задачу исследования зависимостей можно рассматривать как развитие
метода дисперсионного анализа, решающего задачу сравнения нескольких
выборок, т. е. изучающего влияния фактора на признак. Техника дисперси-
онного анализа имеет две особенности. Фактор (или факториальный признак)
задан дискретно, в виде градаций, или «доз». Когда исследуется фактор, за-
данный качественно, то разбиение на градации всего диапазона его действия
оказывается очень эффективным способом создания подобия количественной
переменной. Но при изучении количественно заданного фактора в грубой
градуальной схеме дисперсионного анализа утрачивается часть информации,
которая содержится в исходных выборках и которую можно было бы исполь-
зовать. Кроме этого, дисперсионный анализ явным образом не учитывает
тенденции изменения среднего уровня признака при изменении уровня фак-
тора, не содержит показателя характера (знака) зависимости признака от
фактора. Все эти «недостатки» дисперсионного анализа не характерны для
методов изучения сопряженной изменчивости – корреляционного и регрес-
сионного анализов.
Способ представления отдельных наблюдений здесь меняется: каждая
варианта рассматривается как носитель двух численных характеристик объ-
екта измерения, двух зависимых значений случайной величины. Если выше
мы отождествляли отдельное значение с отдельной вариантой, то теперь мы
рассматриваем варианту как некоторое тело, обладающее минимум двумя за-
регистрированными качествами, различными у разных вариант:
Например, для любого животного можно определить массу (M) и длину
(L) тела; отдельная варианта будет нести два значения (L, M). При этом мно-
жество вариант выборки можно отобразить графически как точки на плоско-
сти осей двух признаков M и L. Вся выборка предстанет в виде множества
точек на плоскости (двумерное рассеяние). Как видно на диаграмме (рис. 10),
«облако» вариант вытянуто в направлении диагонали облака точек. Справа
вверху находятся варианты с высокими значениями и размеров, и массы тела,
в левом нижнем углу – с наименьшими значениями. В центре расположены
варианты с промежуточными, средними значениями.
x
x
x