определение коэффициентов ковариации и корреляции. Ковариация ("со-
изменение") характеризует взаимозависимость переменных. Ковариация
положительного знака означает прямую связь, отрицательного – обратную
связь. Нулевая ковариация характеризует отсутствие связи или независи-
мость переменных. Но абсолютное значение коэффициентов ковариации
зависит от самой измеряемой величины, что создает трудности при срав-
нении степени связи разных пар переменных. Коэффициент корреляции
лишен этих недостатков, так как он нормирован на стандартные отклоне-
ния. Таким образом, независимо от того, для каких пар признаков мы
находим коэффициент корреляции, его значение лежит в пределах от –1
(строгая обратная связь) до +1 (строгая прямая связь). При линейных
преобразованиях значений переменной величина коэффициента корреля-
ции не меняется.
Наличие корреляции двух переменных отнюдь не означает, что между
ними существует причинная связь. Нельзя сказать определенно, что от
чего зависит, что является причиной, а что следствием. Возможно, что
существует некий скрытый (латентный) фактор, который воздействует на
обе эти переменные. Коэффициент корреляции Пирсона r
xy
, симметричен и
не зависит от перестановки x и y.
Из того, что коэффициент корреляции равен 0, нельзя делать вывод,
что x и y не связаны друг с другом. Возможно, что существует сильная
нелинейная связь. Коэффициент корреляции Пирсона является мерой
степени линейности связи. Поэтому случаи нелинейной связи надо рас-
сматривать отдельно. Часто используют различные преобразования, чтобы
перейти к линейному случаю и дальше уже использовать методы корреля-
ционного и регрессионного анализа.
Если мы имеем дело с N случайными величинами, то можно опреде-
лить совместное N-мерное нормальное (гауссово) распределение. Замеча-
тельная особенность этого распределения состоит в том, что все его свой-
ства определяются исключительно средними значениями каждой перемен-
ной и ковариациями. Так например двумерное нормальное распределение
случайных величин x и y обладает рядом важных свойств:
1. Распределение значений x без учета y, которому они соответствуют,
есть нормальное распределение.
2. Распределение y без учета x, которому они соответствуют, есть нор-
мальное распределение.
3. Для каждого фиксированного значения x, значения y подчиняются
нормальному распределению с дисперсией
2
y,x
, одинаковой для всех x.
4. Для каждого фиксированного значения y, значения x подчиняются
нормальному распределению с дисперсией
2
x,y
, одинаковой для всех y.
5. Средние значения y для каждого отдельного значения x ложатся на
прямую.