К сожалению, сам коэффициент r интерпретировать нелегко. Можно, однако,
интерпретировать r
2
как степень уменьшения ошибки в определении Y на
основании значений X, т. е. доля значений Y, которые определяются (или могут
быть объяснены) на основе Х. r
2
обычно представляют как процентную долю
объясненных значений, тогда как (1– r
2
) – долю необьясненных значений. Так, в
нашем примере r значением –0,38 означает, что для тех случаев, которые мы
анализируем, разброс независимой переменной составляет (–0,38)
2
, или около
14%, значений зависимой переменной год обучения.
По причинам, которые находятся за рамками настоящего разговора, определить
статистическую значимость г можно только в том случае, если обе – и
зависимая и независимая – переменные нормально распределены. Это можно
сделать, используя табл. А.5 в Приложении А, для чего нужны следующие
сведения. Во-первых, сам коэффициент г, который, конечно, известен. Во-
вторых, аналогично подсчету χ
2
количество степеней свободы линии регрессии.
Поскольку прямую определяют любые две точки (в нашем случае пресечение
и – первая точка, и пересечение с осью Y – вторая), все другие точки,
обозначающие данные, могут располагаться произвольно, так что df всегда
будет равно (N–2), где N – количество случаев или признаков. Таким образом,
для того чтобы воспользоваться таблицей, нужно определить примерное
количество степеней свободы (в нашем примере N–2 = 25–2 = 23) и
желательный уровень значимости (например, 0,05) так же, как мы делали для
нахождения χ
2
, определить пороговое значение r, необходимое для достижения
данного уровня значимости, и все подсчитать. (В нашем примере это значит,
что мы интерполируем значения в таблице между df=20 и df=25. Для df=23 это
будут следующие значения: 0,3379; 0,3976; 0,5069; 0,6194 соответственно.)
Таким образом, r=–0,38 статистически значим на уровне 0,10 (он превышает
0,3379), но не на уровне 0,05 (он не превышает 0,3976). Интерпретация этого
результата та же, что и в других случаях измерения статистической значимости.
[c.436]
ЗАКЛЮЧЕНИЕ
В этой главе мы познакомили вас с наиболее распространенными
статистическими процедурами, которые используются при изучении
взаимосвязей между двумя переменными. Как и в гл. 14, мы выяснили, что для
разных уровней измерения анализируемых данных подходят разные способы
вычисления связи и статистической значимости. Вместе с методами,
представленными ранее, рассмотренные коэффициенты снабдят исследователя
некоторыми очень полезными основополагающими способами получения
научных результатов. В следующей главе мы обратимся к более сложным
статистическим методикам, которые обогатят наши возможности анализа и
понимание того, что мы изучаем. [c.437]
Дополнительная литература