Гл.
8. Линейная
регрессия
259
совокупности
—
линейная. Шанс получения выборочной совокупности, в которой
связь линейна, из генеральной совокупности, в которой связь не линейна, умень-
шается по мере увеличения размера выборки. Коэффициент корреляции оценива-
ется с помощью t-критерия:
HQ:
Между переменными х и у не существует линейной связи, иначе говоря,
независимая переменная х не помогает в предсказании значений у, т.е. р=0.
Hj:
р * О, т.е. между переменными х и у существует некая линейная связь, х
помогает в прогнозировании у.
Используя эти альтернативные гипотезы, мы получим двусторонний критерий.
Если бы мы решили, что р должна
быть
только положительным, то Н^: р>0 и мы
использовали бы односторонний критерий:
лГ^
А
(1 - гЪ
Количество степеней свободы равно (п-2), так как мы рассчитали х и у для
нахождения г, используя две степени свободы, п
—
число пар значений выборки.
Если бы нам понадобилось провести испытание при
5%-ном
уровне значимости,
используя двусторонний критерий, полученное значение критерия нужно сравнить
с to_o25,(n-2) ""3 Приложения 2.
Для того чтобы проиллюстрировать наши действия, вернемся к примеру 8.1.
Мы получили значение коэффициента корреляции
1=0,958.
Тогда значение критерия:
,.^1Ж4.лга|-9,45.
(1 -
0,958^)
0,082
Количество степеней свободы: (10-2) = 8
По таблицам Приложения 2 находим: tg
025,8
~ 2,306.
Рассчитанное значение критерия (9,45) оольше, чем 2,306. Поэтому мы отверг-
нем Но на
5%-ном
уровне значимости и выберем гипотезу Hj, т.е. мы в праве
предположить, что коэффициент корреляции в генеральной совокупности не равен
нулю,
и что между временем и расстоянием существует линейная связь. Этот
результат можно было предвидеть, учитывая высокое значение коэффициента
корреляции г.
КРИТЕРИЙ ПРОВЕРКИ ГИПОТЕЗЫ О СВЯЗИ НА ОСНОВЕ ПОКАЗАТЕЛЯ
НАКЛОНА ЛИНИИ РЕГРЕССИИ
В простой линейной регрессии критерий показателя наклона — коэффициента
регрессии, выполняет те же функции, что и критерий коэффициента корреляции.
Поэтому мы проводим либо испытание г, либо Ь, но не оба сразу. В уравнении
множественной регрессии, где имеется коэффициент регрессии для каждой неза-
висимой переменной, необходимы оба критерия, и они выполняют различные
функции.
HQ:
Между переменными нет линейной связи и х не помогает в прогнозе у,
т.е.
р=0.