142
Глава 4. Статистические методы в политическом анализе
В нашем случае R
2
= 0,39 (0,63
2
); это означает, что переменная «доля
сельского населения» объясняет примерно 40% вариации перемен-
ной «поддержка СПС». Чем больше величина коэффициента детер-
минации, тем выше качество модели.
Другим показателем качества модели является стандартная ошиб-
ка оценки (standard error of estimate). Это показатель того, насколько
сильно точки «разбросаны» вокруг линии регрессии. Мерой разброса
для интервальных переменных является стандартное отклонение. Со-
ответственно, стандартная ошибка оценки — это стандартное откло-
нение распределения остатков. Чем выше ее значение, тем сильнее
разброс и тем хуже модель. В нашем случае стандартная ошибка со-
ставляет 2,18. Именно на эту величину наша модель будет «ошибать-
ся в среднем» при прогнозировании значения переменной «поддерж-
ка СПС».
Регрессионная статистика включает в себя также дисперсионный
анализ. С его помощью мы выясняем: 1) какая доля вариации (дис-
персии) зависимой переменной объясняется независимой перемен-
ной; 2) какая доля дисперсии зависимой переменной приходится на
остатки (необъясненная часть); 3) каково отношение этих двух вели-
чин (/^-отношение). Дисперсионная статистика особенно важна для
выборочных исследований — она показывает, насколько вероятно
наличие связи между независимой и зависимой переменными в гене-
ральной совокупности. Однако и для сплошных исследований (как в
нашем примере) изучение результатов дисперсионного анализа не-
бесполезно. В этом случае проверяют, не вызвана ли выявленная ста-
тистическая закономерность стечением случайных обстоятельств,
насколько она характерна для того комплекса условий, в которых на-
ходится обследуемая совокупность, т.е. устанавливается не истин-
ность полученного результата для какой-то более обширной гене-
ральной совокупности, а степень его закономерности, свободы от
случайных воздействий.
В нашем случае статистика дисперсионного анализа такова:
SS
df
MS
F
/>-значение
Регрес.
258,77
1,00
258,77
54,29
o.oooboooooT
Остат.
395,59
83,00
4,77
Всего
654,36
/•"-отношение 54,29 значимо на уровне 0,0000000001. Соответ-
ственно, мы можем с уверенностью отвергнуть нулевую гипотезу (что
обнаруженная нами связь носит случайный характер).
4.5. Регрессионный анализ 143
Аналогичную функцию выполняет критерий t, но уже в отношении
регрессионных коэффициентов (углового и F-пересечения). С помо-
щью критерия t проверяем гипотезу о том, что в генеральной совокуп-
ности регрессионные коэффициенты равны нулю. В нашем случае мы
вновь можем уверенно отбросить нулевую гипотезу.
t
р-значение
Intercpt
19,42
0,0000000000
Сел. нас.
-7,37
0,0000000001
Множественный регрессионный анализ
Модель множественной регрессии практически идентична модели
парной регрессии; разница лишь в том, что в линейную функцию по-
следовательно включаются несколько независимых переменных:
Если независимых переменных больше двух, мы не имеем возмож-
ности получить визуальное представление об их связи, в этом плане
множественная регрессия менее «наглядна», нежели парная. При на-
личии двух независимых переменных данные бывает полезно отобра-
зить на трехмерной диаграмме рассеяния. В профессиональных ста-
тистических пакетах программ (например, Statistica) существует
опция вращения трехмерной диаграммы, позволяющая хорошо визу-
ально представить структуру данных.
При работе с множественной регрессией, в отличие от парной, не-
обходимо определять алгоритм анализа. Стандартный алгоритм
включает в итоговую регрессионную модель все имеющиеся предик-
торы. Пошаговый алгоритм предполагает последовательное включе-
ние (исключение) независимых переменных, исходя из их объясни-
тельного «веса». Пошаговый метод хорош, когда имеется много
независимых переменных; он «очищает» модель от откровенно сла-
бых предикторов, делая ее более компактной и лаконичной.
Дополнительным условием корректности множественной регрес-
сии (наряду с интервальностью, нормальностью и линейностью) яв-
ляется отсутствие мультиколлинеарности — наличия сильных корре-
ляционных связей между независимыми переменными.
Интерпретация статистики множественной регрессии включает в
себя все элементы, рассмотренные нами для случая парной регрессии.
Кроме того, в статистике множественного регрессионного анализа
есть и другие важные составляющие.