(24
Глава 4. Статистические методы в политическом анализе
Таким образом, у нас есть две переменные — «поддержка СПС в
1999 г.» и «поддержка "Яблока" в 1999 г.», простейшим образом
операционализированные через процент голосов, поданных за эти
партии, от числа избирателей, принявших участие в голосовании
на федеральных парламентских выборах 1999 г. В качестве случаев
выступают соответствующие данные, обобщенные на уровне реги-
онов РФ.
Далее, в нашем распоряжении есть методический прием, кото-
рый является одним из основных в статистике, — геометрическое
представление. Геометрическим представлением называют представ-
ление случая как точки в условном пространстве, формируемом
«осями» — переменными. В нашем примере мы можем представить
каждый регион как точку в двухмерном пространстве голосований за
правые партии. Ось X формирует признак «поддержка СПС», ось
Y— «поддержка "Яблока"» (или наоборот; для корреляционного
анализа это неважно в силу неразличения зависимых и независимых
переменных). «Координатами» региона будут: по оси X — значение
переменной «поддержка СПС» (процент, набранный в регионе дан-
ной партией); по оси Y— значение переменной «поддержка "Ябло-
ка"». Так, Республика Адыгея будет иметь координаты (3,92; 4,63),
Республика Алтай — (3,38; 5,4) и т.д. Осуществив геометрическое
представление всех случаев, мы получаем диаграмму рассеяния, или
корреляционное поле.
Даже сугубо визуальный анализ диаграммы рассеяния наводит
на мысль, что совокупность точек можно расположить вдоль неко-
торой условной прямой, называемой линией регрессии. Математи-
4.3. Корреляционный анализ
125
чески линия регрессии строится методом наименьших квадратов
(высчитывается такое положение линии, при котором сумма квад-
ратов расстояний от наблюдаемых точек до прямой является мини-
мальной).
Интенсивность связи будет зависеть от того, насколько тесно
точки (случаи) расположены вдоль линии регрессии. В коэффициен-
те корреляции (обозначается г), который и является числовым ре-
зультатом корреляционного анализа, плотность колеблется от 0 до 1.
При этом чем ближе значение коэффициента к 1, тем плотнее
связь; чем ближе значение к 0, тем связь слабее. Так, при г = 1 связь
приобретает характер функциональной — все точки «ложатся» на
одну прямую. При г = 0, фиксирующем полное отсутствие связи,
построение линии регрессии становится невозможным. В нашем
примере г = 0,62, что свидетельствует о наличии значимой статис-
тической связи (подробнее об интерпретации коэффициента кор-
реляции см. ниже).
Тип связи определяется наклоном линии регрессии. В коэффици-
енте корреляции существует всего два значения типа связи: обратная
(знак «-») и прямая (отсутствие знака, так как знак «+» традиционно
не записывается). В нашем примере связь прямая. Соответственно,
итоговый результат анализа 0,62.
Сегодня коэффициент корреляции Пирсона можно легко подсчи-
тать с помощью всех компьютерных пакетов программ статистическо-
го анализа (SPSS, Statistica, NCSS и др.) и даже в широко распростра-
ненной программе Excel (надстройка «анализ данных»). Настоятельно
рекомендуем пользоваться профессиональными пакетами, так как они
позволяют визуально оценить корреляционное поле.
Почему важна визуальная оценка геометрического представления
данных? Во-первых, мы должны убедиться, что связь линейна по
форме, а здесь самый простой и эффективный метод — именно зри-
тельная оценка. Напомним, что в случае ярко выраженной нелиней-
ности связи вычисление коэффициента корреляции окажется беспо-
лезным. Во-вторых, визуальная оценка позволяет найти в данных
выбросы, т.е. нетипичные, резко выделяющиеся случаи.
Вернемся к нашему примеру с двумя партиями. Внимательно
глядя на диаграмму рассеяния, мы замечаем по меньшей мере один
нетипичный случай, лежащий явно в стороне от «общей магистра-
ли», тенденции связи переменных. Это точка, представляющая дан-
ные по Самарской области. Хотя и в меньшей степени, но тоже
нетипично положение Томской, Нижегородской областей и Санкт-
Петербурга.