Важнейшей мерой связи является коэффициент корреляции. Само слово
"корреляция" как раз и означает "взаимосвязь". Какого типа отношения
возможны между двумя переменными? Ну, во-первых, признаки могут быть
совершенно независимыми друг от друга, тогда изменения одного никак не
связаны с изменением другого. Мы говорим, что переменные не коррелированы
между собой. Если признаки связаны, то сама связь может быть прямой или
обратной. В первом случае большим значениям одного признака соответствуют
более высокие значения другого и наоборот. Во втором случае увеличение
первого признака сопровождается уменьшением второго, а уменьшение первого
– увеличением второго. Статистики говорят о положительной и отрицательной
корреляции. Наконец, степень связи тоже может варьироваться от максимума,
когда значения одного признака позволяют уверенно предсказывать значения
другого, до ее полного отсутствия. Коэффициент корреляции отражает всю
гамму возможных отношений. Его значение может варьироваться от +1 до -1.
Положительные значения указывают на прямую связь между переменными,
отрицательные – на обратную. Нуль соответствует случаю отсутствия корреляции.
Предположим, что у многих людей измеряют рост и вес тела. Каждый
человек описывается двумя показателями, и в результате образуются два ряда
измерений. Сравнивая между собой пары измерений, мы стремимся выявить
характер связи между переменными. Между ростом и весом тела существует
довольно высокая положительная корреляция. Это значит, что высокий человек,
как правило, весит больше, чем человек меньшего роста. Связь эта не
однозначная: высокий человек может быть очень худым, а человек невысокого
роста может быть очень полным, поэтому значение коэффициента корреляции в
данном случае находится где-то между 0 и +1, видимо, чуть ближе к единице.
Коэффициент корреляции по-разному вычисляется для измеренных
показателей (рост, вес) и для ранжированных данных (оценки, предпочтения),
но его окончательная форма и интерпретация остаются теми же. Если данные
носят качественный характер (мужчина – женщина, совершеннолетний –
несовершеннолетний, работающий – пенсионер), то вместо коэффициента
корреляции применяются другие меры связи, основанные на сравнении частот.
Для тех случаев, когда два ряда получены с помощью разных шкал, имеются
свои вычислительные процедуры, но общая логика анализа сохраняется.
Следует специально остановиться на вопросе интерпретации данных
двумерного анализа, поскольку здесь требуется известная осторожность. Мы
касались этой проблемы в первой главе, когда обсуждали момент перехода от
научного описания к объяснению. Там отмечалось, что сам факт наличия связи