между ними. Одной иллюстрации на рис. 4.5. по-видимому, достаточно для предупреждения
против опрометчивого вывода о том, что две переменные не связаны только потому, что r=0.
Оценки педагогических и психологических тестов часто дают «потолочные» или «подвальные»
эффекты у нетипичных групп, то есть испытания могут быть слишком легкими или слишком
трудными, ибо многие получают максимальную или минимальную оценку. Диаграмма
рассеивания оценок теста А который характеризуется «потолочным эффектом», и теста В с
«подвальным эффектом» могла бы быть подобна диаграмме рис. 4.6.
Величина r для данных рис. 4.6. невелика; вероятно, она приблизительно равна 0,30.
Оказывается, что в области, для которой оба теста эквивалентны по трудности, они связаны более
сильно. Считают, что если бы тест А был более трудным, а тест В – более легким без радикального
изменения их содержания, то величина r
ав
увеличилась бы. Диаграмма рассеивания для подобных
измененных тестов, возможно, обладала бы меньшей нелинейностью, чем имеющаяся. (Этот
пример показывает другой важный момент: степень связи между любыми двумя переменными –
независимо от того, как эта связь выражена, – зависит от характера измерения переменных.
Рисунок 4.6. Диаграмма рассеивания оценок для теста А и теста В
Например, мы обычно считаем, что характеристики веса и роста довольно сильно связаны
между собой у взрослых людей; но нетрудно представить себе весьма плохие способы измерения
этих переменных – например, измерение с помощью субъективных суждений четырехлетних
детей, оценки веса и роста которых не показали бы почти никакой корреляции).
Дополнительные замечания об интерпретации r. Кэрролл (1961) представил
интересный доклад о том, как интерпретация r зависит от формы распределений Х и У и их
совместного распределения. Его статья содержит отличное изложение многих вопросов,
затрагиваемых здесь лишь бегло, и отчасти будет понятна учащемуся, чье ознакомление с
корреляцией не выходит за рамки этой и двух последующих глав. Он приводит следующее
наблюдение одновременно над интерпретацией r и обучением студентов статистике: «Студентам
недостаточно точно объясняют, что пределы [от -1 до+1] и выражения [«сильно связанный»,
«умеренно связанный», «не связанный»] непосредственно относятся к определенным
статистическим моделям. Две наиболее часто применяемые модели – нормальная двумерная
поверхность и модель линейной регрессии. Для вычисления коэффициента Пирсона не требуется
никаких предположений, но интерпретация его смысла определенно зависит от области, в
пределах которой данные приводятся в соответствие с подходящей статистической моделью для
выполнения этой интерпретации. Поскольку реальные данные отклоняются от модели, под
которую их подгоняют (например, двумерной нормальной поверхности), то пределы
коэффициента корреляции могут сужаться, а предлагаемая интерпретация терять смысл».
Приложение 4.1
Лабораторная работа № 3
Задание. Расчет корреляционной связи между двумя признаками.
Цель задания
. Освоение метода корреляционного анализа с помощью ПК.
Аппаратура
. Персональный компьютер.
Математическое обеспечение.
Операционная система WINDOWS и EXCEL 7.0.