Гл.
8. Линейная
регрессия
243
Они включают в себя как простые модели для двух переменных, с которыми мы
главным образом столкнемся, так и более совершенные модели для многих
переменных, которых мы лишь коснемся. Эти модели широко использукгтся
потому, что существуют пакеты прикладных программ (ППП), которые осущест-
вляют требуемые расчеты. Нужно быть предельно внимательным при использовании
ППП для того, чтобы окончательно убедиться, что мы досконально понимаем
результаты и правильно их оцениваем.
Эта глава охватывает анализ простой модели линейной регрессии, построенной
на конкретных данных (парной линейной регрессия). В конце главы рассматрива-
ются множественные регрессионные модели, несколько моделей нелинейной связи
и, наконец, измерение корреляхши с использованием коэффициента ранговой
корреляции Спирмена.
8.2. ПРОСТАЯ МОДЕЛЬ ЛИНЕЙНОЙ РЕГРЕССИИ
Простая линейная регрессия связана с тем, что мы называем двумерным
распределением, т.е. распределением двух переменных. Существует ли линейная
связь между двумя переменными или нет? Всегда лучше использовать две пере-
менные, нежели одну. Например, нас интересует соотношение между ростом и
весом у определенной группы людей; между ценой и количеством проданного
товара; возрастом служащих и их заработной платой; возрастом и весом кур;
еженедельными издержками и отработанным временем в отделах; пройденной
дистанцией и затраченным временем.
Первым шагом в анализе является изучение переменных: какие из них относятся
к факторам, каково их влияние друг на друга. Предположим, что фермер хочет
предсказать вес кур, которых он выращивает. Вес
—
это переменная, котор)гю он
желает предсказать, поэтому это будет аависимая переменная. Отмечать значения
зависимой переменной будем на осн OY. Пусть вес курицы зависит от ее возраста.
Тогда возраст
—
это независвмая перемещая, значение которой нам известно по
предположению и которое мы можем использовать при оценке ее веса. Независимая
переменная будет отмечаться нами на оси ОХ. Если мы установим природу связи,
между возрастом и весом курицы, то сможем предсказать вес курицы в данном
возрасте. Любая курица, для которой реальный вес значительно отличается от
прогнозируемого, может быть подвергнута обследованию.
Теперь мы должны ответить на вопрос: как изменяется вес в зависимости от
изменения возраста. Во-первых, можно предположить, что вес увеличивается с
возрастом. Когда курица совсем взрослая, мы можем предположить, что ее вес с
небольшими отклонениями зависит от пищи и погодных условий. Прибавка в весе
и ее вес в зрелом возрасте также будет зависеть от породы и способа ее выращи-
вания и кормления. Существует также множество других факторов, помимо
возраста, влияющих на вес. Процесс исследования возможной связи переменных
—
зависит ли зависимая переменная у от независимой переменной х и от других
факторов, которые также могут повлиять на связь,
—
очень важная часть статис-
тического моделирования. Наша цель — не просто построить какую-то любую
линейную регрессию, а постараться выяснить, чем объясняется вариация веса