13
Різниці між фактичними значеннями та регресійною оцінкою залежної змінної
називатимемо залишками.
Щоб отримати можливість здійснити статистичний аналіз моделі, про який ішлося в
передмові, треба висунути деякі умови щодо збурень
t
:
1. Нульове середнє M0, 1,
t
tn.
Перша умова полягає в тому, що математичне сподівання збурень у будь-якому
спостереженні має дорівнювати нулю. Іноді випадковий член буде позитивним, іноді
негативним, але він не має систематично зсуватися в жодному із двох можливих
напрямків.
Фактично якщо рівняння регресії містить постійний член, то зазвичай можна
припустити, що ця умова виконується автоматично, тому що роль константи полягає у
визначенні будь-якої систематичної тенденції в у, що не враховують пояснювальні змінні,
уведені в рівняння регресії.
2. Рівність дисперсій (гомоскедастичність)
22
DM const,1,
ti
tn.
Друга умова полягає в тому, що дисперсія збурень має бути постійною для всіх
спостережень. Іноді випадковий член буде більшим, іноді меншим, однак, не має бути
апріорної причини для того, щоб він породжував більшу помилку в одних
спостереженнях, ніж в інших. Величина дисперсії, звичайно, невідома. Отже, одне із
завдань регресійного аналізу
– оцінити стандартне відхилення випадкового члена.
Якщо розглянута умова не виконується, то коефіцієнти регресії, знайдені за звичайним
методом найменших квадратів (див. підрозд. 1.2), будуть неефективні, а тому можна
одержати надійніші результати шляхом застосування модифікованого методу регресії.
3. Незалежність збурень:
t
та
незалежні при t
. Зокрема,
cov( , ) M 0
tt
при t
.
Ця умова припускає, що не має систематичного зв'язку між значеннями випадкового
члена в будь-яких двох спостереженнях. Наприклад, якщо випадковий член великий і
позитивний в одному спостереженні, це не може зумовлювати систематичну тенденцію
до того, що він буде більшим і позитивним у наступному спостереженні (або більшим і
негативним, або
малим і позитивним, або малим і негативним). Випадкові члени мають
бути абсолютно незалежними один від одного. Якщо цю умову не буде виконано, то
регресія, оцінена за звичайним методом найменших квадратів, знову дасть неефективні
результати.
4. Незалежність збурень і регресора: вектори
x
та
незалежні для всіх періодів
часу. Це припущення вводять для того, щоб значення будь-якої незалежної змінної в
кожному спостереженні вважати екзогенним, тобто цілком зумовленим зовнішніми
причинами, урахованими не в рівнянні регресії. Якщо таке припущення не виконується,
то оцінки регресії за звичайним методом найменших квадратів будуть зміщеними.
5. Нормальність збурень. Збурення
t
нормально розподілені для всіх t :
2
~(0, )
t
N.
Узявши до уваги припущення 1–3, можна сказати, що
t
– незалежні нормально
розподілені випадкові величини з нульовим математичним сподіванням і однаковими
дисперсіями
2
, або
2
~(0, )
t
N. Якщо випадковий член має нормальний розподіл, то
такими самими будуть і розподіли коефіцієнтів регресії. Ця умова необхідна, щоб
перевірити гіпотези і визначити надійні інтервали для параметрів, використовуючи
результати оцінювання регресії.
Припущення про нормальність ґрунтується на центральній граничній теоремі. По суті,
теорема стверджує, що якщо випадкова величина є загальним результатом взаємодії
великої кількості інших випадкових величин, жодна з яких не є домінуючою, то вона
матиме приблизно нормальний розподіл, навіть якщо окремі складники не мають
нормального розподілу. У розд. 3 ми розглянемо властивість асимптотичної нормальності,
яка дозволяє розповсюдити стандартні процедури перевірки гіпотез на більш широкий
клас моделей.
Отже, модель простої лінійної регресії описують за допомогою рівнянь (2), а збурення
цієї моделі задовольняють припущенням 1–5.