(3.24)
Последняя формула справедлива только для линейных корреляционных
связей.
Приемы улучшения качества модели:
1). Сделать предварительное сглаживание временного ряда одномерного или
многомерного по методу простой скользящей средней или экспоненциального
сглаживания. Данный прием применяют только при наличии упорядочного
наблюдения во времени, т.е. для использования данных пространственного типа
он не применяется.
2). Использовать нормирование всех переменных и зависимых и
независимых:
(3.25)
Выводы:
1. Приемлемость получаемого значения R
2
определяется целями
моделирования: если допустимы грубые (прикидочные) оценки, то можно
принять R
2
0,8, для более точных оценок R
2
> 0,9.
2. Если база данных (БД) сильно зашумлена (или даже сознательно искажена,
что имеет место в задачах налогового и финансового контроля), то может
оказаться, что никакие ухищрения (о них речь позже) не позволяют получить
R
2
>0,9. Что делать тогда?
Рекомендации:
Повысить информативность базы данных за счет различных алгоритмов
предпроцессорной обработки (сглаживание, если база данных упорядочена по
времени; кластеризации данных; компрессия данных (факторный анализ);
расширения бахзы данных как парирование ее зашумленности; накнец – переход
к другим моделям:
-нейросетевым
-нечетким;
-фрактальным.
3.6.5. Скорректированный коэффициент детерминации
Недостаток нескорректированного коэффициента детерминации в том, что R
2
увеличивается при введении новых факторов, хотя качество уравнения регрессии
может и не возрастать, т.е. вводимые регрессоры оказываются малозначимыми.
Скорректированный (адаптивный) коэффициент множественной детерминации
определяется по формуле:
Линия уравнения регрессии
Верхняя граница доверительных
интервалов для индивидуальных
значений Y
0
*
Нижняя граница доверительных
интервалов для расчетного
значения
Временной срез
t
0
=const