¿Õ¿À»« ›‘‘≈“»¬ÕŒ—“» »Õ¬≈—“»÷»…
27
такой ориентации являются приведенные выше дан-
ные первого листа демонстрационного файла.
Если каждое новое значение располагается в
следующей колонке, т.е. данные по каждому показа-
телю располагаются слева направо в одной строке
(например, B4, C4, D4 и т.д.), то таблица имеет ори-
ентацию “по строке”. Примером такой ориентации
являются данные второго листа демонстрационного
файла.
Шаблон данных
Выделенный блок кроме числовых данных мо-
жет иметь (или не иметь) текстовые стандартные ат-
рибуты таблицы: наименование таблицы, боковик и
шапку таблицы. Эти три элемента характеризуют
шаблон данных.
Наименование таблицы (заголовок блока),
когда оно присутствует, должно быть расположено в
первой строке и записано в одной клетке.
При ориентации таблицы “по колонке” в ее бо-
ковике (то есть первой колонке) отображаются на-
именования наблюдений (обычно это даты или но-
мера наблюдений по порядку); а в шапке таблицы, (то
есть строке, непосредственно предшествующей чи-
словым данным) - наименования переменных
(например, “Курс доллара”, “Объем продаж”). При
ориентации таблицы “по строкам” - наименования
переменных отображаются в боковике, а наименова-
ния переменных - в шапке таблицы. Для указания
наличия:
• наименования таблицы;
• наименования переменных;
• наименования наблюдений,
• в диалоговом окне “Установки блока данных”
в блоке "Наименование" необходимо поставить сим-
вол выбора (крестик) рядом с их названием.
При изменении установок блока данных в диа-
логовом окне отображается их текущее состояние,
что позволяет легко определить соответствие теку-
щего шаблона данных и выделенного блока.
Совет. Для получения более компактного про-
токола результатов вычислений (в частности, при
проведении корреляционного анализа) выделите
блок данных без наименований показателей. В этом
случае они будут идентифицироваться латинскими
буквами, соответствующими их местоположению в
рабочей таблице “Data”.
Требования к данным
Формально математические методы анализа
могут обрабатывать любые данные. Однако для пра-
вильного выявления закономерностей они должны
удовлетворять определенным требованиям. Все ма-
тематические методы обработки используют аппарат
математической статистики, который предполагает,
чтобы исходные данные были сопоставимы, доста-
точно полны, однородны, а временные ряды наблю-
дений должны быть еще и устойчивы. Невыполнение
одного из этих требований делает бессмысленным
применение любого математического аппарата ис-
следования.
СОПОСТАВИМОСТЬ данных достигается в
результате одинакового подхода к наблюдениям на
разных этапах формирования ряда динамики. Уровни
во временных рядах должны измеряться в одних и тех
же единицах, иметь одинаковый шаг наблюдений,
рассчитываться для одного и того же интервала вре-
мени, по одной и той же методике, охватывать одни и
те же элементы, относящиеся к неизменной совокуп-
ности.
Несопоставимость чаще всего проявляется в
стоимостных показателях. Даже в тех случаях, когда
значения этих показателей фиксируются в неизмен-
ных ценах (при наличии методики такого пересчета),
их часто трудно сопоставить. Такого рода несопоста-
вимость временных рядов не может быть устранена
чисто формальными методами и может лишь учиты-
ваться при содержательной интерпретации резуль-
татов статистического анализа.
ПОЛНОТА данных связана с их количеством.
Достаточное число наблюдений определяется в за-
висимости от цели проводимого исследования ди-
намики. Если целью является описательный стати-
стический анализ, то в качестве изучаемого можно
выбрать очень короткий интервал времени (но не
менее 5 наблюдений). Если же целью исследова-
ния является построение модели динамики, то число
уровней исходного динамического ряда в этом слу-
чае должно не менее чем в три раза превышать пери-
од упреждения прогноза, и быть не менее 12. В слу-
чае использования квартальных или месячных дан-
ных для исследования и прогнозирования сезонных
процессов, исходный временной ряд должен содер-
жать данные не менее чем за четыре года, даже если
требуется прогноз на 1-2 квартала (месяца). В про-
тивном случае эти данные будут обрабатываться без
учета внутригодичных колебаний.
Отметим, что пороговое минимальное значе-
ние объема данных можно оценить по статистиче-
ским таблицам, например, таблица d-критерия Дар-
бина - Уотсона, имеет начальное значение 15. Следо-
вательно, при меньшем объеме наблюдений исполь-
зование этого ключевого критерия для оценки каче-
ства модели некорректно.
Исходные данные могут содержать пропущен-
ные наблюдения. Программа имеет мощный матема-
тический блок их восстановления, который описан в
разделе 1.7.1.
ОДНОРОДНОСТЬ данных означает отсутст-
вие нетипичных, аномальных наблюдений, а также
изломов тенденций. Аномальность приводит к сме-
щению оценок и, следовательно, к искажению ре-
зультатов анализа. Во временных рядах формально
она проявляется как сильный скачок (спад) с после-
дующим примерным восстановлением предыдущего
уровня.
Для диагностики аномальных наблюдений
предложено несколько критериев, которые, однако,
не всегда надежны при исследовании временных
рядов. Так, критерий Ирвина не "ловит" аномаль-
ность, если она проявляется в серединном уровне
ряда с высокой динамикой, когда скачок велик, но не
превышает уровней на конце периода наблюдений. В
этой связи мы предлагаем модифицировать указан-
ный метод следующим образом [12,13]. Для всех
или только для подозрительных на аномальность