Одномерная АРПСС (ARIMA)

Опубликовал: pvi777 в категорию Материалы по Dell StatSoft Statistica - Дата добавления: 28.09.2023, 08:47


Следующий пример основан на главе 9 классической книги Бокса и Дженкинса (1976). Данные представляют собой международные месячные авиаперевозки (в тысячах) за 12 последовательных лет с 1949 по 1960 г. (см. Бокс и Дженкинс, 1976, стр. 531, "Ряд G"). Данные содержатся в файле Series_g.sta (переменная SERIES_G).

Одномерная АРПСС (ARIMA)

Ряд имеет отчетливо возрастающий тренд, а также сезонную составляющую (например, в марте перевозки обычно выше, чем в феврале и апреле).

Выбор анализа. После запуска модуля Временные ряды, откройте файл Series_g.sta, а затем нажмите кнопку Переменные. Выберите переменную SERIES_G. Теперь нажмите кнопку АРПСС и автокорреляционные функции. После загрузки данных, вы увидите окно Одномерная АРПСС.

Одномерная АРПСС (ARIMA)

Выбор порядка. Прежде чем оценивать параметры, надо определить их количество, т.е. выбрать модель АРПСС (см. Вводный обзор). Для идентификации используют автокорреляционные и частные автокорреляционные функции, доступные в этом диалоговом окне. Вначале нажмите кнопку Другие преобразования и графики. Откроется окно Преобразования переменных.

В этом окне вначале выберем подходящую шкалу на оси X графиков. Выделите поле Задать масштаб оси Х, затем введите 1 в поле Мин и 12 в поле Шаг. Файл Series_g.sta содержит имена наблюдений с соответствующими датами. Используйте эти метки на графике. Для этого выберите режим Именами наблюдений.

Обратитесь к описанию диалогового окна Преобразования переменных для подробного обсуждения способов нанесения меток на оси графиков в модуле Временные ряды и прогнозирование. Диалоговое окно Преобразования переменных теперь выглядит следующим образом:

Далее нажмите кнопку График рядом с кнопкой Просмотр выдел. переменной и постройте график ряда.

Тренд и сезонная составляющая ряда выглядят очень отчетливо. Для идентификации АРПСС возьмем подходящие разности ряда и рассмотрим соответствующие автокорреляционные и частные автокорреляционные функции (см. Вводный обзор).

Мультипликативная сезонность. Из графика видно, что амплитуда колебаний ряда увеличивается в зависимости от сезона (т.е. имеется очевидная мультипликативная сезонность, см. Вводный обзор), которая может сместить оценки автокорреляции. Прологарифмируем ряд, чтобы стабилизировать амплитуду колебаний.

Логарифмическое преобразование. Вернитесь в окно Преобразования переменных.

Выберите преобразование Натуральный логарифм (x=ln(x)) и нажмите OK. После проведения преобразований всех наблюдений, график преобразованного ряда автоматически появится на экране (по умолчанию, если вы не отменили параметр График после каждого преобразования в окне Преобразования переменных).

Из графика вы видите, что цель преобразования достигнута, амплитуда колебаний стала более стабильной и ряд готов для дальнейшего исследования.

Автокорреляции. Вернитесь в окно Преобразования переменных измените Число лагов на вкладке Автокорреляции, вместо предложенных по умолчанию 15 поставьте 25. Нажмите кнопку Автокорреляции, чтобы построить таблицу результатов с автокорреляциями и график автокорреляционной функции.

График показывает сильную периодическую зависимость, автокорреляции на лагах 1, 12 имеют максимальные значения.

Взятие разности. Для удаления периодической зависимости возьмем вначале разность ряда с лагом 1. Нажмите Далее, чтобы вновь открыть диалоговое окно Преобразования переменных.

Заметим, преобразованный (прологарифмированный) ряд автоматически направляется в активную рабочую область (см. Активная рабочая область). Выделите преобразованный ряд (с ним работаем далее). Выберите преобразование Разность (x=x-x(лаг)) (сохраните лаг равный 1) и нажмите OK (Преобразовать). График имеет вид:

Теперь каждый член преобразованного ряда равен разностям между соседними членами прологарифмированного ряда. Заметим, ряд стал короче (на число элементов, равное длине лага 1).

Вернитесь в диалоговое окно Преобразования переменных и снова выберите опцию Автокорреляции.

Вы видите, что после взятия разности исчезла корреляция не только на лаге 1, но также на большинстве других лагов (как объяснялось ранее, автокорреляции для последовательных лагов взаимозависимы).

Сезонность. Однако, как часто происходит, удаление зависимостей на малых лагах приводит к более отчетливой зависимости на лагах высокого порядка (в данном случае, это видно на лаге 12). Имеется также отчетливая (сезонная) зависимость на лаге 24 (и других лагах, кратных 12, таких как 36, 48 и т.д.). Это показывает сильную сезонную зависимость. Таким образом, в ряде авиаперевозок отчетливо видна сезонность.

Взятие сезонной разности. Возьмем сезонную разность с лагом 12. Вернитесь в окно Преобразования переменных и снова выберите Разность (x=x-x(лаг)), но теперь измените значение лага, положите лаг=12. Нажмите OK. Снова, по умолчанию, преобразованный ряд будет отображен на графике. Как и ранее, в окне Преобразования переменных выберите опцию Автокорреляции.

Большинство сильных автокорреляций теперь удалено. Хотя еще остались автокорреляции, большие 2-х стандартных ошибок (показанных точечной линией на графике автокорреляций), не нужно брать еще разности ряда, т.к. они могут исключить эффект скользящего среднего.

Теперь выберите опцию Частные автокорреляции.

Оцениваемые параметры. В целом коррелограмма выглядит достаточно хорошо, и ряд готов для анализа с помощью АРПСС. Основываясь на разведочном анализе (т.е. идентификации АРПСС), можно придти к выводу, что сезонная АРПСС (с лагом 12) и несезонная модель (с лагом=1) достаточно хорошо подходят к преобразованному ряду. Будут оцениваться два параметра скользящего среднего модели АРПСС: один сезонный (Qs) и один несезонный (q). Параметры авторегрессии отсутствуют в модели. Обзор общих правил идентификации АРПСС дан во Вводном обзоре. Обратитесь к книге Бокса и Дженкинса (1976) для всестороннего обсуждения этого примера (Бокс и Дженкинс, 1976, глава 9). В книгах Hoff (1983), McCleary and Hay (1980), McDowall, McCleary, Meidinger, and Hay (1980), Pankratz (1983), and Vandaele (1983) обсуждаются различные примеры идентификации АРПСС с помощью графиков и автокорреляционных функций.

Интегрированные преобразования АРПСС. Ранее было выполнено логарифмическое преобразование данных и два типа разности (несезонная и сезонная) были взяты. Все эти преобразования уже выполнены и результаты просмотрены. Преобразованный ряд можно теперь непосредственно использовать в АРПСС. Однако в ситуациях, похожих на данную, рекомендуется анализировать исходный ряд и задать необходимые преобразования внутри АРПСС (эти преобразования будут частью спецификации АРПСС). Если вы захотите построить прогноз (после оценки параметров АРПСС), то он будет вычислен из проинтегрированных рядов ("интегрирование", более точно суммирование, в данном случае означает просто операцию, обратную взятию разностей с соответствующими лагами). Таким образом, проводя обратные преобразования, вы возвращаетесь к исходному ряду и прогноз соответствует исходным данным (что обеспечивает более легкую интерпретацию результатов).

Заметим, внутри АРПСС доступны только преобразования логарифм, возведение в степень и взятие сезонных/несезонных разностей. В некоторых случаях определенные преобразования рекомендуется выполнять до работы в АРПСС. Речь идет о преобразованиях (например, сглаживание), не изменяющих диапазон данных и к которым не нужно применять обратные преобразования.

Спецификация АРПСС. Теперь снова вернемся в диалоговое окно Одномерная АРПСС, нажав Отмена в окне Преобразования переменных. В диалоговом окне выделена исходная переменная SERIES_G. Окно Одномерная АРПСС позволяет определить количество параметров авторегрессии и параметров скользящего среднего (сезонных и несезонных), которые нужно оценить. Вы не сможете сделать следующего шага, не задав, по крайней мере, один параметр (по крайней мере, одно из полей P, p, Q или q должно быть не пусто). Но до этого вы должны задать преобразования.

Выберите опции Натуральный логарифм и Разность. Затем задайте Лаг равный 1 и установите Порядок равным 1. Определите log-преобразование и несезонную разность. Задайте сезонную разность: во втором поле Лаг укажите 12 и снова установите 1 в поле Порядок.

Параметры АРПСС. Еще нужно задать параметры модели АРПСС. На этапе идентификации АРПСС, мы пришли к выводу, что нужно оценить один регулярный параметр скользящего среднего (q), один сезонный (Q) и ни одного параметра авторегрессии. Ниже показано диалоговое окно Одномерная АРПСС с нужными установками.

Оценивание параметров. Как описано в разделе Вводный обзор, параметры АРПСС оцениваются максимизацией функции правдоподобия. Доступны два метода максимизации функции правдоподобия: Приближенный (МакЛеода и Сейлза) и Точный (Меларда). Выберите метод Точный (Меларда) и нажмите OK (Начать оценивание параметров) и запустите итеративную процедуру оценивания (см. раздел Вводный обзор относительно вычислительных деталей).

Просмотр результатов. После того, как процедура оценивания сойдется, откроется диалоговое окно Результаты АРПСС.

Вывод АРПСС. Нажмите кнопку Оценки параметров, чтобы увидеть таблицу результатов с оценками, стандартными ошибками, асимптотическими значениями t-статистик и т.д.

Обе оценки (сезонных и несезонных параметров) высоко значимы.

Параметры прогноза. По умолчанию, программа вычисляет прогнозы для одного полного сезонного цикла, начиная с последнего наблюдения, т.е. с наблюдения, следующего после 144 (наблюдение - 145). Прежде всего, посмотрите прогнозы в таблице результатов. Нажмите кнопку Прогноз. Таблица результатов содержит прогнозы и их доверительные интервалы. Заметим, если вы запросите построить прогнозы для имеющихся наблюдений (что также возможно), таблица результатов будет содержать наблюдаемые значения и остатки.

График остатков. Более хорошая "картина" получается, когда прогнозы продолжают наблюдаемый ряд. Вновь откройте окно Результаты одномерной АРПСС. Нажмите в нем кнопку График ряда и прогнозов.

Напомним, что раньше, вы потребовали пометить точки на оси X именами наблюдений и использовали шаг 12, чтобы аккуратно отобразить последовательные годы. Просматривая график, вы видите, что построенная АРПСС довольно разумно прогнозирует ряд.

Вернитесь в диалоговое окно Результаты одномерной АРПСС, чтобы проверить, насколько хорошо построенная модель АРПСС прогнозирует последние 12 наблюдений. Установите в поле Начать с наблюдения значение 133 (т.e. 144-12+1) и снова нажмите кнопку График ряда и прогнозов.

Видно, что наблюдаемые значения попали в доверительный интервал, т.е. прогноз снова хороший.

Анализ остатков. В общем, кажется, что модель достаточно адекватно подходит к данным. Однако имеются и другие важные способы оценки адекватности. Имеются два предположения модели АРПСС: (1) остатки (наблюдаемые минус оцененные значения) нормально распределены, (2) остатки независимы друг с другом, т.е. между ними нет остаточной корреляции. Если последнее условие не выполнено, то, вполне вероятно, что вы не заметили некоторый дополнительный параметр, влияющий на ряд.

Нормальный вероятностный график. Предположение о нормальности остатков может быть проверено с помощью нормальных вероятностных графиков. Ниже показан Нормальный график и нормальный график без тренда.

Стандартный нормальный вероятностный график строится следующим образом. Вначале происходит упорядочение отклонений от соответствующих средних (остатков). По этим рангам вычисляются z значения (стандартизованные значения нормального распределения). z значения откладываются на оси Y. Если наблюдаемые значения (отложенные по оси X) нормально распределены, то все значения попадут на прямую линию. Если распределение отлично от нормального, то на графике будет наблюдаться отклонение от прямой. На этом графике можно отчетливо увидеть выбросы.

Отличие нормальных вероятностных графиков без тренда от простых нормальных вероятностных графиков в том, что линейный тренд исключается из данных. Гистограмма остатков, показанная ниже, также служит визуальным подтверждением нормальности остатков.

Автокорреляция остатков. Теперь рассмотрим выполнение первого предположения АРПСС - остатки независимы друг с другом.

Независимость остатков можно проверить с помощью графика автокорреляционной функции (нажмите кнопку Автокорреляции в окне Результаты одномерной АРПСС). Из графика видно, что остатки практически не коррелированы друг с другом. Поэтому вы можете быть удовлетворены моделью.

Дальнейший анализ. Когда вы закроете диалоговое окно Результаты одномерной АРПСС, остатки АРПСС автоматически добавятся в активную рабочую область. Также если установлена (по умолчанию) опция Добавить прогнозы к исход. ряду при Выходе, ряд с исходными данными и прогнозами будет добавлен в активную рабочую область. Теперь закройте окно Результаты одномерной АРПСС, нажав кнопку Отмена. Окно Одномерная АРПСС снова появится на экране.

Как вы видите оба ряда: остатки и прогнозы добавлены в активную рабочую область. В конце анализа посмотрим другой информативный график. Постройте на одном графике исходный ряд, прогнозы и остатки. Такой график поможет вам обнаружить другие недостатки подобранной модели. Например, если остатки особенно большие, и подгонка плоха на одном из сегментов ряда (например, возможно имеется трехгодовой период, на котором модель АРПСС устойчиво предсказывает большие значения, чем те, которые наблюдаются). Т.к. остатки и наблюдаемый ряд (и прогнозы) несовместимы (напомним, что остатки относятся к прологарифмированному ряду, к которому затем дважды применялся разностный оператор, тогда как прогнозы относятся к исходному ряду), то лучше использовать кнопку График 2-х списков перем. в разных масштабах. Пусть первой переменной на графике будет исходный ряд с добавленным прогнозом, а второй переменной (во втором окне) будут остатки.

Нажмите OK, чтобы увидеть график.

Снова из графика видно, что подгонка модели АРПСС очень хорошая, т.к. остатки имеют примерно равную вариацию на всем протяжении ряда и нет очевидного тренда или сдвига в них.

Attachments:

File Описание
Access this URL (http://www.statosphere.ru/downloads/examples/Series_G.sta)Одномерная АРПСС (ARIMA) Международные авиаперевозки - Series_G.sta
 


Комментарии:


Оставить комментарий

Вход на сайт

Информация о проекте

Настоящий сайт представляет собой информационный портал, содержащий материалы по проблеме бизнес-аналитики, раскрывающие особенности использования современных подходов и методов анализа и обработки данных, что в условиях современной информатизации общества представляется весьма актуальным при исследовании различных проблем социально-экономического характера.
Настоящий портал содержит материалы познавательного, учебно-методического и научно-исследовательского характера, демонстрирующие современное состояние развития проблемы бизнес-аналитики, проблемы анализа и обработки данных. Особое внимание на страницах сайта уделено методическому и аналитическому инструментарию рассматриваемых проблем. Наряду с теоретическими и аналитическими материалами сайт содержит пакеты программных продуктов, представляющих собой прикладной инструментарий, способный автоматизировать научно-практические исследования в области бизнес-аналитики и бизнес-статистики.

Контакты