Статистический анализ и прогнозирование авиаперевозок

Опубликовал: pvi777 в категорию Прогнозирование - Дата добавления: 28.03.2024, 20:37


Содержание

Постановка задачи

Рассмотрим задачу построения прогноза авиаперевозок США по историческим данным. Данные взяты с ресурса www.bts.gov и представляют собой помесячное количество пассажиров в период с января 2003 года по декабрь 2009 года.

Количество пассажиров измеряется в миллионах человек.

Фрагмент исходных данных

Табл. 1. Фрагмент исходных данных

Цель исследования – спрогнозировать перелеты по месяцам на 2010 год.

Разведочный анализ

Визуальный анализ

Построим линейный график временного ряда (см. рис. 1).

Данные обладают ярко выраженной сезонной структурой.

Как видим, максимумы интенсивности авиаперевозок приходятся на июль.  

Линейный график количества пассажиров

Рис. 1. Линейный график количества пассажиров

Выделение периодичности

Для выявления периодичности применим спектральный анализ. Этот метод можно использовать для подтверждения нашей гипотезы о том, что ряд обладает сезонной структурой. Предполагаемый период сезонного цикла – 12 месяцев.

График спектральной плотности

Рис. 2. График спектральной плотности

На графике спектральной плотности видим, что наибольшее значение плотности соответствует периоду 12 месяцев, из линейного графика видно, что повторяющиеся пики соответствуют месяцу июль, т.е. повторяются через 12 месяцев.

Наибольшие значения перидиограммы

Табл. 2. Наибольшие значения перидиограммы

Исследование свойств ряда

Вид автокорреляционной функции позволяет нам определить, какие параметры прогностической модели АРПСС нужно взять.

Автокорреляционная функция для данного ряда будет иметь вид:

Автокорреляционная функция для исходного ряда

Рис. 3. Автокорреляционная функция для исходного ряда

График показывает сильную периодическую зависимость между компонентами ряда: автокорреляции на лагах 1, 12 имеют максимальные значения.

Прологарифмируем ряд, чтобы сгладить скачки амплитуды, для последующего анализа с помощью автокорреляционных функций.

Прологарифмованный временной ряд

Рис. 4. Прологарифмированный временной ряд

Автокорреляционная функция преобразованного ряда поможет нам более чётко увидеть временные зависимости в нашем ряду:

Автокорреляционная функция для прологарифмованного ряда

Рис. 5. Автокорреляционная функция для прологарифмированного ряда

Автокорреляция имеет ярко выраженный периодический характер. Причем автокорреляция на лагах 1,12 имеет максимальные значения.
От преобразованного ряда возьмём разности с лагом 1.

После логарифмирования ряда и взятия разностей с лагом 1 получаем такую автокорреляционную картину:

Автокорреляционная функция после взятия разности с лагом 1

Рис. 6. Автокорреляционная функция после взятия разности с лагом 1

Теперь возьмём разность с лагом 12:

Автокорреляционная функция после взятия разности с лагом 12

Рис. 7. Автокорреляционная функция после взятия разности с лагом 12

Большинство сильных автокорреляций теперь удалено.
Построим частную автокорреляционную функцию для нашего нового ряда.

В случае, когда лаги на ней будут независимы, можно говорить о том, что ряд поддается анализу АРПСС. Частная автокорреляционная функция будет иметь вид:

Частичная автокорреляционная функция

Рис. 8. Частичная автокорреляционная функция

Прогноз АРПСС

В этом разделе для построения прогноза мы будем использовать линейную математическую модель авторегрессии и проинтегрированного скользящего среднего (АРПСС).

Подобрать наилучшую модель АРПСС можно путем перебора моделей с различными параметрами, применяя для их сравнения метод кросс-проверки (cross-validation).

АРПСС позволяет анализировать временные ряды с сезонностью. В данном случае удобно взять модель со следующими параметрами.

Параметры модели АРПСС

Рис. 9. Параметры модели АРПСС

График прогноза на 12 месяцев вперёд будет иметь следующий вид:

Полученный на основе модели АРПСС прогноз на 12 месяцев

Рис. 10. Полученный на основе модели АРПСС прогноз на 12 месяцев

Проверка качества прогноза

Проверим объективность прогноза, проведя кросс-сравнения с известными данными (cross-validation).

Кросс-проверка модели

Рис. 11. Кросс-проверка модели

В таблице приведены значения фактического уровня перевозок, прогноза перевозок, а также абсолютная и относительная ошибки:

Результаты кросспроверки

Табл. 3. Результаты кросспроверки

Прогноз моделью экспоненциального сглаживания

Для построения прогноза можно также использовать модели экспоненциального сглаживания, учитывающие тренд и сезонность.

Были рассмотрены модели с линейным или экспоненциальным трендом, с аддитивной или мультипликативной сезонностью.

Наиболее удачными оказались модели с аддитивной сезонностью и линейным трендом. Как видно из приведённой ниже таблицы, этот метод дает низкие ошибки: 

Ошибки модели с линейным трендом и аддитивной сезонностью

Табл. 4. Ошибки модели с линейным трендом и аддитивной сезонностью

График прогноза, выполненного методом экспоненциального сглаживания

Рис. 12. График прогноза, выполненного методом экспоненциального сглаживания

Выводы

В таблице ниже показано сравнение ошибок, полученных при кросспроверке АРПСС и экспоненциального сглаживания. 

Прогноз, выполненный путем экспоненциального сглаживания, описывает тенденцию авиаперевозок точнее.

Сравнение модели экспоненциального сглаживания с выбранной моделью АРПСС

Табл. 5. Сравнение модели экспоненциального сглаживания с выбранной моделью АРПСС

Список литературы

  1. В.П.Боровиков. STATISTICA. Искусство анализа данных на компьютере: для профессионалов (2-е издание), СПб.: Питер, 2003. – 688 с.: ил.

  2. Г.И.Ивченко, Ю.И.Медведев. Математическая статистика. – М.: Высшая школа, 1984. – 248 с.

  3. Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. – М.: Большая Российская энциклопедия, 2003. – 912 с.

  4. Электронный учебник компании StatSoft.

В начало



Комментарии:


Оставить комментарий

Вход на сайт

Информация о проекте

Настоящий сайт представляет собой информационный портал, содержащий материалы по проблеме бизнес-аналитики, раскрывающие особенности использования современных подходов и методов анализа и обработки данных, что в условиях современной информатизации общества представляется весьма актуальным при исследовании различных проблем социально-экономического характера.
Настоящий портал содержит материалы познавательного, учебно-методического и научно-исследовательского характера, демонстрирующие современное состояние развития проблемы бизнес-аналитики, проблемы анализа и обработки данных. Особое внимание на страницах сайта уделено методическому и аналитическому инструментарию рассматриваемых проблем. Наряду с теоретическими и аналитическими материалами сайт содержит пакеты программных продуктов, представляющих собой прикладной инструментарий, способный автоматизировать научно-практические исследования в области бизнес-аналитики и бизнес-статистики.

Контакты