Анализ временных рядов в STATISTICA. Преобразования переменных

Опубликовал: pvi777 в категорию Материалы по Dell StatSoft Statistica - Дата добавления: 28.09.2023, 08:03


В этом разделе дается обзор общих соглашений, используемых в модуле Временные ряды для сохранения преобразованных временных рядов в активной рабочей области системы (см. также Основные соглашения).

Преобразования и активная рабочая область. Файл Stocks.sta содержит цены закрытия двух акций за период в 200 дней. Каждая торговая неделя содержит точно пять рабочих дней. Цена закрытия для выходных (когда торгов нет) оценивается. В этом примере, имеем два временных ряда, к которым будем применять несколько операторов сглаживания. Кроме того, будет построено несколько полезных графиков и проведен автокорреляционный анализ биржевых цен. Фрагменты рядов показаны ниже.

Анализ временных рядов в STATISTICA

Заметим, что даты в файле имеются в двух местах: в переменной Дата (переменная 3) и в именах наблюдений.

Выбор анализа. Чтобы начать анализ, вначале откройте модуль Временные ряды и прогнозирование, затем откройте файл Stocks.sta. Далее нажмите кнопку Переменные и выберите переменные Stock1 и Stock2. Открытое диалоговое окно модуля Временные ряды показано ниже.

Анализ временных рядов в STATISTICA

Все переменные и их преобразования записаны в активную рабочую область.

Выделенная переменная. Все последующие анализы производятся с выделенной переменной. Например, когда вы выполняете преобразования, то именно выделенная переменная преобразуется, и новая (преобразованная) переменная добавляется в активную рабочую область. Для того чтобы выделить переменную, просто щелкните на ней мышью. В этом примере, выделите переменную Stock1.

Соглашения относительно имен. Когда новая (например, трансформированная) переменная добавляется в активную рабочую область, она получает (1) то же самое короткое имя, что и исходная переменная (которая преобразовывалась), (2) новое длинное имя, которое содержит все старые длинные имена и краткое описание выполненного преобразования.

Редактирование имен переменных. Дважды щелкните на колонку, помеченную Переменная или Длинное имя переменной (ряда), чтобы редактировать короткие и длинные имена в активной рабочей области.

Число копий на переменную (ряд). Все диалоговые окна имеют поля ввода для выделенной переменной (ряда), также имеется поле в которое можно ввести Число копий на переменную (ряд). Число таких копий, помещаемых в активную рабочую область, контролируется с помощью этого параметра. Например, если параметр равен 3 (по умолчанию), и вы выполнили четвертое преобразование исходной переменной, то ряды данных, преобразованные в первый раз, будут удалены из активной рабочей области и заменены полученными новыми рядами (четвертыми преобразованиями). Можно иметь до 99 копий исходного одномерного ряда. В этом примере оставьте значение по умолчанию 3.

Блокированные переменные (ряды). Первый столбец имеет заголовок Блок. Когда вы дважды щелкните на этой колонке, преобразованная переменная будет заблокирована.

Удаление переменных (рядов) из рабочей области. Для удаления преобразованных переменных из активной рабочей области используйте кнопку Удалить переменную. Исходные анализируемые переменные не могут быть удалены.

Сохранение переменных (рядов) в рабочей области. Для сохранения переменных (рядов) используйте кнопку Сохранить переменные.

Пропущенные данные. Практически все виды анализа временных рядов требуют, чтобы в данных не было "дыр", т.е. пропусков. Если пропущенные данные имеются в начале или в конце ряда, они просто игнорируются. Если пропущенные данные находятся внутри ряда, они должны быть заменены. При этом возможно несколько способов замены пропущенных данных:

Общее среднее. В этом методе все пропущенные данные будут заменены средним, вычисленным по всему ряду. Очень часто, когда, ряд нестационарный или имеются большие систематические погрешности, этот метод неприемлем. С другой стороны, общее среднее - часто наилучшее a priori (несмещенное) приближение пропущенных данных.

Интерполяция по ближайшим точкам. В этом методе пропущенные данные интерполируются по ближайшим не пропущенным значениям ряда. Графически, этот метод сводится к замене пропущенного наблюдения путем проведения прямой линии от предыдущего (перед пропущенным) до следующего (после пропущенного) наблюдения.

Среднее N ближайших значений. В этом методе пропущенные данные заменяются средним, вычисленным по N ближайшим значениям с двух сторон от пропуска ("дыры") в данных.

Медиана N ближайших значений. Метод аналогичен, описанному выше, за исключением того, что вместо среднего берется медиана не пропущенных ближайших значений.

Значения, предсказанные линейной регрессией. В этом методе программа построит прямую регрессии методом наименьших квадратов и спрогнозирует по ней пропущенные значения.

Просмотр временных рядов. Теперь продолжим анализ и просмотр цен закрытия. Щелкните OK (Преобразования), чтобы открыть диалоговое окно Преобразования переменных.

Анализ временных рядов в STATISTICA

В окне имеется несколько опций для просмотра временных рядов, объединенных заголовком Просмотр и построение графиков переменных. Заметим, что эти опции применимы ко всем графикам модуля Временные ряды.

Заметим, что имена наблюдений могут также содержать информацию отличную от дат. Например, значительные дискретные события, воздействующие на ряд (например, новости, воздействующие на цены) могут быть также записаны в имена наблюдений и использованы в метках на графике. В этом примере, для меток по горизонтальной оси графиков, воспользуемся переменной Date. Щелкните по полю Датами и выберите переменную из появившегося диалогового окна. В этом примере каждая торговая неделя содержит пять дней (Понедельник - Пятница). Выделите флажок Задать масштаб оси X вручную и введите минимальное значение (Мин=) 1(начало с первого дня) и величину шага (Шаг=) 5. Затем щелкните кнопку Просмотр выдел. переменной, чтобы построить следующую таблицу результатов.

Анализ временных рядов в STATISTICA

Вы можете построить график ряда с помощью кнопки График, расположенной рядом с кнопкой Просмотр выдел. переменной.

Анализ временных рядов в STATISTICA

Для того чтобы построить график обеих акций одновременно, нажмите кнопку Просмотр нескольких переменных.

Анализ временных рядов в STATISTICA

График двух рядов в разных масштабах. Как вы видите, цены закрытия акции Stock2 в общем, ниже акций Stock1. Вы можете выбрать независимо масштаб для двух вертикальных осей, чтобы получить лучшее разрешение для каждого ряда. Используйте опцию График 2-х списков переменных в разных масштабах и выберите для Stock1 левую ось Y, a для Stock2 правую ось Y.

Анализ временных рядов в STATISTICA

Преобразования временных рядов. Выполним несколько преобразований. Нажмите OK (Преобразовать выделенную переменную) в окне Преобразования переменных. В этом диалоговом окне показаны все обычные преобразования временных рядов. Некоторые из этих преобразований требуют выбора второй переменной, например, для Остатков временного ряда. В этом примере выберите простое (невзвешенное) 5-ти точечное скользящее среднее для ряда Stock1. Выберите опцию N точ. скольз. средним, задайте 5 в поле N=.

Затем нажмите OK и выполните преобразование скользящим средним.

Как вы видите на графике, сглаженный ряд имеет меньше "зубцов", общий тренд виден более отчетливо.

Анализ временных рядов в STATISTICA

Затем вернитесь в диалоговое окно Преобразования переменных.

Измененная активная рабочая область. Как описано выше, преобразованный (сглаженный) ряд добавился в активную рабочую область.

Анализ временных рядов в STATISTICA

Следуя соглашению о присвоении имен, преобразованный ряд имеет то же самое короткое имя (Stock1) и будет иметь то же самое длинное имя, к которому добавлено описание выполненного преобразования (5 тч.ск.средн.).

Дальнейшая обработка преобразованного ряда. Преобразованные ряды в рабочей области имеют тот же самый "статус", что и ряды, выбранные из файла. Например, они могут быть отображены на графике или использованы как исходные переменные для дальнейшего анализа. Сравним сглаженный ряд с исходным. Нажмите кнопку Просмотр нескольких переменных.

Анализ временных рядов в STATISTICA

В появившемся окне нажмите просто OK (подтвердите установки, предложенные по умолчанию). Ниже показаны два ряда: оригинальный и сглаженный (преобразованный).

Анализ временных рядов в STATISTICA

Несколько последовательных преобразований. Вернитесь в диалоговое окно Преобразования переменных. Теперь продолжим преобразовывать ряд и отмечать, как соответствующие ряды будут добавляться в активную рабочую область. Выделите преобразованный ряд (внизу списка), щелкнув по нему мышью. Теперь выключите опцию автоматического построения графиков, т.е. отмените опцию График после каждого преобразования. Нажмите OK, чтобы открыть список доступных преобразований снова. Выберите затем Простое экспоненциальное сглаживание с параметром альфа = .20, предложенным по умолчанию и нажмите еще раз OK. Затем вновь нажмите OK и выберите 4253H фильтр. Это мощный метод сглаживания/фильтрации, который совмещает в себе несколько последовательных преобразований скользящим средним и скользящей медианой.

Теперь имеется 3 преобразованных ряда в активной рабочей области. Предположим, что вы не изменили параметр Число копий на переменную, который, по умолчанию, равен 3. Активная рабочая область сейчас "полна". Следующее преобразование любой переменной, связанной с Stock1, заменит "самое старое" ее преобразование. Это однако не относится к переменной Stock2. Для нее еще есть резервное пространство. Примените 4253H фильтр к Stock2. После преобразования активная рабочая область выглядит следующим образом.

Анализ временных рядов в STATISTICA

Как вы видите, все преобразования переменной Stock1 находятся еще на месте. Выделите исходную переменную Stock1 снова и примените к ней, например, преобразование 5- точ. скольз. медианой. Теперь самое первое преобразование переменной Stock1 (5-точечное скользящее среднее) будет заменено выполненным преобразованием (5-ти точечной скользящей медианой) ряда Stock1.

Анализ временных рядов в STATISTICA

Число мест такой "карусели" определяет параметр Число копий на переменную (ряд). Как только все места заняты, следующее преобразование заменяет первое преобразование, и "карусель" завертится снова.

Блокировка. Положим, вы захотели сохранить определенное преобразование в активной рабочей области; тогда вам нужно не допустить его удаления другим преобразованием.

Это можно достичь блокировкой соответствующего преобразования. Дважды щелкните мышью в столбце Блок, буква L появится в строке соответствующего преобразования. Теперь этот ряд заблокирован; т.е. он не может быть удален из рабочей области.

Например, следующее самое "старое" преобразование Stock1, которое будет заменено - преобразование Экспоненциальное сглаживание. Заблокируйте этот ряд, снова примените сглаживание скользящим средним. Как вы видите, заблокированное преобразование не заменилось новым преобразованием.

Анализ временных рядов в STATISTICA

Сохранение рядов в активной рабочей области. Теперь сохраним преобразования в активной рабочей области. Пусть вы хотите сохранить только скользящее среднее, экспоненциальное сглаживание и 4253H преобразование ряда Stock1 для дальнейшего анализа. Прежде всего, удалите ненужные ряды из активной рабочей области, выделяя их и нажимая кнопку Удалить.

Анализ временных рядов в STATISTICA

Затем, сохраните переменные в активной рабочей области, используя кнопку Сохранить переменные.

Анализ автокорреляций. До сих пор нами не обсуждалась интерпретация результатов. В общем, анализ временных рядов требует не только экспериментирования с доступными методами, но также понимания природы данных. Например, часто цены акций могут быть описаны моделью случайного блуждания. В этой модели каждое очередное наблюдение ряда представляет собой сумму предыдущего значения и случайной ошибки. В каком-то смысле этот процесс похож на блуждания "пьяного человека, чье положение в момент t определяется его положением в момент t-1 плюс шаг в случайном направлении" (Wei, 1990, стр. 71). Можно ожидать, что автокорреляция является наибольшей на лаге 1, следующая по величине на лаге 2 и т.д. Таким образом, автокорреляционная функция медленно убывает. Математически этот процесс можно описать как процесс авторегрессии с параметром близким 1.0.

График автокорреляционной функции. Проверим, насколько ряд Stock2 действительно отвечает этой простой модели. Вначале построим график Stock2 (выделите Stock2 и нажмите кнопку График рядом с кнопкой Просмотр выдел. переменной).

Анализ временных рядов в STATISTICA

Кажется, что Stock2 имеет убывающий тренд. Такие тренды смещают оценки автокорреляционной функции.

Удалите тренд с помощью опции Вычесть тренд в окне Преобразования переменных. Если построите график преобразованной переменной снова, то увидите, что тренд удален.

Анализ временных рядов в STATISTICA

Нажмите кнопку Автокорреляции и просмотрите автокорреляции численно в таблице результатов и на графике.

Анализ временных рядов в STATISTICA

Корреляция на лаге 1 максимальная и далее медленно убывает; график частной автокорреляционной функции также подтверждает модель случайного блуждания:

Анализ временных рядов в STATISTICA

Иными словами, каждое следующее наблюдение очень похоже на предыдущее, плюс некоторое случайное воздействие. Вы можете "удалить" сильную автокорреляцию, взяв разности ряда. Вновь откройте Преобразования переменных и выберите Разность (x=x-х(лаг)). Затем выберите опцию Aвтокорреляции в окне Преобразования переменных, чтобы построить график преобразованного ряда.

Анализ временных рядов в STATISTICA

Как вы видите, ни одна из автокорреляций не значима. Таким образом, модель случайного блуждания подтверждается. Stock2 в самом деле согласуется с этой моделью и, к сожалению, нет способа предсказать рост или падение этих акций.

Этот пример взят из справочной системы ППП STATISTICA фирмы StatSoft

Attachments:

File Описание
Access this URL (http://www.statosphere.ru/downloads/examples/Stocks.sta)Анализ временных рядов в STATISTICA. Преобразования переменных Цены двух акций - Stocks.sta
 


Комментарии:


Оставить комментарий

Вход на сайт

Информация о проекте

Настоящий сайт представляет собой информационный портал, содержащий материалы по проблеме бизнес-аналитики, раскрывающие особенности использования современных подходов и методов анализа и обработки данных, что в условиях современной информатизации общества представляется весьма актуальным при исследовании различных проблем социально-экономического характера.
Настоящий портал содержит материалы познавательного, учебно-методического и научно-исследовательского характера, демонстрирующие современное состояние развития проблемы бизнес-аналитики, проблемы анализа и обработки данных. Особое внимание на страницах сайта уделено методическому и аналитическому инструментарию рассматриваемых проблем. Наряду с теоретическими и аналитическими материалами сайт содержит пакеты программных продуктов, представляющих собой прикладной инструментарий, способный автоматизировать научно-практические исследования в области бизнес-аналитики и бизнес-статистики.

Контакты