Сравнение программ для статистического анализа

Опубликовал: pvi777 в категорию Материалы по Dell StatSoft Statistica - Дата добавления: 28.09.2023, 08:46


Введение

На сегодняшний день существует много универсальных программ обработки и анализа статистической информации. Благодаря кругу охватываемых задач, они могут быть полезны не только студентам на стадии изучения статистических методов, но и научным работникам, экономистам, решающим задачи анализа и прогноза с использованием статистических данных. Но перед специалистами встает вопрос: какую именно из программ выбрать из множества имеющихся? В статье приводится сравнительный анализ двух известных статистических пакетовSTATISTICA и Eviews. Сравнение проводится в зависимости от решаемых задач, простоты и удобства их выполнения, таким образом, отмечая преимущества и недостатки рассматриваемых приложений.

Рис.1. Вид рабочего окна в программе STATISTICA

Сразу отметим, что обе программы являются адаптированными к операционной системе Windows, поддерживают технологии OLE, drop-down и д.р., являются компактными и занимают мало места дискового пространства. Оба приложения имеют удобные графические интерфейсы.

Сравнение программ STATISTICA и Eviews проведем по следующей схеме, в зависимости от конкретных задач приложения:

· Ввод данных;

· Графический анализ;

· Основные описательные статистики;

· Регрессионный анализ (линейная, множественная и нелинейная регрессия);

· Анализ временных рядов (адаптивные модели прогнозирования, методы выделения компонент временного ряда, модели с распределенными лагами);

· Моделирование стационарных и нестационарных случайных процессов (модели ARMA, ARIMA, ARCH, коинтеграция рядов);

· Работа с панельными данными.

1. Ввод данных

Программа STATISTICA имеет модульную структуру, то есть состоит из модулей, каждый из которых используется для решения своего конкретного класса задач, а именно: анализ временных рядов и прогнозирование, множественная регрессия, нелинейное оценивание, факторный анализ, моделирование структурными уравнениями, непараметрическая статистика, дисперсионный анализ (ANOVA/MANOVA), дискриминантный функциональный анализ. Несколько модулей объединены в группу промышленная статистика: контроль качества, анализ процессов, планирование эксперимента.

При загрузке пакета программ STATISTICA и при создании нового файла появляется электронная таблица, в которой столбцы являются переменными, а строки – наблюдениями. Удобство введения данных в программеSTATISTICA обусловлено тем, что файл таблицы похож на аналогичный из программы Excel. Данная программа позволяет импортировать данные из других Windows приложений и программ DOS, таких как: MS Excel, MS Access, FoxPro, Paradox, dBASE, CSV, SPSS, а также из файлов *.txt.

В отличие от STATISTICA приложение Eviews не имеет модульной системы, однако оно содержит так называемое окно рабочего файла, где можно сохранять ряд объектов.

Объектная структура рабочего окна позволяет работать одновременно с различными типами информации. Управление объектами осуществляется с помощью процедур (procs), которые в свою очередь могут сами создавать новые объекты. Каждый объект содержит конкретный вид информации: ряд данных, коэффициенты, графики и диаграммы, модели, результаты вычислений, таблицы (матрицы) и др. Все типы объектов представлены на рис. 3.

Кроме того, программа Eviews имеет командную строку, куда вводятся определенные команды позволяющие производить статистический анализ данных. Команды могут быть сохранены в отдельном файле, что позволяет исследователю запомнить ретроспективу выполняемых действий.

В отличие от программы STATISTICA в Eviews прежде, чем ввести данные, необходимо задать их формат, далее создать объект типа ряд, задать количество переменных и количество наблюдений. Пакет Eviews позволяет работать с восьмью типами данных (годовые, полугодовые, квартальные, месячные, недельные (5 дней), недельные (7 дней), ежедневные и недатированные наблюдения). Процедура ввода и описания данных в приложении Eviews сложнее, чем в STATISTICA, и поэтому предпочтительнее импортировать данные из других приложений. Программа позволяет работать с данными заимствованными из таких программ как: MS Access, Gauss, ODBS, SAS, SPSS, MSExcel, Stata, ACSII, HTML.

Рис. 2. Вид рабочего окна программы Eviews. 

Рис. З. Типы объектов рабочего файла Eviews 

2. Графический анализ и основные описательные статистики

Для того чтобы легко визуализировать как исходные параметры модели, так и конечные результаты вычислений необходимо построение различных графиков, диаграмм, коррелограмм, спектрограмм и т.п. Просмотр в графической интерпретации исходных данных в виде линейных графиков, гистограмм распределений вероятности, диаграмм и т.п. для обоих приложений осуществляется с помощью команд меню. Просмотр результатов в виде графиков в программе STATISTICA производится непосредственно из рабочего модуля с помощью соответствующих кнопок, причем это приложение позволяет задать опцию построения графика автоматически после каждой проведенной процедуры, также имеется возможность просмотра данных в разных масштабах. Построение коррелограмм АКФ и ЧАКФ в пакете STATISTICA осуществляется только в разных окнах, в Eviews же их можно просмотреть и в одном окне, но зато в STATISTICA указаны границы белого шума. Результаты моделирования в Eviews в графическом режиме можно просмотреть с помощью команд основного меню рабочего файла.

Просмотр числовых характеристик исследуемых данных (среднее значение, стандартное отклонение, эксцесс, вероятность и др.) в приложении Eviews осуществляется с помощью команд меню, чтобы сделать это в STATISTICAнеобходимо зайти в отдельный модуль Основные статистики/Таблицы (Basic Statistics/Tables) (здесь же имеются критические значения различных распределений). Набор описательных статистик для обоих пакетов одинаковый.

3. Регрессионный анализ

3.1. Линейная регрессия

В программе STATISTICA оценка коэффициентов однофакторной и многофакторной линейной регрессии осуществляется в отдельном модуле Множественная регрессия (Multiple regression). Результаты просматриваются в отдельном окне, где есть коэффициенты, оцененные методом наименьших квадратов, коэффициент детерминации, статистика Фишера оценки значимости регрессии, статистики Стьюдента оценки значимости коэффициентов, коэффициент корреляции (матрица корреляций), статистика ДарбинаУотсона [3]. Существенными недостатками приложения STATISTICA является: во-первых, тот факт, что оценка коэффициентов простой регрессии производится только методом наименьших квадратов; во-вторых, определение наличия гетероскедастичности остатков приходится проводить в отдельном модуле (а именно, с помощью теста Спирмена в модуле непараметрические статистики). В отличие от STATISTICA пакет Eviews позволяет проводить оценку регрессии не только методом наименьших квадратов, но также методами максимального правдоподобия, взвешенным и нелинейным методами наименьших квадратов, достаточно просто набрать название метода в командной строке при оценке коэффициентов модели. К тому же Eviews позволяет сделать поправку на гетероскедастичность с учетом характера зависимости ошибок от независимой переменной. С помощью команды меню гетероскедастичность определяется тестом Уайта [1]. Отметим, что с помощью командной строки можно задать методику выявления гетероскедастичности методами Парка, Глейзера и др.

Проблему мультиколлинеарности факторов можно преодолеть в программе STATISTICA двумя способами: найти оценки методом главных компонент (реализуемо в модуле Факторный анализ (Factor Analysis)) или использовать гребневую регрессию (возможно только для STATISTICA версии старше 6.0).

3.2. Нелинейная регрессия 

Оценка нелинейной регрессии в программе STATISTICA производится в отдельном модуле Нелинейное оценивание (Non-linear estimation), здесь можно как задать вид зависимости самостоятельно, так и воспользоваться имеющимися: регрессия логит/пробит, регрессия экспоненциального роста, кусочно-линейная регрессия [3]. Для оценки коэффициентов нелинейной регрессии произвольного вида используются итеративные методы, такие как квази-ньютоновский, Хука-Дживса, симплексный и др. Результатами оценки являются лишь индекс детерминации и статистика Фишера. Подбор вида гладкой функции можно осуществить только на основе визуального анализа графиков. В отличие от этого в программе Eviews подобрать нелинейную функцию, наилучшим образом отражающей зависимость, можно на основе теста Бокса-Кокса. Оценка коэффициентов осуществляется на основе нелинейного МНК (NLS) и взвешенного МНК (WLS).

3.3. Модели с дискретной зависимой переменной 

Модели бинарного выбора (логит/пробит модели) легко оцениваются в пакете STATISTICA в модуле Нелинейное оценивание, выходными данными служат логарифмическая функция правдоподобия, ограниченная логарифмическая функция правдоподобия, ч2-статистика, оцененные методом максимального правдоподобия параметры модели. В отличие от STATISTICA Eviews позволяет строить не только модели бинарного выбора, но также и модели множественного выбора, как с порядковыми, так и с неупорядоченными альтернативами. Для этого просто в поле выбора метода оценивания следует сделать выбор в пользу метода, соответствующего искомой модели. Выходными параметрами служат ч2-статистика, псевдо-коэффициент детерминации, логарифмические функции правдоподобия.

4. Анализ временных рядов

Анализ временных рядов в программе STATISTICA осуществляется в модуле Анализ Временных рядов/Прогнозирование (Time Series analysis/ forecasting). Данный модуль содержит следующие методы исследования временных рядов: модель авторегрессии проинтегрированного скользящего среднего, модели интервенции для АРПСС, экспоненциальное сглаживание и прогнозирование (адаптивные модели прогнозирования), анализ распределенных лагов, сезонная декомпозиция и спектральный анализ ряда. Кроме этого существует окно преобразования исходного ряда, которое позволяет производить различные алгебраические операции с рядом, брать разности различного порядка, выделять тренд методом скользящих средних.

К преимуществам STATISTICA перед Eviews следует отнести построение адаптивных моделей прогнозирования. В программе STATISTICA имеется удобная таблица, в которой можно определить тип модели (аддитивная, мультипликативная, с линейным трендом, включающая сезонную компоненту), а также задать параметры адаптации в трех режимах: «вручную», автоматически (на основании критерия сходимости по минимальной средней квадратической ошибке), выбор с помощью сетки различных минимальных ошибок [2]. В Eviews аналогичная процедура построения адаптивных моделей достаточно усложнена: требуется определить тип модели, метод оценивания параметров, выбрать начальные значения адаптационных коэффициентов, критерий сходимости процесса расчета и т.д. в нескольких диалоговых окнах. Также более предпочтительно построение регрессионных моделей с распределенными лагами в программе STATISTICA, нежели чем в Eviews, так как процедура построения очень проста в применении: требуется лишь задать значение максимального лага и степень аппроксимирующего полинома (лаги Алмон). Выделение тренда из ряда с помощью гладких функций и моделирование сезонной компоненты на основе гармоник в оболочке STATISTICA выполняется в модуле Нелинейная оценка. Процедуру сглаживания тренда с помощью различного рода скользящих средних легко выполнить в обоих приложениях. Что касается определения наличия тренда в исходных данных, то его можно осуществить, в обоих приложениях, только с помощью спектрального анализа, либо коррелограмм АКФ и ЧАКФ, специального теста (например, тест Форстера-Стюарта) программы не проводят. Но в программе Eviews, с помощью менеджера тестов, такую проверку можно осуществить, задав соответствующие команды в командной строке.

5. Моделирование стационарных процессов

Существенным недостатком программы STATISTICA является отсутствие возможностей проверки ряда на стационарность, и судить о его стационарности можно лишь на основе визуального анализа графика ряда, спектрограммы и коррелограмм АКФ и ЧАКФ. В отличие от этого, приложение Eviews позволяет провести как обычный, так и расширенный тесты Дики-Фуллера на наличие стационарности (тесты единичного корня).

Построение моделей АРСС в программе STATISTICA выполняется с помощью модуля Анализ временных рядов/Прогнозирование. Идентификация модели производится либо на основе визуального анализа коррелограмм АКФ и ЧАКФ, учитывая их специфические особенности, либо спектров случайных процессов. В программе Eviews идентификацию модели АРСС можно произвести еще и с помощью Q-статистики (тест Люнга-Бокса). К тому же есть возможность сравнить две значимые модели АРСС, то есть произвести их селекцию, по критериям Шварца и Акайке. Eviews выполняет эти критерии на основе дисперсии ошибки, которая должна быть минимальна. Здесь отметим, что использование тестов Люнга-Бокса и информационных критериев в программе STATISTICA возможно только для версий старше 6.0 в отдельных модулях. Построить модели стационарных рядов, учитывающих изменение дисперсии (модели ARCH и GARCH) можно только в программе Eviews, STATISTICA таких возможностей не имеет. Кроме того, найденную модель АРСС с помощью ARCH метода можно протестировать на гетероскедастичную составляющую [1]. Следует отметить, что в версиях Eviews старше 5.1, имеются возможности оценки и спецификации моделей ТARCH и Е-GARCH (моделирует условную дисперсию как ассиметричную функцию, представленную в логарифмическом виде).

Программа Eviews позволяет провести спецификацию векторной авторегрессионной модели и модели исправления ошибки (исследование коинтеграции между несколькими переменными). Проверка коинтеграции в программе осуществляется с помощью процедуры Йохансена, которая определяет число векторов коинтеграции в группе временных рядов и обеспечивает оценки максимального правдоподобия векторов коинтеграции и векторов скорости приведения.

6. Моделирование нестационарных рядов

Обычно моделирование нестационарных рядов проводится на основе модели АРПСС, где порядок интегрирования является порядком взятия разности. В программе STATISTICA с помощью процедуры преобразования ряда вычисляют разности до тех пор, пока ряд не станет стационарным, причем стационарность можно проверить лишь на основе визуального анализа, далее идентифицируют и строят модель АРСС. В приложении Eviews для построения модели АРПСС используется расширенный тест Дики-Фуллера, причем проверка стационарности производится автоматически после взятия разности первого или второго порядков (соответствующий порядок следует указать в диалоговом окне). Отсюда можно сделать вывод, что построение модели АРПСС предпочтительней производить в Eviews.

7. Анализ панельных данных

В последнее время широкое распространение в экономикосоциологических исследованиях получил анализ панельных данных. Программа Eviews на сегодняшний день является одной из немногих статических пакетов, которая позволяет провести исследование панельных данных, причем, следует отметить, что такая возможность имеется только у программ старше пятой версии.

Визуальный анализ представленных данных можно проводить как с учетом структуры панели, так и с учетом объединения данных. Eviews позволяет легко произвести спецификацию модели, учитывающей лаг, а также оценить модель со случайными эффектами, используя тест Хаусмана [1]. Процедуру оценки можно произвести с помощью взвешенного обобщенного МНК. После оценки построенной модели по панельным данным могут быть проанализированы и отображены графически фиксированные и случайные эффекты.

Вывод

Для преподавателей эконометрики и экономико-математического моделирования для общих экономических специальностей следует предпочесть программу STATISTICA, так как в ней проще работать с вводом данных, строить регрессионные модели, исследовать структуру временного ряда, и в отличие от Eviews, нет необходимости запоминать все команды ввода в командной строке. Для более глубокого изучения эконометрического моделирования, например для специальностей «математические методы в экономике», «статистика», предпочтение следует отдать программе Eviews, хотя здесь можно посоветовать схему «от простого к сложному», изучив сначала STATISTICA, затем перейти к выполнению тех же процедур в Eviews.

Что касается предметов изучающих анализ временных рядов, например «методы прогнозирования финансовых показателей» или «методы исследования национальной экономики», то однозначно можно сделать выбор в пользу пакета Eviews, так как лучше всего его возможности раскрываются при решении задачи прогнозирования количественных показателей, представляющих собой именно временной ряд. Следует отметить, что в пакете Eviews имеется достаточно полный арсенал методов по обнаружению и борьбе с типичными для поставленных выше задач проблемами: гетероскедастичность, автокорреляция, нестационарность и наличие коинтеграции.

Для специалистов, занимающихся прогнозированием различного рода финансовых показателей, рекомендуется освоить пакет Eviews, так как сфера применения его охватывает все аспекты современной теории и практики бизнеса. Высокие функциональные возможности при обработке количественных переменных, позволяют говорить о Eviews как о надежном инструменте для прогнозирования продаж, динамики ресурсов, исследования инвестиционного риска. Для прогнозирования финансовых временных рядов EViews, помимо традиционных инструментов прогнозирования позволяет использовать анализ отклика на импульсы и моделирование условной гетероскедастичности, как меры волатильности. Дополнительно, подчеркнем, что EViews позволяет строить прогноз сразу же после построения модели.

Список использованных источников:

1. Практикум по эконометрике: учеб. пособие / Под ред. Елисеевой И.И. – М.: Финансы и статистика, 2007. – 344 с.

2. Саяпова А.Р., Гусельникова Е.А., Лакман И.А., Шамуратов Н.М. Математические методы прогнозирования экономических показателей. Учебное пособие, Уфа, 2000 – 128 с.

3. Шамуратов Н.М., Лакман И.А. Эконометрика. Учебное пособие, Уфа, 2007 – 118 с.



Комментарии:


Оставить комментарий

Вход на сайт

Информация о проекте

Настоящий сайт представляет собой информационный портал, содержащий материалы по проблеме бизнес-аналитики, раскрывающие особенности использования современных подходов и методов анализа и обработки данных, что в условиях современной информатизации общества представляется весьма актуальным при исследовании различных проблем социально-экономического характера.
Настоящий портал содержит материалы познавательного, учебно-методического и научно-исследовательского характера, демонстрирующие современное состояние развития проблемы бизнес-аналитики, проблемы анализа и обработки данных. Особое внимание на страницах сайта уделено методическому и аналитическому инструментарию рассматриваемых проблем. Наряду с теоретическими и аналитическими материалами сайт содержит пакеты программных продуктов, представляющих собой прикладной инструментарий, способный автоматизировать научно-практические исследования в области бизнес-аналитики и бизнес-статистики.

Контакты