Данный пример основан на отчетах Министерства образования США. Файл Teachers.sta содержит следующие данные:
- число учащихся (переменная Children);
- число учителей (Teachers);
- среднюю зарплату учителей (Salary).
Данные собирались через каждые 10 лет за период с 1900 по 1980 год.

Разумно предположить, что число учителей зависит от числа учеников. Однако мы можем ожидать некоторую задержку (лаг) в проявлении этой зависимости. В силу демографических изменений увеличивается число учеников, для которых нужно больше учителей. Однако требуется время, чтобы "создать" этих учителей. Возрастание спроса на учителей приводит к возрастанию их заработной платы (но опять с некоторой задержкой).
Определение анализа. Для начала анализа откройте файл Teachers.sta. Нажмите кнопку Переменные и выберите все переменные, имеющиеся в файле, затем выберите процедуру Анализ распределенных лагов.

Начнем этот пример с числа учителей, это будет зависимая переменная. Независимой переменной будет число учеников. Выделите зависимую переменную Teachers в активной рабочей области; затем нажмите на кнопку независимая переменная и выберите Children. Задайте Длину лага, равную 2 (для того, чтобы оценить задержки в 10 и 20 лет).

Просмотр результатов. Нажмите OK (Начать анализ). Результаты будут представлены в двух таблицах результатов, последовательно появляющихся на экране.


Результаты показывают, что имеется сильная, однако лишь маргинально значимая, зависимость между переменными (R = 0.88). Заметим, что регрессионный анализ распределенных лагов не позволяет включать свободный член в уравнение (см. уравнение, представленное во Вводном обзоре). Как и во многих эконометрических моделях, свободный член в данном примере полагается равным 0, так как очевидно, если число учеников равно 0, то число учителей также должно равняться 0.
Коэффициенты регрессии. Результаты анализа показывают, что имеется 10-ти летнее запаздывание зависимости (числа учителей от количества детей). Но конечно, из-за малого числа наблюдений, t значение не значимо.
Заработная плата. Теперь повторим этот анализ, выбрав переменную Salary как зависимую переменную. Вернитесь в окно Анализ распределенных лагов. Выделите переменную Salary в активной рабочей области и нажмите OK.

Как и ранее, наибольшее t значение имеется во второй строке таблицы результатов и определяет 10-летний лаг.
Заключение. Результаты этого анализа дают основание предположить, что число учителей и их заработок зависят от количества учеников, однако эта зависимость проявляется с задержкой в 10 лет. Это то время, которое необходимо системе, чтобы отреагировать на изменение спроса.
Распределенный лаг Алмона. Как описано в разделе Вводный обзор, стандартные оценки регрессии для анализа лагов иногда сталкиваются с проблемой мультиколлинеарности. Повторим анализ тех же данных, используя метод Алмона. Выберите опцию Полиномиальные лаги Алмона. Затем выделите переменную Teachers в активной рабочей области.
Задание порядка полинома. Как описано в Вводном обзоре, этот метод приближает коэффициенты регрессии полиномом степени меньше, чем длина лага. В нашем примере, установите в поле порядок значение 1. Далее нажмите OK.

В данном случае t значение для 10-ти летнего лага значительно больше, чем для других лагов (что также подтверждает гипотезу о 10-ти летнем запаздывании зависимости). Если вы проведете анализ с заработной платой, то увидите следующие результаты.

Снова коэффициенты регрессии наиболее значимы на лаге 1.
Этот пример взят из справочной системы ППП STATISTICA фирмы StatSoft
Комментарии: