WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 5 | 6 || 8 | 9 |   ...   | 10 |

«Оглавление Введение................................... 11 I Введение в социально-экономическую статистику 15 1. Основные понятия 17 1.1. Краткая историческая справка.. ...»

-- [ Страница 7 ] --

(L)dxt = (L)t или (L)wt = (L)t. (14.55) 14.6. Модель ARIMA В развернутой форме модель 14.55 выглядит как wt = 1wt-1 + 2wt-2 +... + pwt-p + (14.56) + t - 1t-1 - 2t-2 -... - qt-q.

Из-за практического значения такую разновидность моделей ARMA выделяют в отдельный класс моделей авторегрессии — проинтегрированного скользяще го среднего и обозначают ARIMA(p, d, q). При d =0 модель описывает стацио нарный процесс. Как и исходную модель ARMA, мод ель ARIMA также называют моделью Бокса—Дженкинса.

Обозначив f(L) =(L)(1 - L)d, представим процесс ARMA(p + d, q) ввид е:

f(L)xt = (L)t.

f(L) называют обобщенным (нестационарным) оператором авторегрессии, таким, что d корней характеристического уравнения f(z) =0 равны единице, а остальные по модулю больше единицы. Такой процесс можно записать в виде модели ARIMA (L)(1 - L)dxt = (L)t. (14.57) Ряд {xt} называют интегрированным, поскольку он является результатом при менения к стационарному ряду {wt} операции кумулятивной (накопленной) суммы d раз. Так, если d =1, тод ля t > t xt = wi + x0.

i= Этим объясняется название процесса авторегрессии — проинтегрированного скользящего среднего ARIMA(p, d, q).

Этот факт можно символически записать как xt = Sdwt, где S = -1 = (1 - L)-1 — оператор суммирования, обратный к оператору разности. Следует понимать, однако, что оператор S не определен однозначно, поскольку включает некоторую константу суммирования.

Простейшим процессом с единичным корнем является случайное блуждание:

xt = St, где t —белыйшум.

466 Глава 14. Линейные стохастические модели ARIMA 14.7. Оценивание, распознавание и диагностика модели Бокса—Дженкинса Для практического моделирования с использованием модели Бокса—Джен кинса требуется выбрать порядок модели (значения p, q и d), оценить ее пара метры, а затем убедиться, правильно ли была выбрана модель и не нарушаются ли какие-либо предположения, лежащие в ее основе.

Заметим, что один и тот же процесс может быть описан разными моделя ми ARMA (14.41). Во-первых, неоднозначна компонента скользящего среднего (L)t, о чем говорилось выше. Из разных возможных представлений MA здесь следует предпочесть обратимое. Во-вторых, характеристические многочлены ав торегрессии и скользящего среднего могут содержать общие корни. Пусть (z) и (z) содержат общий корень. Тогда характеристические многочлены можно представить в виде (z) = (1 - z/)(z) и (z) = (1 - z/)(z). Соответ ственно, один и тот же процесс можно записать как (L)xt = (L)t или как (L)xt = (L)t.

Ясно, что вторая запись предпочтительнее, поскольку содержит меньше парамет ров. Указанные неоднозначности могут создавать проблемы при оценивании.

Прежде, чем рассмотреть оценивание, укажем, что уравнение (14.41) задает модель в довольно ограничительной форме. А именно, стационарный процесс, за данный уравнением (14.41), должен иметь нулевое математическое ожидание. Для того чтобы сделать математическое ожидание ненулевым, можно ввести в модель константу:

xt = µ + 1xt-1 +... + pxt-p + t - 1t-1 -... - qt-q.

Если процесс {xt} стационарен, то µ E(xt) =.

1 - 1 -· · · -p Альтернативно можно задать xt как xt = + wt, (14.58) где ошибка {wt} является стационарным процессом ARMA:

wt = 1wt-1 +... + pwt-p + t - 1t-1 -... - qt-q. (14.59) 14.7 Оценивание, распознавание и диагностика модели ARIMA При этом E(xt) =. Ясно, что для стационарных процессов два подхода являются эквивалентными.

Последнюю модель можно развить, рассматривая регрессию xt = Zt + wt, (14.60) с ошибкой wt в виде процесса (14.59). В этой регрессии Zt не должны быть коррелированы с процессом wt и его лагами. Составляющая Zt может включать детерминированные тренды, сезонные переменные, фиктивные переменные для выбросов и т.п.

Метод моментов для оценивания параметров модели Бокса—Дженкинса Опишем в общих чертах процедуру оценивания ARIMA(p, d, q). Предположим, что имеется ряд x1,..., xT, по которому требуется оценить параметры процес са. Оценке подлежат три типа параметров: параметры детерминированной части модели (такие как,, о которых речь шла выше), авторегрессионные парамет ры и параметры скользящего среднего. При оценивании предполагается, что порядок разности d, порядок авторегрессии p и порядок скользящего среднего q заданы.

Если ряд {xt} описывается моделью (14.58) (которая предполагает d =0), то параметр этой модели можно оценить с помощью среднего x, а далее дей ствовать так, как если бы процесс сразу задавался моделью (14.59). В качестве wt рассматриваются центрированные значения, полученные как отклонения исходных уровней временного ряда от их среднего значения: wt = xt - x.

Если ряд {xt} описывается более общей моделью (14.60), которая тоже пред полагает d = 0, то можно оценить параметры с помощью обычного МНК, который дает здесь состоятельные, но не эффективные оценки a. Далее можно взять wt = xt - Zta и действовать так, как если бы процесс задавался моделью (14.59).

При d > 0 от ряда xt следует взять d-е разности: wt = dxt. Мы не бу дем рассматривать оценивание детерминированной составляющей в случае d >0.

Заметим только, что исходный ряд не нужно центрировать, поскольку уже первые разности исходных уровней ряда совпадают с первыми разностями центрирован ного ряда. Имеет смысл центрировать d-е разности dxt.

Проведя предварительное преобразование ряда, мы сведем задачу к оценива нию стационарной модели ARMA (14.59), где моделируемая переменная wt имеет нулевое математическое ожидание. Получив ряд w1,..., wT (при d >0 рядбудет 468 Глава 14. Линейные стохастические модели ARIMA на d элементов короче), можно приступить к оцениванию параметров авторегрес сии и скользящего среднего.

Выше мы рассмотрели, как можно оценивать авторегрессии на основе урав нений Юла—Уокера (14.21). Прямое использование этого метода для модели ARMA(p, q) при q >0 невозможно, поскольку в соответствующие уравнения будут входить кросс-ковариации между изучаемым процессом и ошибкой (см. 14.42). Од нако можно избавиться от влияния элементов скользящего среднего, если сдвинуть уравнения на q значений вперед. Тогда уравнения для автокорреляций будут иметь вид (14.43). При k = q +1,..., q + p получим следующую систему (т.е. исполь зуем здесь тот же подход, что и раньше: умножаем (14.59) на wt-q-1,..., wt-q-p и переходим к математическому ожиданию):

q+1 = 1q + 2q-1 +... + pq-p+1, q+2 = 1q+1 + 2q +... + pq-p+2, (14.61) · · · q+p = 1q+p-1 + 2q+p-2 +... + pq.

В итоге имеем систему, состоящую из p уравнений относительно p неизвестных параметров j. Решение этих уравнений, в которых вместо k берутся эмпириче ские значения автоковариаций ck для последовательности значений {wt}, т.е.

T ck = wtwt-k, T t=k+ дает нам оценки параметров 1,..., p 6.

С помощью оценок авторегрессионных параметров можно, с учетом (14.59) построить новый временной ряд p+1,..., T :

t = wt - 1wt-1 -... - pwt-p, и для него рассчитать первые q выборочных автокорреляций r1,..., rq. Полу ченные автокорреляции используются при расчете начальных оценок параметров скользящего среднего 1,..., q.

На данный метод получения оценок параметров авторегрессии можно смотреть как на примене ние метода инструментальных переменных к уравнению регрессии:

wt = 1wt-1 +... + pwt-p + t, где ошибка t является MA(q) и поэтому коррелирована с лагами wt только вплоть до q-го.

В качестве инструментов здесь используются лаги wt-q-1,..., wt-q-p.

14.7 Оценивание, распознавание и диагностика модели ARIMA Действительно, {t} фактически представляет собой процесс скользящего среднего:

t = t - 1t-1 -· · · -qt-q, (14.62) для которого, как мы знаем, первые q автокорреляций могут быть выражены через параметры модели (см. (14.36)):

-k + 1k+1 + 2k+2 +... + q-kq =, k =1,..., q.

k 2 1+1 + 2 +... + q Заменив в этих выражениях на rk, решаем полученную систему q нелинейных k уравнений относительно q неизвестных параметров и получаем их оценки.

Поскольку система уравнений нелинейная, то могут возникнуть некоторые про блемы с ее решением. Во-первых, система может не иметь решений. Во-вторых, решение может быть не единственным.

Рассмотрим в качестве примера случай q =1. При этом имеем одно уравнение с одним неизвестным:

- r1 =.

1+ Максимальное по модулю значение правой части достигается при 1 = ±1. Ес 1 ли |r1| > то уравнение не имеет действительного решения7. Если |r1| < 2, 2, то оценку 1 получим, решая квадратное уравнение. А оно будет иметь два корня:

-1 ± 1 - 4(r1) 1 =.

2r Один из корней по модулю больше единицы, а другой меньше, т.е. один соответ ствует обратимому процессу, а другой — необратимому.

Таким образом, из нескольких решений данных уравнений следует выбирать та кие, которые соответствуют обратимому процессу скользящего среднего. Для это го, если некоторые из корней характеристического уравнения скользящего средне го по модулю окажутся больше единицы, то их следует обратить и получить коэф фициенты, которые уже будут соответствовать обратимому процессу (см. 14.40).

Для q > 1 следует применить какую-либо итеративную процедуру решения нелинейных уравнений8.

Если решения не существует, то это может быть признаком того, что порядок разности d выбран неверно или порядок авторегрессии p выбран слишком низким.

Например, метод Ньютона, состоящий в линеаризации нелинейных уравнений в точке текущих приближенных параметров (т.е. разложение в ряд Тейлора до линейных членов).

470 Глава 14. Линейные стохастические модели ARIMA Описанный здесь метод моментов дает состоятельные, но не эффективные (не самые точные) оценки параметров. Существует ряд методов, позволяющих повысить эффективность оценок.

Методы уточнения оценок Система (14.61) при q > 1 основана на уравнениях для автоковариаций, ко торые сдвинуты на q. Поскольку более дальние выборочные автоковариации вы числяются не очень точно, то это приводит к не очень точным оценкам параметров авторегрессии. Чтобы повысить точность, можно предложить следующий метод.

С помощью вычисленных оценок 1,..., q, на основе соотношения (14.62), находим последовательность значений {t} по рекуррентной формуле:

t = t + 1t-1 +... + qt-q.

Вкачестве t-j при t j берем математическое ожидание ряда E(t) =0.

Получив с помощью предварительных оценок и последовательность зна чений {t} и имея в наличии ряд {wt}, методом наименьших квадратов находим уточненные оценки параметров модели (14.59), рассматривая t в этом уравнении как ошибку.

Можно также получить уточненные оценки параметров детерминированной компоненты в модели (14.60). Для этого можно использовать обобщенный ме тоднаименьших квадратов (см. гл. 8), основанный на оценке ковариационной мат рицы ошибок wt, которую можно получить, имея некоторые состоятельные оценки параметров процесса ARMA.

Автоковариационную матрицу процесса ARMA можно представить в виде =. Оценку матрицы можно получить, имея оценки параметров авто регрессии и скользящего среднего (см. выше вывод автоковариационной функции процесса ARMA). Имея оценку, воспользуемся обобщенным МНК для оцени вания параметров регрессии:

aОМНК =(Z -1Z)-1Z -1X.

Можно использовать также автокорреляционную матрицу R:

aОМНК =(Z R-1Z)-1Z R-1X.

В качестве примера приведем регрессию с процессом AR(1) в ошибке. Матрица автокорреляций для стационарного процесса AR(1), соответствующего последова 14.7 Оценивание, распознавание и диагностика модели ARIMA тельности значений w1,..., wT, имеет вид:

1 2 · · · T - 1 · · · T - R = 2 1 · · · T -3.

....

.

.....

.

....

T -1 T -2 T -3 · · · Несложно убедиться, что обратная к R матрица имеет вид:

1 - 0 · · · 0 - (1 + 2) - · · · 0 0 - (1 + 2) · · · 0 R-1 =.

.....

.

......

.

.....

0 0 0 · · · (1 + 2) 0 0 0 · · · - Матрицу R-1 легко представить в виде произведения: R-1 = D D, где - 2 0 0 · · · - 1 0 · · · D =.

0 - 1 · · ·....

.

.....

.

....

0 0 0 · · · Далее можем использовать полученную матрицу D для преобразования в про странстве наблюдений:

Z = DZ, X = DX, (14.63) тогда полученные в преобразованной регрессии с помощью обычного МНК оценки будут оценками обобщенного МНК для исходной регрессии:

aОМНК =(Z Z)-1Z X.

472 Глава 14. Линейные стохастические модели ARIMA 0. 0. 0. 0. 0. 0. 0. 0. 0 50 100 150 200 0 50 100 150 Рис. 14.6. Автокорреляционная функция интегрированного процесса (слева) и стационарного процесса (справа) Они будут обладать не только свойством состоятельности, но и свойством эффек тивности.

К примеру, для парной регрессии xt = zt + wt, где w = wt-1 + t, преоб разование (14.63) приводит к уравнениям 1 - 2x1 = 1 - 2z1 + и xt - xt-1 = (zt - zt-1) +, t > 1, t для оценивания которых при данном применим обычный МНК.

После получения эффективных оценок параметров регрессии можно пере смотреть оценки параметров процесса ARMA. Можно продолжать такие итера ции и далее до тех пор, пока не будет достигнута требуемая сходимость (см. метод Кочрена—Оркатта, описанный в п. 8.3).

Распознавание порядка модели Сначала вычисляются разности исходного ряда до тех пор, пока они не окажутся стационарными относительно математического ожидания и дисперсии, и отсюда получают оценку d.

Если процесс является интегрированным, то его выборочная автокорреляци онная функция затухает медленно, причем убывание почти линейное. Если же автокорреляционная функция затухает быстро, то это является признаком стаци онарности. В качестве примера на рисуке 14.6 слева изображена коррелограмма 14.7 Оценивание, распознавание и диагностика модели ARIMA ряда длиной в 1000 наблюдений, полученного по модели ARIMA(3, 1, 2), заданной уравнением (14.53). Справа на том же рисунке изображена коррелограмма первых разностей того же ряда, которые подчиняются стационарной модели ARMA(3, 2), заданной уравнением (14.54).

Формальные критерии выбора d рассматриваются в пункте 17.4.

Следует понимать, что достаточно сложно отличить процесс, который имеет единичный корень, от стационарного процесса, в котором есть корень близкий к единице.

Если d окажется меньше, чем требуется, то дальнейшее оценивание будет применяться к нестационарному процессу, что должно проявиться в оценках па раметров авторегрессии — в сумме они будут близки к единице. Если d ока жется больше, чем требуется, то возникнет эффект избыточного взятия разности (overdifferencing), который проявляется в том, что в характеристическом уравнении скользящего среднего появляется единичный корень. Это может создать трудности при оценивании скользящего среднего.

Для выбора порядка авторегрессии можно использовать выборочную частную автокорреляционную функцию. Как известно, теоретическая частная автокорреля ционная функция процесса AR(p) обрывается на лаге p. Таким образом, p следует выбрать равным порядку, при котором наблюдается последнее достаточно боль шое (по модулю) значение выборочной частной автокорреляционной функции. До верительные интервалы можно основывать на стандартной ошибке выборочного частного коэффициента автокорреляции, которая равна примерно для по T рядков выше p (для которых теоретическая автокорреляционная функция равна нулю).

Аналогично, для выбора порядка скользящего среднего можно использовать выборочную автокорреляционную функцию, поскольку теоретическая автокорре ляционная функция процесса MA(q) обрывается на лаге q. Таким образом, q следу ет выбрать равным порядку, при котором наблюдается последнее достаточно боль шое (по модулю) значение выборочной автокорреляционной функции. Стандартная ошибка выборочного коэффициента автокорреляции тоже примерно равна.

T Более точная формула стандартной ошибки для автокорреляции порядка k ( k >q) T - k имеет вид (см. стр. 367).

T (T +2) Если же нет уверенности, что процесс является чистой авторегрессией или чистым процессом скользящего среднего, то эти методы не подходят. Но, по крайней мере, по автокорреляционной функции и частной автокорреляционной функции можно проследить, насколько быстро угасает зависимость в ряде.

474 Глава 14. Линейные стохастические модели ARIMA Порядок модели ARMA(p, q) можно выбирать на основе информационных кри териев:

информационный критерий Акаике:

2(p + q + n +1) AIC =ln(s2) + ;

e T байесовский информационный критерий Шварца:

(p + q + n +1) lnT BIC =ln(s2) +.

e T Здесь s2 — остаточная дисперсия, рассчитанная по модели, n +1 относится e к дополнительным оцениваемым параметрам — константе и коэффициентам при факторах регрессии (14.60). Порядок (p, q) выбирается посредством перебора из некоторого множества моделей так, чтобы информационный критерий достигал минимума. Критерий Акаике нацелен на повышение точности прогнозирования, а байесовский критерий — на максимизацию вероятности выбора истинного по рядка модели.

Можно также выбирать порядок по тому принципу, что остатки должны быть похожи на белый шум, для чего использовать проверку остатков на автокорреля цию. Если остатки автокоррелированы, то следует увеличить p или q.

Диагностика В основе модели ARIMA лежит предположение, что ошибки t являются бе лым шумом. Это предполагает отсутствие автокорреляции и гомоскедастичность ошибок. Для проверки ошибок на гомоскедастичность могут использоваться те же критерии, которые были рассмотрены ранее в других главах. Здесь мы рассмотрим диагностику автокорреляции ошибок.

Простейший способ диагностики — графический, состоящий в изучении кор релограммы и спектрограммы остатков. Кореллограмма должна показывать толь ко малые, статистически незначимые значения автокорреляций. Спектрограмма должна быть достаточно «плоской», не иметь наклона и не содержать сильно вы деляющихся пиков.

Для формальной проверки отсутствия автокорреляции ошибок можно исполь зовать Q-статистику Бокса—Пирса и ее модификацию — статистику Льюнга— Бокса, которые основаны на квадратах нескольких ( m) первых выборочных коэф фициентов автокорреляции9 (см. стр. 368).

При выборе числа m следует помнить, что при малом m, если имеется автокорреляция высокого порядка, критерий может не показать автокорреляцию. При большом же m присутствие значитель 14.8. Прогнозирование по модели Бокса—Дженкинса Статистика Бокса—Пирса:

m Q = n rk.

k= Статистика Льюнга—Бокса:

m rk Q = n(n +2).

n - k k= Здесь в качестве rk следует использовать выборочные коэффициенты авто корреляции, рассчитанные на основе остатков et модели ARIMA:

n etet-k t=k+ rk =.

n e t t= Поскольку для вычисления rk используется не белый шум, а остатки, то асимпто тическое распределение этих Q-статистик отличается от того, которое имеет место для истинного белого шума, на количество параметров авторегрессии и скользя щего среднего, оцененных по модели, т.е. на величину (p + q). Обе статистики асимптотически распределены как 2. Как показали Льюнг и Бокс, предло m-p-q женная ими модифицированная Q-статистика, которая придает меньший вес даль ним автокорреляциям, имеет распределение, которое ближе аппроксимирует свой асимптотический аналог, поэтому более предпочтительно использовать именно ее.

Нулевая гипотеза состоит в том, что ошибка представляет собой белый шум (автокорреляция отсутствует). Если Q-статистика превышает заданный квантиль распределения хи-квадрат, то нулевая гипотеза отвергается и делается вывод о том, что модель некорректна. Возможная причина некорректности — неудачный выбор порядка модели (слишком малые значения p и q).

14.8. Прогнозирование по модели Бокса—Дженкинса Прогнозирование стационарного процесса ARMA Пусть для стационарного обратимого процесса ARMA вмомент t делается про гноз процесса x на шагов вперед, т.е. прогноз величины xt+. Для упрощения ных автокорреляций может быть не замечено при наличии большого числа незначительных. То есть мощность критерия зависит от правильного выбора m.

476 Глава 14. Линейные стохастические модели ARIMA рассуждений предположим, что при прогнозировании доступна вся информация о процессе x до момента t включительно, т.е. информация, на основе которой строится прогноз, совпадает с полной предысторией процесса t =(xt, xt-1,... ).

Заметим, что на основе (xt, xt-1,... ) можно однозначно определить ошиб ки (t, t-1,... ) и наоборот, поэтому при сделанных предположениях ошибки (t, t-1,... ) фактически входят в информационное множество. Кроме того, имея полную предысторию, можно точно вычислить параметры процесса, поэтому будем далее исходить из того, что параметры процесса нам известны.

Из теории прогнозирования известно, что прогнозом, минимизирующим сред ний квадрат ошибки, будет математическое ожидание xt+, условное относительно t, т.е. E (xt+ |t). Убедимся в этом, воспользовавшись представлением модели ARMA в виде модели линейного фильтра (разложением Вольда) (14.52) xt+ = t+ + 1t+-1 +... + -1t+1 + t + +1t-1 +..., где во вторую строчку вынесены слагаемые, относящиеся к предыстории;

получим таким образом следующее представление условного математического ожидания:

E (xt+ |t) =E (t+ |t) +1E (t+ -1|t) +... + + -1E (t+1|t) + t + +1t-1 +....

Вторую строчку формулы пишем без оператора условного математического ожи дания, поскольку соответствующие слагаемые входят в предысторию t.

Будем предполагать, что условное относительно предыстории математическое ожидание будущих ошибок равно нулю, т.е. E (t+k|t) =0 при k >0. Этобуд ет выполнено, например, если все ошибки t независимы между собой. (Отсутствия автокорреляции тут недостаточно. В приложении приводится пример белого шума, для которого это неверно.) Тогда рассматриваемое выражение упрощается:

E (xt+ |t) = t + +1t-1 +..., что дает нам линейную по ошибкам формулу для оптимального прогноза:

xt () = t + +1t-1 +... = +it-i, (14.64) i= где мы обозначили через xt () прогноз на периодов, сделанный в момент t.

14.8. Прогнозирование по модели Бокса—Дженкинса Проверим, что эта прогнозная функция будет оптимальной (в смысле минимума среднего квадрата ошибки) среди линейных прогнозных функций, т.е. среди про гнозных функций, представимых в виде линейной комбинации случайных ошибок, входящих в предысторию:

xt() = t + +1t-1 + +2t-2 +... = +it-i.

i= Для этого найдем веса, +1, +2,..., которые обеспечивают минимум сред него квадрата ошибки. С учетом того, что xt+ = it+ -i, ошибка такого i= прогноза t() равна t() =xt+ - xt() = it+-i - +it-i = i=0 i= - = it+-i + (+i - +i)t-i, i=0 i= а средний квадрат ошибки прогноза (с учетом некоррелированности ошибок) равен - E[t()2] =E it+ -i + ( +i - +i)t-i = i=0 i= - = E i 2 + ( +i - +i)22 = t+-i t-i i=0 i= 2 2 2 2 = (1 + 1 + 2 +... + -1) + (+i - +i)2.

i= Очевидно, что средний квадрат ошибки достигает минимума при +i = +i иравен - 2 E[t()2] = 1+ i.

i= Ошибка такого прогноза рассчитывается по формуле - t() = it+ -i.

i= Из формулы видно, что эта ошибка проистекает из будущих ошибок t+k, которые в момент t еще неизвестны. Беря математическое ожидание от обеих частей, 478 Глава 14. Линейные стохастические модели ARIMA видим, что математическое ожидание ошибки прогноза равно нулю. Таким образом, прогноз, полученный по формуле (14.64), будет несмещенным.

Из несмещенности прогноза следует, что дисперсия ошибки прогноза равна среднему квадрату ошибки прогноза, т.е.

- 2 2 p = E[t()2] = 1+ i.

i= или - 2 2 p = i, i= где 0 =1.

Хотя представление в виде бесконечного скользящего среднего удобно для ана лиза прогнозирования, однако для вычисления прогноза предпочтительнее вер нуться к исходному представлению модели ARMA в виде разностного уравнения (со сдвигом на периодов вперед):

xt+ = 1xt+-1 +... + pxt+-p + +t+ - 1t+-1 -... - qt+-q.

Возьмем от обеих частей уравнения условное относительно предыстории мате матическое ожидание:

xt() =E[xt+ |t] =1E[xt+-1|t] +... + pE[xt+-p|t] + + E[t+ |t] - 1E[t+-1|t] -... - qE[t+-q|t].

Введем более компактные обозначения:

E[xt+i|t] = E[xt+ |i] = xt+i, t+i.

В этих обозначениях xt() = = 1xt+ -1 +... + pxt+ -p + xt+ + - 1t+ -1 -... - qt+ -q. (14.65) t+ 14.8. Прогнозирование по модели Бокса—Дженкинса При вычислении входящих в эту формулу условных математических ожиданий используют следующие правила:

xt+i, i 0, xt+i = E[xt+i|t] = xt(i), i > 0, t+i, i 0, t+i = E[t+i|t] = 0, i > 0, дающие удобную рекуррентную формулу для вычисления прогнозов.

Для вычисления показателя точности прогноза (дисперсии ошибки прогноза или, что в данном случае то же самое, поскольку прогноз несмещенный, среднего квадрата ошибки прогноза), удобно опять вернутся к представлению модели в виде бесконечного скользящего среднего. Как мы видели, дисперсия ошибки прогно -1 2 за равна p = (1 + i ). Формулы для вычисления коэффициентов i i= скользящего среднего приведены на стр. 462.

Мы вывели формулы для расчета точечного прогноза по модели ARMA и диспер сии этого прогноза. Если дополнительно предположить, что ошибки t подчиняют ся нормальному закону (т.е. представляют собой гауссовский процесс), то можно получить также интервальный прогноз. При этом предположении при известных значениях процесса до момента t распределение будущего значения процесса xt+ (т.е. условное распределение xt+ |t) также будет нормальным со средним значе нием xt() и дисперсией p:

xt+ |t N xt(), p.

Учитывая это, получаем доверительный интервал для xt+, т.е. интервальный про гноз:

[xt() - 1-p, xt() +1-p], или -1 - 2 xt() - 1- i=0 i, xt() +1- i=0 i, (14.66) где 1- — двусторонний (1 - )-квантиль стандартного нормального распреде ления. Это (1 - ) · 100-процентный доверительный интервал.

480 Глава 14. Линейные стохастические модели ARIMA Прогнозирование процесса ARIMA Для прогнозирования процесса ARIMA(p, d, q) при d >0 можно воспользо ваться представлением его в виде ARMA(p + d, q):

f(L)xt = (L)t, где f(L) =1 - f1L - f2L2 -... - fp+dLp+d = (L)(1 - L)d, а коэффициенты f1, f2,..., fp+d выражаются через 1, 2,..., p. Вразверну той записи p+d q xt = fjxt-j + t - jt-j. (14.67) j=1 j= Например, модель ARIMA(1, 1, 1), (1 - 1L)(1 - L)xt =(1 - 1L)t, можно записать в виде:

xt =(1 +1)xt-1 - 1xt-2 + t - 1t-1 = f1xt-1 + f2xt-2 + t - 1t-1, где f1 =1 +1, f2 = -1.

При расчетах можно использовать те же приемы, что и выше для ARMA.

Некоторую сложность представляет интерпретация ARIMA(p, d, q) в вид е мод е ли линейного фильтра, поскольку ряд модулей коэффициентов такого разложения является расходящимся. Однако это только технические сложности обоснования формул (в которые мы не будем вдаваться), а сами формулы фактически не меня ются.

Таким образом, отвлекаясь от технических тонкостей, можем записать ARIMA(p, d, q) ввид еMA():

(L) xt = t = t + 1t-1 + 2t-2 +... = (L)t. (14.68) f(L) Функцию реакции на импульсы можно рассчитать по рекуррентной формуле p+d i = fji-j - i, (14.69) j= 14.8. Прогнозирование по модели Бокса—Дженкинса где 0 =1, i =0 при i <0 и i =0 при i >q.

Кроме того, прогнозы xt() можно вычислять по рекуррентной формуле, ко торая получается из (14.67) по аналогии с (14.65):

p+d q xt() = = fjxt+ -j + - jt+ -j, (14.70) xt+ t+ j=1 j= где условные математические ожидания xt+i = E[xt+i|t] и t+i = E[t+i|t] рассчитываются по тому же принципу, что и в (14.65).

Таким образом, для прогнозирования в модели ARIMA можно использовать формулы (14.70), (14.8) и (14.66), где коэффициенты i рассчитываются в соот ветствии с (14.69).

Альтернативный подход к прогнозированию в модели ARIMA(p, d, q) состоит в том, чтобы сначала провести необходимые вычисления для wt = (1 - L)dxt, т.е. процесса ARMA(p, q), который лежит в основе прогнозируемого процесса ARIMA(p, d, q), а потом на их основе получить соответствующие показатели для xt.

Так, (14.70) можно записать в виде E[f(L)xt+ |t] =E[(L)(1 - L)dxt+ |t] =E[(L)t+ |t], т.е.

E[(L)wt+ |t] =E[(L)t+ |t] или (L)wt+ = (L).

t+ Здесь по аналогии wt+i = E[wt+i|t], причем wt+i = wt(i) (равно прогнозу) при i >0 и wt+i = wt+i (равно значению самого ряда) при i 0.

Отсюда видно, что можно получить сначала прогнозы для процесса wt по фор мулам (14.65), заменив xt на wt, а затем применить к полученным прогнозам оператор Sd =(1 - L)-d, т.е. попросту говоря, просуммировать такой ряд d раз, добавляя каждый раз нужную константу суммирования. В частности, при d = получаем i xt(i) =xt + wt(j).

j= Далее, (L) можно записать в виде (L) (L) (L) = =(1 - L)-d =(1 - L)-dw(L) =Sdw(L).

f(L) (L) 482 Глава 14. Линейные стохастические модели ARIMA Здесь w(L) = (L)/(L) — оператор представления MA( ) д ля wt. Таким w образом, коэффициенты i можно рассчитать из коэффициентов i. Например, при d =1 получаем i w i = j.

j= Получение общих формул для прогнозирования в модели ARIMA с помощью решения разностных уравнений Формула (14.70) представляет собой разностное уравнение для xt+, решив которое получаем в явном виде общую формулу прогноза. Проиллюстрируем этот прием на примере процесса ARIMA(1, 1, 1), для которого f1 =1 +1, f2 = -1:

xt+ =(1 +1)xt+-1 - 1xt+-2 + t+ - 1t+-1. (14.71) Берем условное математическое ожидание от обеих частей равенства (14.71), получаем точечные прогнозы на 1, 2,..., шагов вперед.

xt(1) = (1 + 1)xt - 1xt-1 - 1t, xt(2) = (1 + 1)xt(1) - 1xt, xt(3) = (1 + 1)xt(2) - 1xt(1),.

.

.

xt() =(1 +1)xt( - 1) - 1xt( - 2), > 2.

Мы видим, что начиная с > q =1 природу прогнозирующей функции опре деляет только оператор авторегрессии:

xt+ =(1 +1) - 1xt+-2, > 1.

xt+- Общее решение этого разностного уравнения имеет следующий вид:

xt+ = A0 + A1.

Чтобы вычислить неизвестные коэффициенты, необходимо учесть, что xt = xt и xt+1 = xt(1) = (1 + 1)xt - 1xt-1 - 1t. Получается система уравнений:

A0 + A1 = xt, A0 + A11 =(1 +1)xt - 1xt-1 - 1t, из которой находятся A0 и A1.

14.8. Прогнозирование по модели Бокса—Дженкинса Точно так же можно рассматривать формулу (14.69) как разностное уравнение, решая которое относительно i, получим в явном виде общую формулу для функции реакции на импульсы. По формуле (14.69) получаем 0 =1, 1 =(1 +1)0 - 1 =1 +1 - 1, 2 =(1 +1)1 - 10,.

.

.

i =(1 +1)i-1 - 1i-2, i > 1.

Легко показать, что решение этого разностного уравнения имеет следующий общий вид:

i = B0 + B1i, 1 - 1 1 - где B0 =, B1 =1 - B0 =. С учетом этого модель ARIMA(1, 1, 1) 1 - 1 1 - представляется в виде:

xt = B0 + B1i t-i.

i= Используя полученную формулу для коэффициентов i, найдем также диспер сию прогноза:

- 2 - 2 p = 2 = 1 - 1 +(1 - 1) i.

i (1 - 1) i=0 i= Отметим, что в пределе слагаемые стремятся к положительному числу 1 - 1.

Это означает, что с ростом горизонта прогноза дисперсия (а, следовательно, ширина прогнозного интервала) неограниченно возрастает. Такое поведение дис персии связано с тем, что рассматриваемый процесс является нестационарным.

Прогнозирование по модели Бокса—Дженкинса в конечных выборках Выше мы предполагали, что в момент t известна полная предыстория t =(xt, xt-1,... ). Фактически, однако, человеку, производящему прогноз, из вестен только некоторый конечный ряд (x1,..., xt). В связи с этим для практиче ского использования приведенных формул, требуется внести в них определенные поправки.

484 Глава 14. Линейные стохастические модели ARIMA В частности, параметры модели на практике не известны, и их требуется оце нить. Это вносит дополнительную ошибку в прогноз.

Кроме того, ошибки t, вообще говоря, неизвестны, и вместо них в выражении (14.65) следует использовать остатки et, полученные в результате оценивания модели. При наличии в модели скользящего среднего (т.е. при q > 0) ошибки не выражаются однозначно через наблюдаемый ряд {xt} и требуется использовать какое-то приближение. Наиболее простой метод состоит в том, чтобы положить остатки et при t 0 равными нулю, а остальные остатки вычислять рекуррентно, пользуясь формулой p+d q t = xt - fjxt-j + jt-j, j=1 j= где вместо ошибок t используются остатки et, а вместо неизвестных истинных параметров fj и j —их оценки.

Из-за того, что параметры не известны, а оцениваются, дисперсия ошибки про гноза будет выше, чем следует из (14.8). Имея некоторую оценку ковариационной матрицы оценок параметров, можно было бы внести приблизительную поправку, но эти расчеты являются достаточно громоздкими.

Далее, расчеты дисперсии прогноза с использованием (14.8) сами по себе явля ются приближенными, поскольку встречающиеся там величины приходится оцени вать. Это относится и к функции реакции на импульсы i, и к дисперсии ошибки.

Приложение.

Неоптимальность линейных прогнозов в модели ARMA То, что ошибка t представляет собой белый шум (т.е. ошибки некоррелиро ваны, имеют нулевое математическое ожидание и одинаковую дисперсию), не под разумевает, что E (t+k|t) =0 при k >0. Поэтому в общем случае прогнозная функция, полученная по формуле (14.64) (или, эквивалентно, (14.65)) не будет оптимальной в среднеквадратическом смысле. Однако она, как было показано, является оптимальной среди линейных прогнозных функций. Кроме того, если ошибки независимы, то требуемое свойство выполнено. В частности, оно верно для гауссовского белого шума, т.к. для гауссовских процессов некоррелирован ность эквивалентна независимости.

Рассмотрим в качестве примера неоптимальности прогноза (14.64) следующий процесс {t}. Значения, соответствующие четным t независимы и распределены как N(0;

1). При нечетных же t значения определяются по формуле 2 - t- t =.

14.9. Модели, содержащие стохастический тренд Таким образом, при нечетных t значения ряда полностью предопределены предыс торией. Несложно проверить, что данный процесс представляет собой белый шум.

Он имеет нулевое математическое ожидание, единичную дисперсию и не автокор релирован. Если же построить на основе такого белого шума марковский процесс xt = 1xt-1 + t, то при нечетных t оптимальным прогнозом на один шаг вперед будет не 1xt-1, а 1xt-1 + 2 - 1 / 2, причем прогноз будет безошибочным.

t- При четных же t стандартная формула будет оптимальной.

Приведенный пример наводит на мысль о том, что во многих случаях мож но подобрать нелинейную прогнозную функцию, которая позволяет сделать более точный прогноз, чем полученная нами оптимальная линейная прогнозная функция.

В качестве менее экзотического примера можно привести модели с авторегрессион ной условной гетероскедастичностью, о которых речь идет в одной из последующих глав.

14.9. Модели, содержащие стохастический тренд Модели со стохастическим трендом можно отнести к классу линейных нестаци онарных моделей ARIMA(p, d, q), но они имеют свои особенности.

Рассмотрим эти модели.

1. Модель случайного блуждания (The Random Walk Model).

Эта модель является частным случаем модели AR(1) с единичным корнем:

xt = xt-1 + t. (14.72) Если начальное условие x0 известно, общее решение может быть представлено ввид е t xt = x0 + i.

i= Безусловное математическое ожидание: E(xt) =E(xt+k) =x0.

Условное математическое ожидание:

k t E(xt+k|t) =E((xt + t+i)|t) =xt = x0 + i.

i=1 i= Таким образом, условное математическое ожидание E(xt+k|t) обязательно t включает в себя случайную компоненту, равную i, которую называют сто i= хастическим трендом.

486 Глава 14. Линейные стохастические модели ARIMA Для любых значений k влияние каждой ошибки на последовательность {xt} со временем не исчезает.

2 Безусловная дисперсия: var(xt) =t, var(xt+k) =(t + k).

k Условная дисперсия: var(xt+k|t) =var((xt + t+i)|t) =k.

i= Таким образом, и безусловная, и условная дисперсии зависят от времени, что свидетельствует о нестационарности процесса случайного блуждания.

Этот вывод подтверждается расчетом коэффициентов автоковариации и авто корреляции, которые также зависят от времени:

k = cov(xt, xt+k) =E((xt - x0)(xt+k - x0)) = = E((1 +... + t)(1 +... + t+k)) = E(2 +... + 2) =t ·.

1 t Тогда t t k = =.

2 t + k t(t + k) В практических ситуациях нередко модель случайного блуждания используется для описания динамики темпов роста.

В модели случайного блуждания первая разность xt = t — чисто слу чайный процесс, следовательно, эта модель может быть интерпретирована как ARIMA(0, 1, 0).

2. Модель случайного блуждания с дрейфом (The Random Walk plus Drift Model).

Эта модель получается из модели случайного блуждания добавлением констан ты a0:

xt = xt-1 + a0 + t. (14.73) Общее решение для xt при известном x0:

t xt = x0 + a0t + i.

i= Здесь поведение xt определяется двумя нестационарными компонентами: линей t ным детерминированным трендом a0t и стохастическим трендом i.

i= Ясно, что динамику ряда определяет детерминированный тренд. Однако не сле дует думать, что всегда легко различить процесс случайного блуждания и процесс случайного блуждания с дрейфом.

14.9. Модели, содержащие стохастический тренд На практике многие ряды, включая предложение денег и реальный ВНП, ведут себя как процесс случайного блуждания с дрейфом.

Заметим, что первая разность ряда стационарна, т.е. переход к первой разности создает стационарную последовательность: {xt} = {a0 + t} с математическим ожиданием, равным a0, дисперсией и k =0 для всех t, следовательно, это тоже ARIMA(0, 1, 0).

3. Модель случайного блуждания с шумом (The Random Walk plus Noise Model).

Эта модель представляет собой совокупность стохастического тренда и компо ненты белого шума. Формально модель описывается двумя уравнениями:

xt = µt + t, (14.74) µt = µt-1 + t, где {t} — белый шум с распределением N(0, ), t и t независимо распре делены для всех t и k: E(t, t-k) =0.

Общее решение системы (14.74) имеет вид:

t xt = µ0 + i + t.

i= Легко убедиться в том, что все моменты второго порядка зависят от времени:

2 var(xt) =t +, k = cov(xt, xt+k) =E((1 +... + t + t)(1 +... + t-k + t)) = t, t k =.

2 2 2 (t + )((t + k) + ) Следовательно, процесс 14.74 нестационарен. Но первая разность этого процесса xt = t +t стационарна с параметрами:

E(xt) =E(t +t) =0, var(xt) =E((xt)2) =E((t +t)2) = 2 2 2 2 = +2E(tt) +E(t - 2tt-1 + t-1) = +2, 1 = cov(xt, xt-1) =E((t + t - t-1)(t-1 + t-1 - t-2)) = -, k = cov(xt, xt-k) =E((t + t - t-1)(t-k + t-k - t-k-1)) = 0, k > 1.

Таким образом, первые разности ведут себя как MA(1)-процесс, а модель случай ного блуждания с шумом можно квалифицировать как ARIMA(0, 1, 1).

488 Глава 14. Линейные стохастические модели ARIMA 4. Модель общего тренда с нерегулярностью (The General Trend plus Irregular Model).

Эта модель содержит детерменированный и стохастический тренды, а также MA(q)-ошибку. Частный ее вариант:

xt = µt + t, (14.75) µt = µt-1 + a0 + t.

t Решением (14.75) является модель общего тренда a0t + i с шумом:

i= t xt = µ0 + a0t + i + t.

i= Первая разность этой модели отличается от предыдущего варианта на константу a0: xt = a0 + t +t. Поэтому E(xt) =a0, 2 var(xt) = +2, 1 = -, k =0, k > 1.

Следовательно, модель общего тренда с шумом — это также ARIMA(0, 1, 1).

В более общей постановке эта модель формулируется при помощи операто ра (L):

t xt = µ0 + a0t + i + (L)t.

i= 5. Модель локального линейного тренда (The Local Linear Trend Model).

Пусть {t}, {t} и {t} — три взаимно некоррелированных процесса белого шума. Тогда модель представляется следующими уравнениями:

xt = µt + t, µt = µt-1 + at + t, (14.76) at = at-1 + t.

Легко показать, что рассмотренные ранее модели являются частными случаями данной модели.

14.9. Модели, содержащие стохастический тренд Для нахождения решения выражаем at из последнего уравнения системы (14.76):

t at = a0 + i.

i= Этот результат используется для преобразования µt:

t µt = µt-1 + a0 + i + t.

i= Далее, t t- µt = µ0 + i + a0t + (t - j)j+1.

i=1 j= Наконец, находим решение для xt:

t t- xt = µ0 + i + a0t + (t - j)j+1 + t.

i=1 j= Каждый элемент в последовательности {xt} содержит детерминированный тренд, причем весьма специфического вида, стохастический тренд и шум t.

Модель локального линейного тренда ведет себя как ARIMA(0, 2, 2). Действи тельно, первые разности процесса xt = at + t +t нестационарны, посколь ку at — процесс случайного блуждания. Однако, вторая разность 2xt = t +t +2t уже стационарна и имеет с параметры:

E(2xt) =0, 2 2 var(2xt) = + +6, 2 1 = - - 4, 2 =.

Все остальные коэффициенты автоковариации k для k >2 равны нулю.

490 Глава 14. Линейные стохастические модели ARIMA 14.10. Упражнения и задачи Упражнение Сгенерируйте ряд длиной 4000 наблюдений по модели AR(1) с параметром =0.5 и нормально распределенной неавтокоррелированной ошибкой с единич ной дисперсией, предполагая что значение ряда в момент t =0 равно нулю. В дей ствительности вид модели неизвестен, а задан только ряд.

1.1. Разбейте ряд на 200 непересекающихся интервалов по 20 наблюдений.

По каждому из них с помощью МНК оцените модель AR(1). Проанализи руйте распределение полученных оценок авторегрессионного параметра. На сколько велика дисперсия оценок и есть ли значимое смещение по сравнению с истинным параметром?

1.2. Рассмотрите построение прогноза на 1 шаг вперед с помощью трех моде лей: AR(1), AR(2) и модели линейного тренда. Для этого ряд следует раз бить на 200 непересекающихся интервалов по 20 наблюдений. По каждому из этих интервалов с помощью МНК необходимо оценить каждую из трех моделей, построить прогноз и найти ошибку прогноза. Сравните среднеквад ратические ошибки прогноза по трем моделям и сделайте выводы.

Упражнение Сгенерируйте 200 рядов длиной 20 наблюдений по модели AR(1) с авторе грессионным параметром 1 =(k - 1)/200, k =1,..., 200, с нормально распре деленной неавтокоррелированной ошибкой и единичной дисперсией. По каждому ряду с помощью МНК оцените модель AR(1). Постройте график отклонения оценки от истинного значения параметра в зависимости от истинного значения параметра 1. Что можно сказать по этому графику о поведении смещения оценок в зависи мости от 1? Подтверждается ли, что оценки смещены в сторону нуля и смещение тем больше, чем 1 ближе к единице?

Упражнение Сгенерируйте 200 рядов длиной 20 наблюдений по модели MA(2) с парамет рами 1 = 0.5, 2 = 0.3 и нормально распределенной неавтокоррелированной ошибкой с единичной дисперсией.

3.1. Для каждого из рядов постройте выборочную автокорреляционную функцию для лагов 1, 2, 3. Рассмотрите распределение коэффициентов автокорреля ции и сравните их с теоретическими значениями.

14.10 Упражнения и задачи 3.2. По каждому ряду на основе выборочных коэффициентов автокорреляции оцените модель MA(2), выбирая то решение квадратного уравнения, которое соответствует условиям обратимости процесса. Рассмотрите распределение оценок и сравните их с истинными значениями.

Упражнение Имеется информация о реальных доходностях ценных бумаг для трех фирм Blaster, Mitre, и Celgene (дневные доходности, приведенные к годовым). (См. табл.

14.1.) 4.1. Изобразите график ряда для каждой из фирм и кратко охарактеризуйте свой ства ряда.

4.2. Для каждой из фирм посчитайте среднее по двум разным непересекающимся подпериодам. Проверьте гипотезу равенства двух средних, используя простой t-критерий.

4.3. Для каждой из фирм посчитайте дисперсию по тем же двум подпериодам.

Проверьте гипотезу равенства дисперсий, используя F -критерий. Какой вы вод можно сделать относительно стационарности рядов?

4.4. Для каждой из фирм рассчитайте выборочные автоковариации, автокорре ляции и выборочные частные автокорреляции для лагов 0,..., 6. Постройте соответствующие графики. Оцените значения параметров p и q модели ARMA(p, q).

4.5. Оцените параметры и модели ARMA(p, q) для каждой фирмы.

4.6. Постройте прогнозы доходности ценных бумаг на основе полученных моделей на 6 дней вперед.

Упражнение Для данных по производству природного газа в СССР (табл. 12.2, с. 403) по стройте модель ARIMA(p, d, q) и оцените доверительный интервал для прогноза на 5 шагов вперед.

Задачи 1. Записать с использованием лагового оператора случайный процесс:

а) xt = µ + 1xt-1 + 2xt-2 +... + pxt-p + t;

492 Глава 14. Линейные стохастические модели ARIMA Таблица 14. t Blaster Mitre Celgene t Blaster Mitre Celgene t Blaster Mitre Celgene 1 0.41634 0.12014 0.37495 43 2.26050 0.04130 1.26855 85 1.86053 1.29274 2. 2 –0.23801 –0.05406 –0.18396 44 –2.67700 1.04649 –1.18533 86 –0.71307 0.01583 –0. 3 0.29481 –0.32615 0.15691 45 3.59910 1.50975 1.83224 87 1.43504 2.43129 0. 4 –0.61411 –0.29108 –0.40341 46 –1.91408 –0.78975 –0.08880 88 1.13397 0.92309 1. 5 0.27774 –0.02705 0.05401 47 1.41616 0.89511 –0.57678 89 0.06334 –1.09645 –0. 6 –0.40301 –0.78572 –0.11704 48 –0.13194 0.49100 1.61395 90 –0.42419 0.20130 –0. 7 –0.45766 –1.29175 –0.75328 49 0.30387 –0.62728 –0.74057 91 0.56689 –1.83314 0. 8 –0.89423 –2.42880 –0.73129 50 –0.40587 –0.53830 0.09482 92 –2.57400 –1.88158 –2. 9 –1.88832 –1.67366 –1.96585 51 –0.31838 1.17944 –0.52098 93 0.59467 1.17998 0. 10 –0.28478 2.05054 –0.33561 52 1.42911 0.42852 1.59066 94 –0.09736 –0.17633 0. 11 1.58336 0.13731 1.85731 53 –1.06378 –0.62532 –0.95433 95 –0.32876 –0.36017 –1. 12 –1.55354 –1.62557 –1.79765 54 0.83204 –1.31001 0.25028 96 0.31690 –0.82044 0. 13 0.47464 0.40286 –0.12857 55 –2.19379 –1.15293 –1.40754 97 –1.38083 –1.70314 –1. 14 –0.35276 –0.60609 0.58827 56 0.77155 –0.56983 –0.01986 98 –0.36896 1.23095 –0. 15 –0.54645 0.32509 –1.19108 57 –1.72097 0.12615 –0.77365 99 1.17509 0.94729 1. 16 1.00044 –0.02063 1.21914 58 1.49679 –0.37488 0.48386 100 –0.47758 1.29398 –0. 17 –1.26072 0.59998 –1.11213 59 –1.90651 0.63942 –0.99107 101 2.24964 0.14180 1. 18 2.05555 1.71220 1.51049 60 2.46331 0.47653 1.36935 102 –1.87715 –0.80889 –1. 19 –0.37029 1.48972 0.48379 61 –1.94601 0.52649 –0.69769 103 1.42413 0.46915 0. 20 2.20692 2.90700 1.21797 62 2.61428 2.10024 1.16649 104 –1.04233 1.22177 0. 21 1.26647 1.98764 2.19226 63 –0.29189 0.75862 1.24826 105 2.09249 1.09135 0. 22 1.25773 1.16628 0.60026 64 1.28001 0.44524 –0.08931 106 –0.65041 0.10892 0. 23 0.88074 –1.06153 1.25668 65 –0.12871 –1.52804 0.85085 107 1.02974 –1.06781 0. 24 –1.52961 –1.80661 –1.52435 66 –1.39518 –1.76352 –1.92776 108 –1.75288 –0.89211 –0. 25 –0.04273 1.19855 –0.15779 67 –0.25838 –0.16521 –0.01712 109 0.65799 0.73063 –0. 26 0.72479 0.76704 1.33383 68 –0.58997 0.26832 –0.30668 110 –0.17125 –0.07063 0. 27 –0.18366 0.18001 –0.56059 69 0.57022 –0.32595 0.19657 111 –0.08333 0.45717 –0. 28 0.79879 0.50357 0.61117 70 –0.90955 0.05597 –0.70997 112 0.81080 0.32701 1. 29 –0.21699 1.20339 0.12349 71 0.97552 0.40011 0.58198 113 –0.58788 –0.50112 –0. 30 1.55485 1.29821 1.23577 72 –0.64304 –0.27051 –0.11007 114 0.33261 1.75660 0. 31 –0.01895 0.57772 0.41794 73 0.42530 0.30712 –0.17654 115 1.37591 0.46400 1. 32 0.99008 0.30803 0.46562 74 –0.02964 –0.43812 0.48921 116 –0.84495 –2.36130 –0. 33 –0.32137 –0.55553 0.21106 75 –0.50316 –0.19260 –0.82995 117 –0.99043 –0.78306 –1. 34 –0.12852 –1.63234 –0.49739 76 0.41743 0.35469 0.50887 118 –0.04455 –0.13031 0. 35 –1.43837 –0.79997 –1.10015 77 –0.26740 –0.43595 –0.10447 119 –0.70314 –1.05764 –0. 36 0.28452 0.83711 0.05172 78 –0.10744 –0.69389 –0.39020 120 –0.43426 –0.38007 –0. 37 0.14292 1.01700 0.54283 79 –0.56917 0.77134 –0.37322 121 –0.13906 0.42198 0. 38 0.78978 0.93925 0.33560 80 1.14361 0.19675 1.03231 122 0.27676 –1.59661 0. 39 0.48850 –0.73179 0.65711 81 –0.99591 0.28117 –0.74445 123 –1.86932 –0.04115 –1. 40 –0.96077 0.31793 –1.09358 82 1.49172 0.62375 0.92118 124 1.74776 2.69062 1. 41 1.45039 –1.34070 1.42896 83 –0.83109 –0.96831 –0.06863 125 0.52476 1.04090 1. 42 –2.99638 –0.75896 –2.47727 84 –0.00917 1.77019 –0.81888 126 0.86322 0.23965 –0. 14.10 Упражнения и задачи Таблица 14.1. (продолжение) t Blaster Mitre Celgene t Blaster Mitre Celgene t Blaster Mitre Celgene 127 0.12222 1.31876 0.60471 169 –2.20714 –0.41948 –0.27731 211 1.51485 –0.97684 0. 128 1.30642 0.45303 1.17204 170 1.83600 –1.04210 –0.00317 212 –2.50036 –1.13180 –1. 129 –0.57192 0.41682 –0.26719 171 –2.62281 0.90594 –0.89549 213 1.32618 1.48218 0. 130 1.30327 0.32936 0.87774 172 3.12742 –0.71167 1.64780 214 –0.16750 0.39183 1. 131 –0.84416 0.61935 –0.20724 173 –3.79724 –0.02254 –2.18906 215 0.42028 –0.52533 –0. 132 1.58641 0.83562 0.93209 174 3.80089 2.35129 1.77382 216 –0.42438 –1.01260 0. 133 –0.58774 0.34732 0.17484 175 –1.54768 –0.64010 0.83427 217 –0.74802 –0.83307 –0. 134 1.12133 –0.03793 0.34328 176 1.05327 –1.19450 –1.29993 218 –0.18508 –0.07511 –0. 135 –0.88277 –0.54302 –0.15044 177 –1.57945 0.55914 0.11559 219 –0.27858 0.72752 –0. 136 0.33158 –1.70839 –0.28336 178 1.54446 0.18847 0.55672 220 0.87498 –1.35822 0. 137 –2.03067 –1.22414 –1.43274 179 –1.28825 0.66119 –0.37065 221 –2.18781 –1.93248 –2. 138 0.43818 –0.54955 –0.13700 180 1.94968 0.46034 0.92503 222 0.29517 –0.01706 –0. 139 –1.44659 –0.53705 –0.71974 181 –1.29186 –0.82241 –0.26353 223 –0.87564 –2.02272 0. 140 0.56263 1.64035 –0.26807 182 0.58699 –1.93992 –0.48556 224 –1.55568 0.90288 –2. 141 0.96118 1.70204 1.61264 183 –2.43099 –0.43524 –1.43990 225 2.33976 1.99827 2. 142 0.71138 0.30461 0.25218 184 1.49486 –0.15310 0.67209 226 –0.86069 –0.33414 –0. 143 0.25957 –0.42989 0.26638 185 –2.02672 –0.86983 –1.00252 227 1.13389 –0.46117 –0. 144 –0.39911 1.64975 –0.31866 186 1.01176 0.74648 –0.28958 228 –1.28321 1.37416 –0. 145 2.09642 2.59804 2.14297 187 –0.32973 0.50541 0.83129 229 2.46195 0.98181 1. 146 0.55396 2.44417 0.91428 188 0.60712 –1.01920 –0.30054 230 –1.33630 0.18633 –0. 147 2.59219 0.87112 1.93566 189 –1.24396 –0.47570 –0.74958 231 1.88226 0.65077 0. 148 –0.92353 –1.59130 –0.23407 190 0.61988 0.73345 0.21236 232 –0.96236 0.01818 0. 149 –0.06896 –2.00737 –0.80695 191 –0.09182 1.10966 0.49188 233 0.99833 0.56680 –0. 150 –1.90109 –0.21639 –0.97295 192 1.14494 –0.35472 0.60138 234 –0.15850 0.72097 0. 151 1.04222 0.08106 0.52037 193 –1.15962 –0.25419 –0.80978 235 0.79860 0.01263 0. 152 –1.32252 –1.41365 –0.69199 194 1.05295 0.23071 0.57739 236 –0.44636 0.10951 –0. 153 –0.15447 0.10208 –1.09443 195 –0.92113 –0.21711 –0.17697 237 0.60990 –0.43066 0. 154 0.16722 0.11579 0.87557 196 0.66513 0.87219 –0.07976 238 –0.97024 –0.33060 –0. 155 –0.45657 –0.63291 –0.78207 197 0.28363 1.51583 0.92934 239 0.58530 1.47322 0. 156 0.00584 –0.89310 –0.08703 198 1.19450 0.91161 0.75373 240 0.78037 –0.52826 1. 157 –1.05101 0.07757 –0.86295 199 0.17008 0.90071 0.41868 241 –1.25522 –0.88925 –1. 158 0.93651 –0.18388 0.70155 200 1.08470 –0.51061 0.82681 242 0.72438 –1.90852 0. 159 –1.32255 –1.33106 –0.91757 201 –1.27643 –0.82689 –0.90190 243 –2.97849 –1.06136 –2. 160 0.01609 0.35961 –0.66348 202 0.57728 0.16717 0.14775 244 1.61219 1.26234 0. 161 0.15497 3.33824 0.82107 203 –0.61943 0.62127 0.07797 245 –0.92336 –0.22703 0. 162 2.87330 0.51674 2.49646 204 1.06910 1.37518 0.45461 246 0.60912 1.03409 –0. 163 –1.82484 0.42367 –1.53503 205 0.47147 –0.10956 0.94669 247 0.78275 –0.54114 1. 164 3.02300 0.22201 2.08618 206 –0.36583 1.29469 –0.80073 248 –1.45383 –0.91160 –1. 165 –2.73530 0.34709 –1.13867 207 2.02680 1.27776 2.17034 249 0.90928 2.84407 0. 166 3.23531 0.78318 1.51341 208 –0.75375 –0.42283 –0.35325 250 1.53899 1.62233 2. 167 –2.32656 0.76416 –0.36499 209 0.86800 –0.58282 0. 168 3.15157 0.54297 1.16592 210 –1.27776 0.43351 –0. 494 Глава 14. Линейные стохастические модели ARIMA б) xt = µ + t + 1t-1 + 2t-2 +... + qt-q;

в) xt = µ+1xt-1 +2xt-2 +...+pxt-p +t +1t-1 +2t-2 +...+qt-q.

2. Вывести формулы для вычисления математического ожидания, дисперсии и ковариаций случайного процесса xt = µ + t + it-i при условии его i= слабой стационарности, если t — белый шум с дисперсией 2 и матема тического ожидания E(txt-k) =0, |k| 1.

3. Вывести формулы для вычисления математического ожидания, дисперсии и ковариаций случайного процесса xt = µ + 1xt-1 + t при условии его слабой стационарности, если t — белый шум с дисперсией 2.

4. Обосновать утверждение о том, что модель авторегрессии является частным случаем модели линейного фильтра.

5. Записать случайный процесс xt =0.2+0.6xt-1 + t с использованием лаго вого оператора и виде процесса скользящего среднего бесконечного порядка.

6. При каких условиях процесс AR(1) стационарен и обратим?

7. Задана модель: xt =0.25xt-1 +t, гд е t — белый шум. Дисперсия процесса xt равна единице. Вычислить дисперсию белого шума.

8. Чему равна дисперсия Марковского процесса xt =0.5xt-1 +t, если диспер сия белого шума равна 1? Изобразить график автокорреляционной функции данного процесса.

9. Для процесса xt = -0.7 - 0.7xt-1 + t, гд е t — белый шум, рассчитать частную автокорреляционную функцию, вычислить первые 6 значений ав токорреляционной функции и начертить ее график.

10. Для модели AR(1): xt = µ +0.5xt-1 + t показать, что частная автокорре ляционная функция 1,1 =0.5, k,k =0 при k 2.

11. Даны два марковских процесса:

xt =0.5xt-1 + t;

yt =0.2yt-1 + t.

Дисперсия какого процесса больше и во сколько раз?

12. Найти математическое ожидание, дисперсию и ковариации случайного про цесса xt, если t — белый шум с единичной дисперсией.

а) xt =0.1+0.9xt-1 + t;

б) xt = -0.2xt-1 + t.

13. Найти спектр процесса xt = t +0.1t-1 +0.01t-2 +....

14.10 Упражнения и задачи 14. Корень характеристического уравнения, соответствующего процессу Мар кова, равен 2, остаточная дисперсия равна 1. Найти значение спектра на частоте 0.5.

15. Имеется ли разница в графиках спектра для процессов xt = 0.9xt-1 + t и xt =0.2xt-1 + t? Если да, то в чем она выражается?

16. Корни характеристических уравнений, соответствующих двум марковским процессам, равны +1.25 и -1.25. В чем отличие процессов и как это разли чие отражается на графиках спектра и автокорреляционной функции?

17. Пусть t — белый шум с единичной дисперсией. Найти математическое ожидание, дисперсию и ковариации случайного процесса:

а) xt =1 +0.5xt-1 + t;

б) xt =0.5xt-1 + t.

18. Проверить на стационарность следующие процессы:

а) xt - 0.4xt-1 - 0.4xt-2 = t;

б) xt +0.4xt-1 - 0.4xt-2 = t;

в) xt - 0.4xt-1 +0.4xt-2 = t.

Изобразить схематически графики автокорреляционной функции этих про цессов. Проверить правильность выводов с помощью точного вычисления автокорреляционной функции для каждого из процессов.

19. Корни характеристического уравнения для процесса Юла равны, соответ ственно, 5 и -5. Изобразить график автокорреляционной функции. Дать обоснование.

20. Корни характеристического уравнения, соответствующего процессу Юла, равны 1.9 и -1.3. Изобразить график автокорреляционной функции это го процесса. Ответ обосновать.

21. Коэффициенты автокорреляции первого и второго порядка в процессе Юла равны, соответственно, 0.5 и 0.4. Оценить параметры процесса. Найти дис персию белого шума, если дисперсия процесса равна 1.

22. При каких значениях 2 следующие случайные процессы являются стацио нарными в широком смысле?

а) xt = xt-1 + 2xt-2 + t;

б) xt = -xt-1 + 2xt-2 + t.

Вывести автокорреляционные функции данных случайных процессов при 2 = -0.5.

23. Параметры 1 и 2 процесса AR(2) равны, соответственно, 0.6 и -0.2.

Каковы первые три значения автокорреляционной функции?

496 Глава 14. Линейные стохастические модели ARIMA 24. Для процесса xt = 0.5xt-1 +0.25xt-2 + t коэффициенты автокорреля 2 ции первого и второго порядка равны, соответственно, и Найти 3 12.

коэффициент автокорреляции четвертого порядка.

25. Пусть процесс AR(2) xt = 1xt-1 + 2xt-2 + t является стационарным в широком смысле, и t — белый шум с дисперсией 2. Показать, что частная автокорреляционаня функция 1 22 + 2(1 - 2) 1, 1 =, 2, =, 1 - 2 2 (1 - 1 - 2)(1 + 1 - 2) k, k =0, при k 3.

26. По известным значениям частной автокорреляционной функции 1, 1 =0. и 2, 2 = случайного процесса найти значения коэффициентов автокор реляции первого и второго порядка.

27. Пусть процесс AR(p) является стационарным в широком смысле. Показать, что частная автокорреляционаня функция p+1,p+1 =0.

28. В каком случае процесс, описываемый моделью MA(q), стационарен и об ратим?

29. Коэффициент автокорреляции первого порядка для обратимого процесса скользящего среднего первого порядка равен -0.4. Записать уравнение про цесса и изобразить график его автокорреляционной функции.

30. Показать, что обратимый процесс MA(1) можно представить в виде процесса авторегрессии.

31. Показать, что процесс xt = µ + t + 1t-1 эквивалентен процессу AR(), если |1| < 1 и t —белыйшум.

32. Найти автокорреляционную функцию процесса:

xt = t - 0.5xt-1 - 0.25xt-2 - 0.125xt-3 - 0.0625xt-4 +....

33. Вывести формулы для вычисления математического ожидания, дисперсии и ковариаций случайного процесса xt = µ + t + 1t-1 при условии его слабой стационарности, если t — белый шум с дисперсией 2.

34. Пусть t — белый шум с единичной дисперсией. Чему равна дисперсия про цесса xt = t +0.2t-1? Изобразить график автокорреляционной функции.

35. Идентифицировать процесс, автокорреляционная функция которого имеет следующий вид:

а) 1 =0.25, k =0, k 2;

б) 1 = -0.4, k =0, k 2.

14.10 Упражнения и задачи 36. Является ли случайный процесс, автокорреляционная функция которого име ет следующий вид: 1 =0.5, k =0, k 2, обратимым?

37. Для каждого из случайных процессов:

а) xt = t +0.5t-1;

б) xt = t - 0.5t-1;

в) xt = -1+t +0.8t-1;

рассчитать частную автокорреляционную функцию, вычислить первые 6 зна чений автокорреляционной функции и построить ее график.

38. Показать, что частные автокорреляционные функции следующих слабо ста ционарных случайных процессов совпадают:

а) xt = µ + t + 1t-1 и zt = t + 1t-1, б) xt = µ + t + 1t-1 + 2t-2 +... + qt-q и zt = t + 1t-1 + 2t-2 +... + qt-q, 2 где t и t — процессы белого шума с дисперсиями и v, соответственно.

39. Имеется следующий обратимый процесс : xt = t +1t-1 +2t-2, гд е t — белый шум с дисперсией 2. Рассчитать коэффициенты автоковариации.

Записать автокорреляционную функцию для этого процесса.

40. Построить график автокорреляционной функции процесса:

а) xt = t +0.5t-1 - 0.3t-2;

б) xt =1 +t - 0.4t-1 +0.4t-2.

41. Переписать случайный процесс xt =0.5xt-1 +0.5xt-2 + t - t-1 +3t- с использованием лагового оператора, где t — белый шум. Проверить процесс на стационарность и обратимость.

42. Найти математическое ожидание, дисперсию и ковариации случайного про цесса xt =0.5xt-1 + t - 0.7t-1, если t — белый шум. Построить график автокорреляционной функции.

43. На примере процесса ARMA(1, 1) продемонстрировать алгоритм оценивания его параметров методом моментов.

31 44. Найти параметры модели ARMA(1, 1), если 1 =, 2 =.

41 45. Проверить на стационарность и обратимость процесс xt =0.6+0.3xt-1 +0.4xt-2 + t - 0.7t-1, где t — белый шум с дисперсией 2. Представить процесс в виде AR(), если это возможно.

498 Глава 14. Линейные стохастические модели ARIMA 46. Определить порядок интегрирования процесса xt =1.5xt-1 +0.5xt-2 + t - 0.5t-1. Ответ обосновать.

47. Для модели (1 - L)(1 + 0.4L)xt =(1 - 0.5L)t определить параметры p, d, q. Является ли процесс стационарным?

48. Записать формулу расчета коэффициента автоковариации первого порядка для процесса ARIMA(2, 2, 2).

49. Какую роль выполняет оператор скользящего среднего в прогнозировании процессов ARMA(p, q)? Ответ обосновать.

50. Построить точечный прогноз на один шаг вперед, если известно, что процесс xt =0.1xt-1 + t +0.2t-1, xT =10, T =0.1.

51. Построить доверительный интервал для прогноза на два шага вперед для случайного процесса xt =0.5xt-1+t, если известно, что xT = -1.6 и t — белый шум с единичной дисперсией.

52. Построить интервальный прогноз на 2 шага впереддля случайного процесса:

а) xt =1 +t +0.7t-1, если t — белый шум с единичной дисперсией и T = -6.7;

б) xt =1 +1.3xt-1 + t, если t — белый шум с единичной дисперсией и xT =7.1, xT -1 =6.7, t =0.5.

53. Записать в компактной и развернутой формах уравнение процесса ARIMA(1, 2, 2), привести формулу доверительного интервала для прогноза на 4 шага вперед с выводом формул для параметров j и дисперсии белого шума.

54. Записать формулу доверительного интервала для прогноза по модели ARIMA(1, 1, 1), с выводом формул для j и дисперсии белого шума.

Рекомендуемая литература 1. Айвазян С.А. Основы эконометрики. Т. 2. — М.: «Юнити», 2001. (Гл. 3).

2. Андерсон Т. Статистический анализ временных рядов. — М.: «Мир», 1976.

(Гл. 5).

3. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление.

Вып. 1. — М.: «Мир», 1974. (Гл. 3–6).

14.10 Упражнения и задачи 4. Кендалл М. Дж., Стьюарт А. Многомерный статистический анализ и вре менные ряды. — М.: «Наука», 1976. (Гл. 47).

5. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика — начальный курс. — М.: «Дело», 2000. (Гл. 12).

6. Справочник по прикладной статистике. В 2-х т. Т. 2. // Под ред. Э. Ллойда, У. Ледермана. — М.: «Финансы и статистика», 1990. (Гл. 18).

7. Chatfield Chris. The Analysis of Time Series: An Introduction... 5th ed. — Chapman & Hall/CRC, 1996. (Ch. 3–5).

8. Enders Walter. Applied Econometric Time Series. — Iowa State University, 1995. (Ch. 5).

9. Judge G.G., Griffiths W.E., Hill R.C., Luthepohl H., Lee T. Theory and Practice of Econometrics. — New York: John Wiley & Sons, 1985. (Ch. 7).

10. Hamilton James D., Time Series Analysis. — Princeton University Press, 1994.

(Ch. 3, 4).

11. Mills Terence C. Time Series Techniques for Economists. — Cambridge University Press, 1990. (Ch. 5–8).

12. Pollock D.S.G. A handbook of time-series analysis, signal processing and dynamics. — «Academic Press», 1999. (Ch. 16–19).

Глава Динамические модели регрессии При моделировании экономических процессов с помощью регрессионного ана лиза часто приходится наряду с некоторым временным рядом вводить в модель также лаг этого ряда. В экономике практически нет примеров мгновенного реагиро вания на какое-либо экономическое воздействие — существуют задержки прояв ления эффектов от капиталовложений, внесения удобрений и т.д., иными словами, при моделировании необходимо учитывать воздействие факторов в предыдущие моменты времени. Выше были введены некоторые из таких моделей: регрессия с распределенным лагом и модели ARIMA. В этой главе рассматриваются различ ные аспекты подобного рода моделей.

15.1. Модель распределенного лага:

общие характеристики и специальные формы структур лага Напомним, что простейшая модель распределенного лага — это модель регрес сии, в которой на динамику исследуемой переменной xt влияет не только какой-то объясняющий фактор zt, но и его лаги. Модель имеет следующий вид:

q xt = µ + jzt-j + t = µ + (L)zt + t, (15.1) j= 15.1 Модель распределенного лага q где (L) = jLj, a q — величина максимального лага.

j= Данную модель можно охарактеризовать следующими показателями.

Функция реакции на импульс (impulse response function, IRF) показывает, насколько изменится xt при изменении zt-j на единицу для лагов j =0, 1, 2,....

dxt Таким образом, можно считать, что речь идет о производной как функции dzt-j запаздывания j. Ясно, что для модели распределенного лага этот показатель сов падает с коэффициентом j при j q и равен нулю при j > q. При j < (влияние будущих значений переменной z на переменную x) реакцию на импульс можно положить равной нулю.

Накопленная реакция на импульс для лага k — это просуммированные зна чения простой функции реакции на импульс от j = 0 до j = k. Для мод ели распределенного лага это сумма коэффициентов:

min{k, q} j.

j= Долгосрочный мультипликатор является измерителем общего влияния пере менной z на переменную x. Онравен q = j = (1).

j= Это предельное значение накопленной реакции на импульс. Если x и z — логарифмы исходных переменных, то — долгосрочная эластичность.

Средняя длина лага показывает, на сколько периодов в среднем запаздывает влияние переменной z на переменную x. Она вычисляется по формуле q q jj jj j=0 j= j = =.

q j j= Заметим, что среднюю длину лага можно записать через производную логариф ма многочлена (L) в точке 1. Действительно, q q (v) = jvj = jjvj- j=0 j= 502 Глава 15. Динамические модели регрессии q (1) и (1) = jj. Поэтому j = =(ln (v)).

(1) v= j= Наряду со средней длиной лага можно рассматривать также медианную длину лага, то есть такую величину лага, при которой накопленная функция реакции на импульс равна половине долгосрочного мультипликатора. Ясно, что для большин ства возможных структур лага такое равенство может выполняться только при ближенно. Поэтому невозможно дать однозначное определение медианной длины лага.

Оценивание модели распределенного лага может быть затруднено проблемой мультиколлинеарности, если величина фактора zt мало меняется со временем. Ес ли zt — случайный процесс, то такая ситуация возникает, когда данный процесс сильно положительно автокоррелирован. Например, это может быть авторегрес сия первого порядка с коэффициентом авторегрессии, близким к единице. Если бы фактор zt был линейным трендом, например, zt = t, то модель невозможно было бы оценить. Действительно, несложно увидеть, что тогда zt, zt-1 = t - и константа связаны между собой линейной зависимостью. Если zt —линейный тренд с добавлением небольшой стационарной случайной составляющей, то, хо тя строгой линейной зависимости уже не будет, проблема мультиколлинеарности останется.

Если возникает подобная проблема мультиколлинеарности, то нельзя точно оценить структуру лага, хотя можно оценить сумму весов i — т.е. долгосрочный мультипликатор. Эта сумма вычленяется из модели следующим образом:

q xt = µ + zt + j (zt-j - zt) +t.

j= В случае мультиколлинеарности лаговых переменных обычно на лаговую струк туру накладывают какое-нибудь ограничение, чтобы уменьшить количество оце ниваемых коэффициентов. Ниже рассматриваются две наиболее важные модели этого типа.

Полиномиальный лаг Одна из возможных структур лага — полиномиальный лаг1, веса которого задаются многочленом от величины лага j:

p j = sjs, j =0,..., q, (15.2) s= Эту модель предложила С. Алмон, поэтому часто используют термин «лаг Алмон» (Almon lag).

15.1 Модель распределенного лага j j..... q 0 1 Рис. 15. где p — степень многочлена, p

Простейший полиномиальный лаг — линейный. Для него j = 0 + 1j. Как правило, здесь 1 < 0. Его структура изображена на диаграмме (рис. 15.1).

Поскольку исходная модель регрессии линейна и ограничения, которые поли номиальный лаг накладывает на ее коэффициенты, являются линейными, то полу ченная модель останется линейной. Рассмотрим, каким образом ее можно оценить.

C учетом выражений для j, проведем преобразование исходной модели:

q q p p q p jzt-j = sjs zt-j = s jszt-j = syts.

j=0 j=0 s=0 s=0 j=0 s= j Получим новую модель линейной регрессии:

p xt = µ + syts + t s= с преобразованными факторами q yts = jszt-j.

j= Оценив s, можно вычислить веса j, воспользовавшись формулой (15.2).

При оценивании модели с ограничениями на структуру лага нужно проверить, правильно ли наложены ограничения. С помощью соответствующей F -статистики можно сравнить ее с исходной, неограниченной моделью, поскольку она является ее частным случаем. Модель q xt = µ + syts + t s= 504 Глава 15. Динамические модели регрессии j j....

0 1 2 Рис. 15. эквивалентна исходной модели с точностью до линейных преобразований, поэто му достаточно проверить гипотезу о том, что последние q - p коэффициентов (p+1,..., q) равны нулю.

Часто принимают, что веса на концах полиномиальной лаговой структуры (15.2) равны нулю. Это требование накладывает на коэффициенты модели дополнитель ные ограничения. Можно, например, потребовать, чтобы q =0, то есть p sqs =0.

s= Учесть такие ограничения несколько сложнее, но в целом не требуется выходить за рамки обычной линейной регрессии.

Геометрический лаг Еще один популярный вид структуры лага — геометрический лаг. Еговеса j задаются следующими соотношениями:

j = 0j, j =0,...,, где 0 < <1. Веса геометрического лага убывают экспоненциально с увеличением лага (рис. 15.2).

Модель распределенного лага с этими весами, модель Койка, имеет следующий вид:

xt = µ + 0 jzt-j + t. (15.3) j= Используя формулу суммы бесконечной геометрической прогрессии, получим (v) = jvj = 0 (v)j =.

1 - v j=0 j= 15.1 Модель распределенного лага Сумма весов в этой модели (долгосрочный мультипликатор) равна = j = (1) =.

1 - j= Кроме того, ln (v) =ln 0 - ln(1 - v) и (ln (v)) =, 1 - v поэтому средняя длина геометрического лага равна j =(ln (v)) =.

v=1 - Чтобы избавиться от бесконечного ряда, к модели с геометрическим лагом при меняют преобразование Койка (Koyck transformation). Сдвинем исходное урав нение на один период назад:

xt-1 = µ + 0jzt-j-1 + t-1, j= затем умножим это выражение на и вычтем из исходного уравнения (15.3):

xt - xt-1 =(1 - )µ + 0zt + t - t-1. (15.4) Такой же результат можно получить, используя лаговые операторы:

xt = µ + 0 jzt-j + t = µ + 0 (L)j zt + t.

j=0 j= Выражение в скобках упрощается с использованием формулы суммы беско нечной геометрической прогрессии:

xt = µ + 0 zt + t.

1 - L Умножим это уравнение на оператор (1 - L):

(1 - L) xt =(1 - L) µ + 0zt +(1- L) t или учитывая, что оператор сдвига, стоящий перед константой, ее сохраняет, по лучаем формулу (15.4). В результате имеем следующую модель:

xt = µ + xt-1 + 0zt +, t 506 Глава 15. Динамические модели регрессии где µ =(1 - )µ и = t - t-1. Это частный случай авторегрессионной модели t с распределенным лагом, рассматриваемой в следующем пункте.

Заметим, что в полученной здесь модели ошибка не является белым шумом, t а представляет собой процесс скользящего среднего первого порядка. Модель яв ляется линейной регрессией, однако для нее не выполнено требование о некорре лированности регрессоров и ошибки. Действительно, t-1 входит как в xt-1, так ив. Следовательно, оценки метода наименьших квадратов не являются состоя t тельными и следует пользоваться другими методами.

Можно оценивать модель Койка в исходном виде (15.3). Сумму в этом урав нении можно разделить на две части: соответствующую имеющимся наблюдени ям для переменной zt и относящуюся к прошлым ненаблюдаемым значениям, т.е. z0, z-1 и т.д.:

t- xt = µ + 0 jzt-j + 0 jzt-j + t.

j=0 j=t Далее, во второй сумме сделаем замену j = s + t:

t- xt = µ + 0 jzt-j + 0t sz-s + t.

j=0 s= Обозначив = 0 sz-s, получим модель нелинейной регрессии с четырьмя s= неизвестными параметрами:

t- xt = µ + 0 jzt-j + t + t.

j= В такой модели ошибка и регрессоры некоррелированы, поэтому нелинейный МНК дает состоятельные оценки.

15.2. Авторегрессионная модель с распределенным лагом Авторегрессионная модель с распределенным лагом является примером ди намической регрессии, в которой, помимо объясняющих переменных и их лагов, в качестве регрессоров используются лаги зависимой переменной.

15.2. Авторегрессионная модель с распределенным лагом Авторегрессионную модель с распределенным лагом, которая включает одну независимую переменную, можно представить в следующем виде:

p q xt = µ + jxt-j + jzt-j + t, (15.5) j=1 j= где первая сумма представляет собой авторегрессионную компоненту — распреде ленный лаг изучаемой переменной, вторая сумма — распределенный лаг незави симого фактора. Обычно предполагается, что в этой модели ошибки t являются белым шумом и не коррелированны с фактором zt, его лагами и с лагами изуча емой переменой xt. При этих предположениях МНК дает состоятельные оценки параметров модели.

Сокращенно эту модель обозначают ADL(p, q) (от английского autoregressive distributed lag), также часто используется аббревиатура ARDL, гд е p —поря док авторегрессии, q — порядок распределенного лага. Более компактно можно записать модель в операторной форме:

(L) xt = µ + (L) zt + t, p q где (L) =1 - jLj и (L) = jLj — лаговые многочлены.

j=1 j= Модель ADL(1, 1) имеет следующий вид:

xt = µ + 1xt-1 + 0zt + 1zt-1 + t.

Некоторые частные случаи модели ADL уже были рассмотрены ранее.

Модель ADL(0, q) — это модель распределенного лага, рассмотренная в предыдущем пункте (в правой части нет лагов зависимой переменной).

Модель геометрического распределенного лага после преобразования Койка можно интерпретировать как ADL(1, 0) с процессом MA(1) в ошибке и ограниче нием на коэффициент при xt-1, который равен параметру MA-процесса ():

xt = µ + xt-1 + 0zt +(t - t-1).

Авторегрессионную модель AR(p) можно считать ADL(p, -1). В этой модели переменная в левой части зависит только от своих собственных лагов:

p xt = µ + jxt-j + t.

j= Как и в случае модели распределенного лага, можно ввести ряд показателей, характеризующих модель ADL. Если обратить лаговый многочлен (L) и умножить 508 Глава 15. Динамические модели регрессии на него исходное уравнение модели, то получим µ (L) t xt = -1(L)(L)xt = + zt + (L) (L) (L) или xt = µ + izt-i +, t i= где µ t (L) µ =, = и = (L) = iLi.

t (1) (L) (L) i= Как и в модели ARMA, такое преобразование корректно, если все корни мно гочлена (·) лежат за пределами единичной окружности.

Коэффициенты i показывают влияние лагов переменной z на переменную x, то есть они представляют собой функцию реакции на импульс. Символически эти коэффициенты можно записать в виде:

dxt i =.

dzt-i Рекуррентная формула для расчета коэффициентов i получается дифферен циацией по zt-i исходного уравнения модели (15.5):

p q d(µ + jxt-j + jzt-j + t) p j=1 j= i = = ji-j + i.

dzt-i j= Здесь принимается во внимание, что 0, j = i, dxt-j dzt-j dt = i-j, = и =0.

dzt-i dzt-i dzt-i 1, j = i, При использовании этой рекуррентной формулы следует взять i = для i <0. В частном случае модели распределенного лага (когда p = 0) эта формула дает i = i, то есть влияние zt-i на i количественно выражается коэффициентом при zt-i (весом лага).

15.2 Некоторые прикладные динамические модели Сумма коэффициентов i показывает долгосрочное влияние z на x (долго срочный мультипликатор). Она равна q j (1) j= = i = (1) = =. (15.6) p (1) i= 1 - j j= По аналогии с моделью распределенного лага можно ввести показатель средней длины лага влияния z на x. Онравен q p jj jj ii j=0 j= i= =(ln (v)) =(ln (v) - ln (v)) = +.

q p v=1 v= i j 1 - j i= j=0 j= 15.3. Модели частичного приспособления, адаптивных ожиданий и исправления ошибок Рассмотрим некоторые прикладные динамические модели, сводящиеся к моде ли авторегрессионного распределенного лага.

Модель частичного приспособления В экономике субъекты не сразу могут приспособиться к меняющимся усло виям — это происходит постепенно. Нужно время на изменение запасов, обу чение, переход на новые технологии, изменение условий долгосрочных контрак тов и т.д. Эти процессы можно моделировать с помощью модели частичного приспособления.

Для иллюстрации приведем следующий пример: инфляция зависит от денежной массы, меняя денежную массу, мы можем получить какой-то желаемый уровень инфляции. Но реальность несколько запаздывает.

Пусть xD — желаемый уровень величины xt, zt — независимый фактор, t определяющий xD. Тогда модель частичного приспособления задается следующими t двумя уравнениями:

xD = + zt + t, t (15.7) xt - xt-1 = (xD - xt-1) +t.

t 510 Глава 15. Динамические модели регрессии Здесь [0;

1] — скорость приспособления. Если =0,то xt = xt-1,тоесть xt не меняется, если же =1, то приспособление происходит мгновенно, и в этом случае сразу xt = xD.

t Предположим, что переменная xD ненаблюдаема. Исключим из этих двух вы t ражений ненаблюдаемую переменную:

xt = +(1- )xt-1 + zt + t + t.

Ясно, что это модель ADL(1, 0), гд е = µ, 1- = 1 и = 0. Оценивпа раметры µ, 1 и 0, мы можем с помощью обратного преобразования вычислить оценки параметров исходной модели.

Модель адаптивных ожиданий Очень часто экономические решения, принимаемые людьми, зависят от про гнозов того, что будет в будущем. При этом уровень экономических величин, на ко торые воздействуют такие решения, зависит не от текущего значения показателя, а от ожидаемого значения (например, если ожидается высокий уровень инфляции, то следует скупать доллары, курс доллара в результате вырастет). В теории рас сматриваются 2 вида ожиданий — рациональные и адаптивные. В соответствии с одним из определений, ожидания называют рациональными, если математическое ожидание прогноза равно фактическому значению, которое будет в будущем. Мо дели рациональных ожиданий часто оказываются довольно сложными. Адаптивные ожидания — это ожидания, которые зависят только от предыдущих значений ве личины. По мере того, как наблюдаются процессы движения реальной величины, мы адаптируем наши ожидания к тому, что наблюдаем на самом деле.

Чтобы ввести в экономические модели ожидания экономических субъектов, в простейшем случае используют модель адаптивных ожиданий. Адаптивные ожи дания некоторой величины формируются только на основе прошлых значений этой E величины. Например, пусть xt зависит от ожиданий ( zt ) величины zt, zt —ве E личина, от прогноза которой должен зависеть xt (например, инфляция), zt — ожидание (прогноз) этой величины в момент времени t.

E xt = + zt + t.

Вцелом xt выгодно выбирать в зависимости от того, какой величина zt будет в будущем: zt+1, zt+2,..., од нако в момент выбора t известны только текущее и прошлые значения (..., zt-1, zt).

E Ошибка в ожиданиях zt приводит к их корректировке. Модель адаптации ожиданий к фактическому значению zt записывается так:

E E E zt - zt-1 = (zt - zt-1), 15.3 Некоторые прикладные динамические модели где — скорость приспособления ожиданий. Если =0, то ожидания никак не адаптируются к действительности и прогнозы не сбываются (скорость адаптации нулевая);

если =1, скорость адаптации мгновенная, наши ожидания сбываются E (полностью адаптировались): zt = zt. Обычно 0 < <1.

Легко видеть, что модель адаптации ожиданий основывается на формуле экс поненциальной средней:

E E zt = zt +(1- )zt-1.

E Для оценки параметров модели надо исключить ненаблюдаемые ожидания zt.

Используя лаговый оператор, получаем:

E E E zt - (1 - )zt-1 =(1 - (1 - )L)zt = zt, откуда zt E zt = = (1 - )izt-i.

1 - (1 - )L i= Таким образом, ожидания в рассматриваемой модели описываются бесконечным геометрическим распределенным лагом с параметром затухания =1 -.

E Если в уравнение для xt вместо zt подставить данный бесконечный ряд, то по лучится модель регрессии с геометрическим распределенным лагом:

zt xt = + + t. (15.8) 1 - (1 - )L Как было показано ранее, модель геометрического лага с помощью преоб разования Койка приводится к модели ADL. Умножим обе части уравнения 15. на 1 - (1 - )L и получим:

(1 - (1 - )L)xt =(1 - (1 - )L) + zt +(1- (1 - )L)t.

После соответствующего переобозначения параметров модель адаптивных ожиданий приобретает новую форму — ADL(1, 0) с MA(1)-ошибкой:

xt = +(1- )xt-1 + zt + t - (1 - )t-1.

Оценивать модель адаптивных ожиданий можно теми же методами, что и модель Койка.

512 Глава 15. Динамические модели регрессии Модель исправления ошибок В динамических регрессионных моделях важно различие между долгосрочной и краткосрочной динамикой. Это различие можно анализировать в рамках модели исправления ошибок. Рассмотрим в долгосрочном аспекте модель ADL(1, 1):

xt = µ + 1xt-1 + 0zt + 1zt-1 + t.

Предположим, что фактор zt и ошибка t являются стационарными процес сами. Тогда при |1| < 1 изучаемая переменная xt также стационарна. Возьмем математические ожидания от обеих частей уравнения модели:

x = µ + 1x + 0z + 1z.

В этой формуле x = E(xt), z = E(zt) (стационарные уровни x и z) иучиты вается, что E(t) =0. Получаем уравнение µ 0 + x = + z = µ + z, 1 - 1 1 - которое описывает долгосрочное стационарное состояние экономического про цесса. Коэффициент 0 + = (15.9) 1 - отражает долгосрочное влияние z на x. Он совпадает с долгосрочным мультипли катором (15.6).

Модель ADL(1, 1) можно привести к виду, который описывает краткосрочную динамику экономической системы. В этом виде модель называется моделью ис правления ошибок, сокращенно ECM (error-correction model):

xt = µ - (1 - 1)xt-1 + 0zt +(0 + 1)zt-1 + t или xt = 0zt - xt-1 - (µ + zt-1) + t, (15.10) где =1 - 1, xt = xt - xt-1, zt = zt - zt-1.

Предполагается, что если в предыдущий период переменная x отклонилась от своего «долгосрочного значения» µ +z, тоэлемент xt-1-(µ +zt-1) корректи рует динамику в нужном направлении. Для того чтобы это происходило, необходимо выполнение условия |1| < 1.

15.4. Упражнения и задачи Иногда из теории, описывающей явление, следует, что =1, тогда 1 + 0 + + 1 =1. Часто именно такую модель называют ECM.

Модели частичного приспособления и адаптивных ожиданий являются частны ми случаями модели исправления ошибок — не только формально математически, но и по экономическому содержанию. Например, модель частичного приспособле ния (15.7) в форме ECM выглядит как xt = zt - (xt-1 - - zt-1) +t + t.

Рассмотрим теперь авторегрессионную модель с распределенным лагом обще го вида (15.5) и покажем, что ее можно представить в виде модели исправления ошибок. При предположениях о стационарности xt и t математические ожидания от обеих частей уравнения (15.5) приводят к выражению:

p q x = µ + jx + jz j=1 j= или q j µ j= x = p + p z = µ + z, 1 - j 1 - j j=1 j= где коэффициент долгосрочного влияния z на x:

q j j= = p, 1 - j j= как и в случае ADL(1, 1), совпадает с долгосрочным мультипликатором.

В этих обозначениях можно представить модель ADL(p, q) в виде модели ис правления ошибок:

p-1 q- xt = - xt-1 - (µ + zt-1) + jxt-j + jzt-j + t, (15.11) j=1 j= где p p q = 1 - j, j = - i, j = - i при j >0, и0 = 0.

j=1 i=j+1 i=j+ 15.4. Упражнения и задачи Упражнение Сгенерируйте нормально распределенный некоррелированный ряд xt длиной 24 со средним 2000 и дисперсией 900.

514 Глава 15. Динамические модели регрессии 1.1. На основе этого ряда по модели yt = 5 + 5xt +8xt-1 +9xt-2 +8xt-3 + +5xt-4 + t, гд е t — нормально распределенный белый шум с дисперсией 100, сгенерируйте 100 рядов yt, t =1,..., 20.

1.2. Используя 100 сгенерированных наборов данных, оцените модель распреде ленного лага с максимальной длиной лага q =4. Найдите среднее и диспер сию оценок коэффициентов. Сравните с истинными значениями.

1.3. Для первых 5 наборов данных выберите наиболее подходящую длину лага на основе информационных критериев Акаике (AIC) и Шварца (BIC), оценив модель для q =2,..., 6.

1.4. Используя все 100 наборов, оцените модель полиномиального лага с мак симальной длиной лага q = 4 и степенью полинома p = 2. Рассчитайте средние и дисперсии оценок весов распределенного лага. Сравните с истин ными значениями. Сравните с результатами из упражнения 1.2 и сделайте вывод о том, какие оценки точнее.

1.5. Повторите упражнение 1.4 для а) q =4, p =3;

б) q =6, p =2 ;

в) q =3, p =2.

Упражнение В таблице 15.1 приведены данные из известной статьи С. Алмон по промышлен ным предприятиям США (EXPEND — capital expenditures, капитальные расходы, APPROP — appropriations).

2.1. Постройте графики двух рядов. Что можно сказать по ним о рядах? Видна ли зависимость между рядами (в тот же период или с запаздыванием)?

2.2. Постройте кросс-корреляционную функцию для сдвигов -12,..., 0,..., 12.

Сделайте выводы.

2.3. Используя данные, оцените неограниченную модель распределенного лага с максимальной длиной лага q = 6,..., 12 для зависимости EXPEND от APPROP. Используя известные вам методы, выберите длину лага.

2.4. Оцените модель полиномиального лага с максимальным лагом 8 и степенью многочлена p =2,..., 6. С помощью статистики Стьюдента проверьте ги потезы p =5 против p =6,..., p =3 против p =2 и выберите наиболее подходящую степень p.

15.4. Упражнения и задачи Таблица 15.1. (Источник: Almon Shirley. «The Distributed Lag between Capital Appropriations and Expenditures», Econometrica 33, January1965, pp. 178–196) Квартал EXPEND APPROP Квартал EXPEND APPROP 1953.1 2072.0 1660.0 1960.3 2721.0 2131. 1953.2 2077.0 1926.0 1960.4 2640.0 2552. 1953.3 2078.0 2181.0 1961.1 2513.0 2234. 1953.4 2043.0 1897.0 1961.2 2448.0 2282. 1954.1 2062.0 1695.0 1961.3 2429.0 2533. 1954.2 2067.0 1705.0 1961.4 2516.0 2517. 1954.3 1964.0 1731.0 1962.1 2534.0 2772. 1954.4 1981.0 2151.0 1962.2 2494.0 2380. 1955.1 1914.0 2556.0 1962.3 2596.0 2568. 1955.2 1991.0 3152.0 1962.4 2572.0 2944. 1955.3 2129.0 3763.0 1963.1 2601.0 2629. 1955.4 2309.0 3903.0 1963.2 2648.0 3133. 1956.1 2614.0 3912.0 1963.3 2840.0 3449. 1956.2 2896.0 3571.0 1963.4 2937.0 3764. 1956.3 3058.0 3199.0 1964.1 3136.0 3983. 1956.4 3309.0 3262.0 1964.2 3299.0 4381. 1957.1 3446.0 3476.0 1964.3 3514.0 4786. 1957.2 3466.0 2993.0 1964.4 3815.0 4094. 1957.3 3435.0 2262.0 1965.1 4093.0 4870. 1957.4 3183.0 2011.0 1965.2 4262.0 5344. 1958.1 2697.0 1511.0 1965.3 4531.0 5433. 1958.2 2338.0 1631.0 1965.4 4825.0 5911. 1958.3 2140.0 1990.0 1966.1 5160.0 6109. 1958.4 2012.0 1993.0 1966.2 5319.0 6542. 1959.1 2071.0 2520.0 1966.3 5574.0 5785. 1959.2 2192.0 2804.0 1966.4 5749.0 5707. 1959.3 2240.0 2919.0 1967.1 5715.0 5412. 1959.4 2421.0 3024.0 1967.2 5637.0 5465. 1960.1 2639.0 2725.0 1967.3 5383.0 5550. 1960.2 2733.0 2321.0 1967.4 5467.0 5465. 516 Глава 15. Динамические модели регрессии Упражнение В таблице 15.2 имеются следующие данные: gas — логарифм среднедушевых реальных расходов на бензин и нефть, price — логарифм реальной цены на бензин и нефть, income — логарифм среднедушевого реального располагаемого дохода, miles — логарифм расхода топлива (в галлонах на милю).

3.1. Оцените авторегрессионную модель с распределенным лагом. В качестве зависимой переменной возьмите gas, а в качестве факторов — income и price.

Лаг для всех переменных равен 5.

3.2. Найдите коэффициенты долгосрочного влияния дохода на потребление топ лива и цены на потребление топлива (долгосрочные эластичности):

d(gas) — долгосрочная эластичность по доходу, d(income) d(gas) — долгосрочная эластичность по цене.

d(price) 3.3. Вычислите функцию реакции на импульсы (для сдвигов 0, 1,..., 40) д ля влияния дохода на потребление топлива и цены на потребление топлива.

Найдите среднюю длину лага для этих двух зависимостей.

3.4. Оцените ту же модель в виде модели исправления ошибок.

Упражнение В таблице 15.3 приводятся данные о потреблении и располагаемом доходе в США за 1953–1984 гг.

4.1. Оцените следующую модель адаптивных ожиданий. Потребление Ct зави сит от перманентного дохода YtE: Ct = + YtE + t, гд е YtE задается E E уравнением YtE - Yt-1 = Yt - Yt-1. Найдите долгосрочную предельную склонность к потреблению.

15.4. Упражнения и задачи Таблица 15.2. (Источник: Johnston and DiNardo’s Econometric Methods (1997, 4th ed)) квартал gas price income miles 1959.1 –8.015248 4.67575 –4.50524 2. 1959.2 –8.01106 4.691292 –4.492739 2. 1959.3 –8.019878 4.689134 –4.498873 2. 1959.4 –8.012581 4.722338 –4.491904 2. 1960.1 –8.016769 4.70747 –4.490103 2. 1960.2 –7.976376 4.699136 –4.489107 2. 1960.3 –7.997135 4.72129 –4.492301 2. 1960.4 –8.005725 4.722736 –4.496271 2. 1961.1 –8.009368 4.706207 –4.489013 2. 1961.2 –7.989948 4.675196 –4.477735 2. 1961.3 –8.003017 4.694643 –4.469735 2. 1961.4 –7.999592 4.68604 –4.453429 2. 1962.1 –7.974048 4.671727 –4.446543 2. 1962.2 –7.972878 4.679437 –4.441757 2. 1962.3 –7.970209 4.668647 –4.439475 2. 1962.4 –7.963876 4.688853 –4.439333 2. 1963.1 –7.959317 4.675881 –4.437187 2. 1963.2 –7.951941 4.652961 –4.434306 2. 1963.3 –7.965396 4.658816 –4.427777 2. 1963.4 –7.960272 4.653714 –4.414002 2. 1964.1 –7.936954 4.645538 –4.39974 2. 1964.2 –7.92301 4.635629 –4.379863 2. 1964.3 –7.911883 4.631469 –4.371019 2. 1964.4 –7.918471 4.637514 –4.362371 2. 1965.1 –7.916095 4.652727 –4.360062 2. 1965.2 –7.894338 4.658141 –4.349969 2. 1965.3 –7.889203 4.656464 –4.327738 2. 1965.4 –7.871711 4.655432 –4.313128 2. 1966.1 –7.860066 4.644139 –4.309959 2. 1966.2 –7.840754 4.644212 –4.308563 2. 1966.3 –7.837658 4.647137 –4.29928 2. 1966.4 –7.838668 4.653788 –4.289879 2. 1967.1 –7.836081 4.659936 –4.278718 2. 1967.2 –7.830063 4.661554 –4.274659 2. 1967.3 –7.82532 4.654018 –4.270247 2. 1967.4 –7.812695 4.644671 –4.266353 2. 1968.1 –7.792308 4.641605 –4.256872 2. 1968.2 –7.781042 4.625596 –4.24436 2. 1968.3 –7.763533 4.627113 –4.24817 2. 1968.4 –7.766507 4.621535 –4.243286 2. 1969.1 –7.748152 4.620802 –4.247602 2. 1969.2 –7.728209 4.634679 –4.24156 2. 1969.3 –7.724049 4.61451 –4.225354 2. 518 Глава 15. Динамические модели регрессии Таблица 15.2. (продолжение) квартал gas price income miles 1969.4 –7.707266 4.603419 –4.221179 2. 1970.1 –7.691294 4.589637 –4.223849 2. 1970.2 –7.696625 4.593972 –4.214468 2. 1970.3 –7.683176 4.57555 –4.207761 2. 1970.4 –7.68114 4.576285 –4.213643 2. 1971.1 –7.671161 4.563018 –4.20528 2. 1971.2 –7.660023 4.528258 –4.199421 2. 1971.3 –7.659501 4.5376 –4.20086 2. 1971.4 –7.659155 4.54487 –4.19967 2. 1972.1 –7.655547 4.51949 –4.206896 2. 1972.2 –7.657851 4.500299 –4.203082 2. 1972.3 –7.651443 4.515703 –4.187756 2. 1972.4 –7.634623 4.531717 –4.157555 2. 1973.1 –7.606151 4.531126 –4.150146 2. 1973.2 –7.625179 4.54356 –4.149023 2. 1973.3 –7.620612 4.540858 –4.144428 2. 1973.4 –7.628435 4.601014 –4.130499 2. 1974.1 –7.737227 4.73435 –4.155976 2. 1974.2 –7.703093 4.796311 –4.174081 2. 1974.3 –7.68182 4.773173 –4.174542 2. 1974.4 –7.647267 4.730467 –4.180104 2. 1975.1 –7.67028 4.721725 –4.198524 2. 1975.2 –7.673598 4.726068 –4.157104 2. 1975.3 –7.694903 4.766653 –4.175806 2. 1975.4 –7.689864 4.767389 –4.168096 2. 1976.1 –7.673608 4.74403 –4.158282 2. 1976.2 –7.66296 4.723825 –4.158494 2. 1976.3 –7.660979 4.723013 –4.159304 2. 1976.4 –7.651936 4.728776 –4.157702 2. 1977.1 –7.657642 4.731314 –4.160647 2. 1977.2 –7.64901 4.725569 –4.154308 2. 1977.3 –7.646001 4.705353 –4.139049 2. 1977.4 –7.649135 4.709094 –4.137531 2. 1978.1 –7.657363 4.699367 –4.129727 2. 1978.2 –7.642133 4.673999 –4.11695 2. 1978.3 –7.637718 4.678699 –4.113466 2. 1978.4 –7.644944 4.711411 –4.107745 2. 1979.1 –7.634155 4.737268 –4.10542 2. 1979.2 –7.684886 4.848168 –4.110224 2. 1979.3 –7.690778 4.965428 –4.108253 2. 1979.4 –7.699923 5.018858 –4.108714 2. 1980.1 –7.727037 5.130968 –4.107552 2. 1980.2 –7.747409 5.149823 –4.130193 2. 15.4. Упражнения и задачи Таблица 15.2. (продолжение) квартал gas price income miles 1980.3 –7.768291 5.121161 –4.123072 2. 1980.4 –7.770349 5.108043 –4.106715 2. 1981.1 –7.746104 5.176053 –4.107763 2. 1981.2 –7.749401 5.162098 –4.113578 2. 1981.3 –7.752783 5.128757 –4.10358 2. 1981.4 –7.758903 5.126579 –4.10885 2. 1982.1 –7.748258 5.089216 –4.116735 2. 1982.2 –7.740548 5.016708 –4.109173 2. 1982.3 –7.760993 5.046284 –4.1106 2. 1982.4 –7.765389 5.018583 –4.112362 2. 1983.1 –7.734547 4.951649 –4.111137 2. 1983.2 –7.761149 4.973684 –4.105544 2. 1983.3 –7.738656 4.978372 –4.09589 2. 1983.4 –7.72975 4.947877 –4.079108 2. 1984.1 –7.743051 4.937271 –4.059039 2. 1984.2 –7.723525 4.926296 –4.050855 2. 1984.3 –7.719794 4.885598 –4.04159 2. 1984.4 –7.715204 4.886159 –4.039545 2. 1985.1 –7.721207 4.876889 –4.040108 2. 1985.2 –7.717261 4.896123 –4.021586 2. 1985.3 –7.71862 4.877967 –4.034639 2. 1985.4 –7.71905 4.865803 –4.03058 2. 1986.1 –7.702826 4.79969 –4.020278 2. 1986.2 –7.689694 4.598733 –4.006467 2. 1986.3 –7.685297 4.52283 –4.012002 2. 1986.4 –7.670334 4.488154 –4.016886 2. 1987.1 –7.685728 4.581026 –4.011549 2. 1987.2 –7.664967 4.594879 –4.030798 2. 1987.3 –7.682947 4.624788 –4.019994 2. 1987.4 –7.672442 4.617012 –4.00732 2. 1988.1 –7.678686 4.583605 –3.996853 2. 1988.2 –7.669295 4.572124 –3.997311 2. 1988.3 –7.675229 4.578095 –3.993513 2. 1988.4 –7.657843 4.557322 –3.985354 2. 1989.1 –7.670982 4.561117 –3.979249 2. 1989.2 –7.713211 4.683528 –3.988068 2. 1989.3 –7.675435 4.627944 –3.985719 3. 1989.4 –7.636929 4.584531 –3.980442 3. 1990.1 –7.672857 4.628345 –3.971611 3. 1990.2 –7.706511 4.617825 –3.969884 3. 1990.3 –7.710044 4.693574 –3.971754 3. 1990.4 –7.717076 4.829451 –3.978981 3. Таблица 15.3. (Источник: Greene W., Econometric Analysis, 3rd. edition, Macmillan, 1997) Год, Год, Год, Год, Год, C Y C Y C Y C Y C Y квартал квартал квартал квартал квартал 1953.1 362.8 395.5 1959.3 443.3 479.0 1966.1 581.2 639.7 1972.3 741.3 842.2 1979.1 921.2 1011. 1953.2 364.6 401.0 1959.4 444.6 483.1 1966.2 582.3 642.0 1972.4 757.1 838.1 1979.2 919.5 1011. 1953.3 363.6 399.7 1960.1 448.1 487.8 1966.3 588.6 649.2 1973.1 768.8 855.0 1979.3 930.9 1019. 1953.4 362.6 400.2 1960.2 454.1 490.7 1966.4 590.5 700.7 1973.2 766.3 862.1 1979.4 938.6 1020. 1954.1 363.5 399.7 1960.3 452.7 491.0 1967.1 594.8 665.0 1973.3 769.7 868.0 1980.1 938.3 1025. 1954.2 366.2 397.3 1960.4 453.2 488.8 1967.2 602.4 671.3 1973.4 766.7 873.4 1980.2 919.6 1011. 1954.3 371.8 403.8 1961.1 454.0 493.4 1967.3 605.2 676.5 1974.1 761.2 859.9 1980.3 929.4 1019. 1954.4 378.6 411.8 1961.2 459.9 500.7 1967.4 608.2 682.0 1974.2 764.1 859.7 1980.4 940.0 1030. 1955.1 385.2 414.7 1961.3 461.4 505.5 1968.1 620.7 690.4 1974.3 769.4 859.7 1981.1 950.2 1044. 1955.2 392.2 423.8 1961.4 470.3 514.8 1968.2 629.9 701.9 1974.4 756.5 851.1 1981.2 949.1 1041. 1955.3 396.4 430.8 1962.1 474.5 519.5 1968.3 642.3 703.6 1975.1 763.3 845.1 1981.3 955.7 1058. 1955.4 402.6 437.6 1962.2 479.8 523.9 1968.4 644.7 708.7 1975.2 775.6 891.3 1981.4 946.8 1056. 1956.1 403.2 441.2 1962.3 483.7 526.7 1969.1 651.9 710.4 1975.3 785.4 878.4 1982.1 953.7 1052. 1956.2 403.9 444.7 1962.4 490.0 529.0 1969.2 656.2 717.0 1975.4 793.3 884.9 1982.2 958.9 1054. 1956.3 405.1 446.6 1963.1 493.1 533.3 1969.3 659.6 730.1 1976.1 809.9 899.3 1982.3 964.2 1057. 1956.4 409.3 452.7 1963.2 497.4 538.9 1969.4 663.9 733.2 1976.2 817.1 904.1 1982.4 976.3 1067. 1957.1 411.7 452.6 1963.3 503.9 544.4 1970.1 667.4 737.1 1976.3 826.5 908.8 1983.1 982.5 1073. 1957.2 412.4 455.4 1963.4 507.5 552.5 1970.2 670.5 752.6 1976.4 838.9 914.9 1983.2 1006.2 1082. 1957.3 415.2 457.9 1964.1 516.6 563.6 1970.3 676.5 759.7 1977.1 851.7 919.6 1983.3 1015.6 1102. 1957.4 416.0 456.0 1964.2 525.6 579.4 1970.4 673.9 756.1 1977.2 858.0 934.1 1983.4 1032.4 1124. 1958.1 411.0 452.1 1964.3 534.3 586.4 1971.1 687.0 771.3 1977.3 867.3 951.9 1984.1 1044.1 1147. 1958.2 414.7 455.1 1964.4 535.3 593.0 1971.2 693.3 779.7 1977.4 880.4 965.9 1984.2 1064.2 1165. 1958.3 420.9 464.6 1965.1 546.0 599.7 1971.3 698.2 781.0 1978.1 883.8 973.5 1984.3 1065.9 1176. 1958.4 425.2 471.3 1965.2 550.7 607.8 1971.4 708.6 785.5 1978.2 901.1 982.6 1984.4 1075.4 1186. 1959.1 424.1 474.5 1965.3 559.2 623.6 1972.1 718.6 791.7 1978.3 908.6 994. 1959.2 439.7 482.2 1965.4 573.9 634.6 1972.2 731.1 798.5 1978.4 919.2 1005. Глава 15. Динамические модели регрессии 15.4. Упражнения и задачи 4.2. Оцените по тем же данным модель частичного приспособления, преобразовав D ее в ADL(1, 0). Желаемый уровень потребления Ct зависит от текущего до D D хода Yt: Ct = +Yt +t, гд е Ct — ненаблюдаемая переменная, задавае D мая уравнением частичного приспособления Ct-Ct-1 = Ct - Ct-1 +t.

Найдите долгосрочную предельную склонность к потреблению.

Задачи 1. С помощью какого метода можно оценить параметры модели распределен ного лага (конечного)?

2. В чем основная причина перехода от обычной модели распределенного лага к модели полиномиального лага?

3. В чем основная причина перехода от обычной модели распределенного лага к модели с экспоненциальным лагом?

4. Пусть веса в модели распределенного лага экспоненциально убывают и сам лаг бесконечный. Каким преобразованием можно перейти к авторегресси онной модели с распределенным лагом? В чем особенность ошибок в этой модели?

5. Процесс с геометрическим лагом задан формулой 1 1 xt =1 + zt + zt-1 + zt-2 +... +.

2 4 Примените к нему преобразование Койка.

6. Примените обратное преобразование Койка к модели ADL(1, 0).

7. Представьте ожидания переменной X в модели адаптивных ожиданий в виде распределенного лага для фактически наблюдаемых значений переменной X.

8. Для процесса xt =0.1+0.5xt-1+0.1zt+0.2zt-1+t запишите долгосрочную зависимость между x и z.

9. Запишите следующие процессы в виде модели исправления ошибок:

а) xt =0.5x-1 +0.7zt-1 + t;

б) xt =2 +0.4xt-1 +2zt +3zt-1 - 3zt-2 + t.

522 Глава 15. Динамические модели регрессии Рекомендуемая литература 1. Доугерти К. Введение в эконометрику. — М.: «Инфра-М», 1997. (Гл. 10).

2. Драймз Ф. Распределенные лаги. Проблемы выбора и оценивания моде ли. — М.: «Финансы и статистика», 1982.

3. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика — начальный курс. — М.: «Дело», 2004. (Гл. 12).

4. Маленво Э. Статистические методы эконометрии. Вып. 2. — М.: «Статисти ка», 1976. (Гл. 15).

5. Песаран М., Слейтер Л. Динамическая регрессия: теория и алгоритмы. — М: «Финансы и статистика», 1984. (Гл. 5, стр. 67–91).

6. Baltagi, Badi H. Econometrics, 2nd edition. — Springer, 1999. (Ch. 6).

7. Enders W. Applied Econometric Time Series. — New York: John Wiley & Sons, 1992.

8. Greene W.H. Econometric Analysis. — Prentice-Hall, 2000. (гл.17) 9. Judge G.G., Griffiths W.E., Hill R.C., Luthepohl H., Lee T. Theory and Practice of Econometrics. — New York: John Wiley & Sons, 1985. (Ch. 9, 10).

Глава Модели с авторегрессионной условной гетероскедастичностью Традиционные модели временных рядов, такие как модель ARMA, не могут адекватно учесть все характеристики, которыми обладают финансовые временные ряды, и требуют расширения. Одна из характерных особенностей финансовых рын ков состоит в том, что присущая рынку неопределенность изменяется во времени.

Как следствие, наблюдается «кластеризация волатильности». Имеется в виду чере дование периодов, когда финансовый показатель ведет себя непостоянно и относи тельно спокойно. На рисунке 16.1 для иллюстрации этого явления показаны темпы прироста индекса РТС1 за несколько лет. На графике период 1 — сравнительно спокойный, период 2 — более бурный, период 3 — опять спокойный. Термин во латильность (volatility — англ. изменчивость, непостоянство) используется, как правило, для неформального обозначения степени вариабельности, разброса пере менной. Формальной мерой волатильности служит дисперсия (или среднеквадрати ческое отклонение). Эффект кластеризации волатильности отмечен в таких рядах, как изменение цен акций, валютных курсов, доходности спекулятивных активов.

Фондовый индекс Российской Торговой Системы. См. http://www.rts.ru.

524 Модели с авторегрессионной условной...

– – – 1995–09–21 1996–08–26 1997–07–22 1998–06–18 1999–05–14 2000–04– Рис. 16.1. Темпы прироста индекса РТС с 21 сентября 1995 г. по 7 апреля 2000 г., в процентах.

16.1. Модель ARCH Модель ARCH, т.е. модель с авторегрессионной условной гетероскедастично стью (autoregressive conditional heteroskedasticity), предложена Р. Энглом в 1982 г.

для моделирования кластеризации волатильности. Процесс ARCH q-го порядка, {t}+, задается следующими соотношениями:

t= t|t-1 N(0, t ), t = + 12 +... + q2. (16.1) t-1 t-q Здесь t-1 =(t-1, t-2,... ) — предыстория процесса {t}, а t —услов ная по предыстории дисперсия t, т.е. t = var(t|t-1) =E(2|t-1). Условную t дисперсию часто называют волатильностью процесса. Для того чтобы условная дисперсия оставалась положительной, требуется выполнение соотношений > и 1,..., q 0.

Данный процесс можно записать несколько иначе:

t NID(0, 1), t = tt, t = + 12 +... + q2.

t-1 t-q Аббревиатура NID означает, что t нормально распределены и независимы. Такая запись удобна тем, что нормированный случайный процесс t не зависит от предыс тории.

Смысл модели ARCH состоит в том, что если абсолютная величина t оказы вается большой, то это приводит к повышению условной дисперсии в последующие 16.1. Модель ARCH периоды. В свою очередь, при высокой условной дисперсии более вероятно появ ление больших (по абсолютной величине) значений t. Наоборот, если значения t в течение нескольких периодов близки к 0, то это приводит к понижению услов ной дисперсии в последующие периоды практически до уровня. В свою очередь, при низкой условной дисперсии более вероятно появление малых (по абсолютной величине) значений t. Таким образом, ARCH-процесс характеризуется инерци онностью условной дисперсии (кластеризацией волатильности).

Несложно показать, что процесс ARCH не автокоррелирован:

E(tt-j) =E (E(tt-j|t-1)) = E (t-jE(t|t-1)) = 0.

Поскольку процесс имеет постоянное (нулевое) математическое ожидание и не автокоррелирован, то он является слабо стационарным в случае, если у него есть дисперсия.

Если обозначить разницу между величиной 2 и ее условным математическим t ожиданием, t, через t, то получится следующая эквивалентная запись процесса ARCH:

2 = + 12 +... + q2 + t. (16.2) t t-1 t-q Поскольку условное математическое ожидание t равно 0, то безусловное ма тематическое ожидание также равно 0. Кроме того, как можно показать, {t} не ав токоррелирован. Следовательно, квадраты процесса ARCH(q) следуют авторегрес сионному процессу q-го порядка.

Если все корни характеристического уравнения 1 - 1z -... - qzq = лежат за пределами единичного круга, то у процесса ARCH(q) существует безуслов ная дисперсия, и он является слабо стационарным. Поскольку коэффициенты j q неотрицательны, то это условие эквивалентно условию j < 1.

j= Действительно, вычислим безусловную дисперсию стационарного ARCH процесса, которую мы обозначим через 2. Для этого возьмем математическое ожидание от обеих частей уравнения условной дисперсии (16.1):

E(t ) = + 1E(2 ) +... + qE(2 ).

t-1 t-q Заметим, что E t = E E(2|t-1) = E 2 = var(2) = 2, т.е. мате t t t матическое ожидание условной дисперсии равно безусловной дисперсии. Следова тельно, 2 = + 12 +... + q2, 526 Модели с авторегрессионной условной...

0. ARCH(1),1 = 0.7, = 0. 0. 0. N(0;

/ (1 1)) 0. 0. 8 6 4 2 0 2 4 6 Рис. 16.2. Плотность ARCH(1) и плотность нормального распределения с той же дисперсией или 2 =.

1 - 1 -... - q Таким образом, для всех t безусловная дисперсия одинакова, т.е. имеет место гомоскедастичность. Однако условная дисперсия меняется, поэтому одновременно имеет место условная гетероскедастичность2.

Если не все корни приведенного выше характеристического уравнения лежат q за пределами единичного круга, т.е. если j 1, то безусловная дисперсия не j= существует, и поэтому ARCH-процесс не будет слабо стационарным3.

Еще одно свойство ARCH-процессов состоит в том, что безусловное распре деление t имеет более высокий куртозис (т.е. более толстые хвосты и острую вершину), чем нормальное распределение (определение куртозиса и эксцесса см. в Приложении A.3.1). У ARCH(1) эксцесс равен E(4) t - 3 =, 4 1 - Она называется авторегрессионной, поскольку динамика квадратов ARCH-процесса описыва ется авторегрессией.

При этом у ARCH-процессов есть интересная особенность: они могут быть строго стационарны, не будучи слабо стационарны. Дело в том, что определение слабой стационарности требует суще ствования конечных первых и вторых моментов ряда. Строгая же стационарность этого не требует, поэтому даже если условная дисперсия бесконечна (и, следовательно, ряд не является слабо стаци онарным), ряд всежеможет бытьстрогостационарным.

16.2. Модель GARCH причем при 31 1 четвертый момент распределения не существует (эксцесс равен бесконечности). Это свойство ARCH-процессов хорошо соответствует фи нансовым временным рядам, которые обычно характеризуются толстыми хвоста ми. На рисунке 16.2 изображен график плотности безусловного распределения ARCH(1). Для сравнения на графике приведена плотность нормального распреде ления с той же дисперсией.

Получить состоятельные оценки коэффициентов ARCH-процесса можно, используя вышеприведенное представление его квадратов в виде авторегрес сии (16.2). Более эффективные оценки получаются при использовании метода максимального правдоподобия.

При применении ARCH-моделей к реальным данным было замечено, что мо дель ARCH(1) не дает достаточно длительных кластеров волатильности, а только порождает большое число выбросов (выделяющихся наблюдений). Для корректно го описания данных требуется довольно большая длина лага q, что создает трудно сти при оценивании. В частности, зачастую нарушается условие неотрицательности оценок коэффициентов j. Поэтому Энгл предложил использовать модель со сле дующими ограничениями на коэффициенты лага: они задаются с помощью весов вида:

q +1- j wj =, 0.5q(q +1) сумма которых равна 1 и которые линейно убывают до нуля. Сами коэффициенты берутся равными j = wj. Получается модель с двумя параметрами, и :

t = + w12 +... + wq2.

t-1 t-q 16.2. Модель GARCH Модель GARCH (generalized ARCH — обобщенная модель ARCH), предло женная Т. Боллерслевом, является альтернативной модификацией модели ARCH (16.2), позволяющей получить более длинные кластеры при малом числе пара метров. Модель ARMA зачастую позволяет получить более сжатое описание вре менных зависимостей для условного математического ожидания, чем модель AR.

Подобным же образом модель GARCH дает возможность обойтись меньшим ко личеством параметров по сравнению с моделью ARCH, если речь идет об условной дисперсии. В дальнейшем мы проведем прямую аналогию между моделями GARCH и ARMA.

528 Модели с авторегрессионной условной...

Для того чтобы вывести модель GARCH, используем в модели ARCH бесконеч ный геометрический лаг:

t = + j-12 = + 2.

t-j t- 1 - L j= Применяя преобразование Койка, получим 2 t =(1 - ) + t-1 + 2.

t- Поменяв очевидным образом обозначения, получим модель GARCH(1, 1):

2 t = + t-1 + 2.

t- Модель GARCH(p, q) обобщает эту формулу:

2 2 t = + 1t-1 +... + pt-p + 12 +... + q2 = t-1 t-q p q = + jt-j + j2. (16.3) t-j j=1 j= При этом предполагается, что > 0, 1,..., p 0 и 1,..., q 0.

На практике, как правило, достаточно взять p =1 и q =1. Изредка используют GARCH(1, 2) или GARCH(2, 1).

Как и в модели ARCH, t служит условной дисперсией процесса:

t|t N(0, t ).

Рассчитаем безусловную дисперсию GARCH-процесса, предполагая, что он ста ционарен. Для этого возьмем математические ожидания от обеих частей уравнения 16.3 для условной дисперсии:

p q 2 E(t ) = jE(t-j) + jE(2 ), t-j j=1 j= откуда p q 2 = j2 + j j=1 j= и 2 =.

p q 1 - j - j j=1 j= 16.2. Модель GARCH Таким образом, с точки зрения безусловной дисперсии GARCH-процесс гомос кедастичен.

Для того чтобы дисперсия была конечной, необходимо выполнение условия p q j + j < 1. В частности, для модели GARCH(1, 1) требуется 1 + 1 < 1.

j=1 j= Процесс GARCH можно записать в эквивалентной форме, если, как и выше, в уравнении 16.2 для модели ARCH, обозначить t = 2 - t :

t p m 2 = + (j + j)2 + t - jt-j, t t-j j=1 j= где m =max(p, q). (В этой записи подразумевается j =0 при j > p и j = при j >q.) Такая форма записи позволяет увидеть, что квадраты GARCH-процесса подчиняются модели ARMA(m, p).

Этот факт дает возможность получить автокорреляционную функцию квадратов GARCH-процесса. В частности, для GARCH(1, 1) автокорреляционная функция квадратов имеет вид 1(1 - 1 - 11) 1 =, 1 - 1 - =(1 + 1) -1-1, > 1.

Условие существования безусловного четвертого момента у отдельного наблю 2 дения процесса GARCH(1, 1) состоит в том, что 31 +211 + 1 < 1. Если это условие выполняется, то эксцесс равен E(4) t - 3 = 2 4 1 - 1 - 211 - и является положительным. То есть GARCH-процесс (как и его частный слу чай — ARCH-процесс) имеет более высокий куртозис, чем нормальное распреде ление. В то же время, безусловное распределение отдельного наблюдения GARCH процесса является симметричным, поэтому все нечетные моменты, начиная с тре тьего, равны нулю.

Стандартным методом оценивания для моделей GARCH является метод мак симального правдоподобия. Условно по предыстории t-1 отдельное наблюдение GARCH-процесса распределено нормально: t|t-1 N(0, t ). Функция прав доподобия для ряда 1,..., T, подчиняющегося GARCH-процессу, вычисляется как произведение плотностей этих условных нормальных распределений:

T 1 t L = exp -.

2 2t t=1 2t 530 Модели с авторегрессионной условной...

Максимизируя эту функцию правдоподобия по неизвестным параметрам, по лучим оценки максимального правдоподобия для GARCH-процесса.

При оценивании условную дисперсию t следует считать функцией парамет ров модели и вычислять по рекуррентной формуле 16.3. Для этих вычислений требуются «довыборочные» значения самого процесса и его условной дисперсии, а они неизвестны. Для решения этой проблемы можно использовать различные приемы. Самый простой, по-видимому, состоит в том, чтобы заменить условные дисперсии в начале ряда ( t =1,..., m) оценкой безусловной дисперсии, т.е. ве личиной T s2 = 2.

t T t= Оценки максимального правдоподобия являются состоятельными и асимпто тически эффективными.

На практике модель GARCH дополняют какой-либо моделью, описывающей поведение условного или безусловного математического ожидания наблюдаемо го ряда. Например, можно предположить, что наблюдается не t, а t плюс константа, т.е. что наблюдаемый ряд {xt} имеет постоянное безусловное ма тематическое ожидание, к которому добавляется ошибка t в виде процесса GARCH:

xt = + t.

Можно моделировать безусловное математическое ожидание с помощью ли нейной регрессии, т.е.

xt = Zt + t.

Это позволяет учитывать линейный тренд, детерминированные сезонные пе ременные и т.п. При оценивании в функции правдоподобия вместо t используют xt - Zt.

С точки зрения прогнозирования перспективной является модель, сочетающая ARIMA с GARCH. Модель ARIMA в этом случае используется для моделирования поведения условного математического ожидания ряда, а GARCH —д лямод елиро вания условной дисперсии.

Важнейший вывод, который следует из анализа модели ARCH, состоит в том, что наблюдаемые изменения в дисперсии (волатильности) временного ряда могут иметь эндогенный характер, то есть порождаться определенной нелинейной моде лью, а не какими-то внешними структурными сдвигами.

16.3. Прогнозы и доверительные интервалы для модели GARCH 16.3. Прогнозы и доверительные интервалы для модели GARCH Одна из важнейших целей эконометрических моделей временных рядов — построение прогнозов. Какие преимущества дают модели с авторегрессионной условной гетероскедастичностью с точки зрения прогнозирования временных рядов по сравнению с моделями линейной регрессии или авторегрессии — скользящего среднего? Оказывается, что прямых преимуществ нет, но есть ряд опосредованных преимуществ, которые в отдельных случаях могут иметь большое значение.

Рассмотрим модель линейной регрессии xt = Zt + t, t =1,..., T, в которой ошибка представляет собой GARCH-процесс. Поскольку ошибки не ав токоррелированы и гомоскедастичны, то, как известно, оценки наименьших квад ратов являются наилучшими в классе линейных по x несмещенных оценок. Од нако наличие условной гетероскедастичности позволяет найти более эффективные (т.е. более точные) оценки среди нелинейных и смещенных оценок. Действительно, метод максимального правдоподобия дает асимптотически эффективные оценки, более точные, чем оценки МНК. В ошибку прогноза вносит свой вклад, во-первых, ошибка T +1, а во-вторых, разница между оценками параметров и истинными зна чениями параметров. Использование более точных оценок позволяет уменьшить в некоторой степени вторую составляющую ошибки прогноза.

В обычных моделях временного ряда с неизменными условными дисперсия ми (например, ARMA) неопределенность ошибки прогноза — это возрастающая функция горизонта прогноза, которая (если не учитывать разницу между оценка ми параметров и истинными значениями параметров, отмеченную в предыдущем абзаце) не зависит от момента прогноза. Однако в присутствии ARCH-ошибок точ ность прогноза будет нетривиально зависеть от текущей информации и, следова тельно, от момента прогноза. Поэтому для корректного построения интервальных прогнозов требуется иметь оценки будущих условных дисперсий ошибки.

Кроме того, в некоторых случаях полезно иметь прогнозы не только (условного) математического ожидания изучаемой переменной, но и ее (условной) дисперсии.

Это важно, например, при принятии решений об инвестициях в финансовые ак тивы. В этом случае дисперсию (волатильность) доходности естественно рассмат ривать как меру рискованности финансового актива. Таким образом, сами по себе прогнозы условной дисперсии могут иметь практическое применение.

Покажем, что доверительный интервал прогноза зависит от предыстории T =(xT, xT -1,..., x1,... ).

532 Модели с авторегрессионной условной...

Реально прогноз делается на основе имеющегося ряда (x1,..., xT ), а не всей предыстории, однако различие это не столь существенно. При этом мы будем исхо дить из того, что нам известны истинные параметры процесса. Прогноз на пери одов — это математическое ожидание прогнозируемой величины xT +, условное относительно имеющейся на момент t информации T. Онравен xT () =E(xT +|T ) =E(ZT + + T + |T ) =ZT +.

Здесь учитывается, что поскольку информация T содержится в информации T + -1 при 1, то по правилу повторного взятия математического ожида ния выполнено E(T + |T ) =E (E (T + |T + -1) |T ) =E(0|T ) =0.

Таким образом, если известны истинные параметры, присутствие GARCH-ошибок не отражается на том, как строится точечный прогноз, — он оказывается таким же, как для обычной линейной регрессии. Ошибка предсказания в момент времени T на шагов вперед dT () =xT + - xT () =T +.

Условная дисперсия ошибки предсказания равна p = E d2 () T = E 2 T.

T T + Из этого следует, что она зависит как от горизонта прогноза, так и от предысто рии T.

Заметим, что при t >T выполнено E 2|T = E t |T, поскольку t 2 E 2 - t T = E E 2 - t t-1 T = E(0|T ) =0.

t t Учитывая, что E 2 - t |t-1 = 0 и информация T содержится в информа t ции t-1 при t > T, применяем правило повторного взятия математического ожидания:

2 p = E 2 |T = E T + |T.

T + Таким образом, фактически дисперсия прогноза xT + — это прогноз вола тильности на шагов вперед.

Возьмем от обеих частей рекуррентного уравнения (16.3) для GARCH-процесса математическое ожидание, условное относительно T. Получим p q 2 E t |T = + jE t-j|T + jE 2 |T. (16.4) t-j j=1 j= 16.3. Прогнозы и доверительные интервалы для модели GARCH Можно использовать эту рекуррентную формулу для расчета E t |T при t > T. При этом следует учесть, что E 2|T = 2 при t T, поскольку t t информация об t содержится в информационном множестве T, и по той же 2 причине E t |T = t при t T +1. Кроме того, как только что было доказано, E 2|T = E t |T при t >T.

t Таким образом, имеются все данные для того, чтобы с помощью формулы (16.4) рассчитать дисперсию ошибки прогноза для xT + в мод ели GARCH. При = можно сразу без применения (16.4) записать 2 2 dT (1) = E T +1|T = T +1, где T +1 рассчитывается по обычному правилу. В модели GARCH(1, 1) при > по формуле (16.4) 2 E T + |T = +(1 + 1)E T +-1|T, т.е.

2 dT ( ) = +(1 + 1)dT (-1).

Отсюда следует, что общее выражение для GARCH(1, 1), не подходящее только для случая 1 + 1 =1, имеет вид 1 - (1 + 1)- 2 dT () = +(1 + 1) -1 T +1.

1 - 1 - В пределе при условии стационарности 1+1 < 1 условная дисперсия ошибки прогноза сходится к безусловной дисперсии процесса GARCH(1, 1):

lim dT () =.

1 - 1 - Хотя получено общее выражение для дисперсии ошибки прогноза, этого, вообще говоря, недостаточно для корректного построения доверительных интервалов, по скольку условное относительно T распределение T +, а следовательно, и рас пределение ошибки прогноза dT (), имеет более толстые хвосты, чем нормальное распределение. Чтобы обойти эту проблему, можно использовать, например, про гнозные интервалы в виде плюс/минус двух среднеквадратических ошибок про гноза без выяснения того, какой именно доверительной вероятности это соот ветствует4, т.е. xT () ± 2dT ().

Ясно, что для нормального распределения это примерно 95%-й двусторонний квантиль.

534 Модели с авторегрессионной условной...

20 40 60 80 Рис. 16.3. Иллюстрация интервальных прогнозов для процесса GARCH Чтобы проиллюстрировать зависимость доверительных интервалов прогнозов от предыстории, мы сгенерировали ряд GARCH(1, 1) длиной 100 наблюд енийспа раметрами 1 =0.3 и 1 =0.3 и построили теоретические доверительные интер валы при T =20 и T =40. Прогноз везде равен нулю. Рисунок 16.3 показывает условные доверительные интервалы прогнозов для процесса GARCH(1, 1), а также сам ряд. Интервал для T =20 постепенно сужается, а для T =40 расширяется до уровня, соответствующего безусловной дисперсии. Такое поведение объясняет ся тем, что при T =21 волатильность (условная дисперсия) была относительно высокой, а при T = 41 — относительно низкой. Очевидна способность услов ных прогнозных интервалов приспосабливаться к изменениям в волатильности.

Примечательно то, что интервалы прогнозов могут сужаться с ростом горизонта прогнозов, если прогноз делается в момент, соответствующий высокому уровню волатильности. Это объясняется тем, что в будущем следует ожидать снижения (ожидаемого) уровня волатильности.

На практике следует внести изменения в приведенные выше формулы, которые выведены в предположении, что истинные параметры процесса известны. Если па раметры неизвестны, они заменяются соответствующими оценками. Можно также добавить к дисперсии прогноза поправку, связанную с тем, что при прогнозирова нии используются оценки a, а не истинные коэффициенты регрессии, которая примерно равна ZT +kvar(a)-1ZT +k.

Вместо неизвестной ковариационной матрицы оценок коэффициентов var(a) сле дует взять ее оценку, получаемую в методе максимального правдоподобия.

16.4. Разновидности моделей ARCH 16.4. Разновидности моделей ARCH Существует огромное количество модификаций классической модели GARCH.

Дадим обзор только важнейших направлений, в которых возможна модификация модели. Все эти модели включают в себя какие-либо авторегрессионно услов но гетероскедастичные процессы. Формально процесс {t} с нулевым условным математическим ожиданием E(t|t) = 0 является авторегрессионно условно гетероскедастичным, если его условная относительно предыстории дисперсия t = E(2|t) =var(t|t) t нетривиальным образом зависит от предыстории t.

16.4.1. Функциональная форма динамики условной дисперсии Модели авторегрессионно условно гетероскедастичных процессов могут раз личаться тем, какой именно функцией задается зависимость условной дисперсии от своих лагов и лагов t. Например, в логарифмической GARCH-модели условная дисперсия задается уравнением p q 2 ln t = + j ln t-j + j ln 2.

t-j j=1 j= В такой модели условная дисперсия всегда положительна вне зависимости от зна чений коэффициентов.

Следующая нелинейная GARCH-модель включает в себя как частный случай обычную GARCH-модель:

p q t = + jt-j + j|t-j|.

j=1 j= Кроме того, логарифмическая GARCH-модель является предельным частным случаем этой модели (после небольших изменений) при 0.

В приведенных моделях условная дисперсия не зависит от знаков лагов t, а зависит только от их абсолютной величины. Это может быть серьезным огра ничением, поскольку в реальных финансовых данных часто наблюдается эффект левереджа. Снижение рыночной стоимости акционерного капитала увеличивает отношение заемных средств к собственным и, следовательно, повышает риско ванность вложений в фирму. Последнее проявляется в увеличении волатильности.

536 Модели с авторегрессионной условной...

В результате, будущие значения волатильности отрицательно коррелируют с теку щей доходностью. Это дало толчок к развитию разного рода асимметричных по t моделей. Самой известной является экспоненциальная модель GARCH (EGARCH), предложенная Д. Нельсоном. Она имеет следующий вид:

t NID(0, 1), t = tt, p q 2 ln t = + j ln t-j + jg(t-j), j=1 j= g(t) =t + (|t| -E|t|).

В мод ели EGARCH логарифм условной дисперсии представляет собой процесс ARMA. Первая сумма в уравнении соответствует авторегрессии, а вторая — сколь зящему среднему. Функция g(·) построена так, что E(g(t)) = 0. Таким образом, в EGARCH t зависит и от величины, и от знака лагов t и t. Логарифм услов ной дисперсии ln t описывается процессом ARMA(p, q) с обычными для ARMA условиями стационарности.

Эффект левереджа можно также учесть в нелинейной GARCH-модели, введя дополнительный параметр сдвига :

p q t = + jt-j + j|t-j - |.

j=1 j= 16.4.2. Отказ от нормальности Как уже говорилось, финансовые ряды обычно характеризуются большой ве личиной куртозиса. Модель GARCH частично учитывает это, поскольку в ней без условное распределение GARCH-процесса имеет толстые хвосты. Это является ре зультатом стохастического характера условной дисперсии. Однако, как показывает опыт, этот эффект не полностью улавливается моделью GARCH. Это проявляется в том, что нормированные остатки модели, соответствующие t = t/t, все еще характеризуются большой величиной куртозиса. Таким образом, не выполняется одно из предположений модели GARCH — о том, что t условно по предыстории имеет нормальное распределение.

Это создает трудности при использовании метода максимального правдопо добия для оценивания модели. Допустим, на самом деле ошибки распределены не нормально, но мы максимизируем функцию правдоподобия, основывающуюся на нормальности, т.е. используем так называемый методквазимаксимального прав доподобия. Что при этом произойдет? Во-первых, при нарушении предположения 16.4. Разновидности моделей ARCH о нормальности оценки хотя и будут состоятельными, но не будут асимптотически эффективными (т.е. наиболее точными в пределе). Во-вторых, стандартные мето ды оценивания ковариационной матрицы оценок максимального правдоподобия не годятся, — требуется скорректированная оценка ковариационной матрицы.

Альтернативой методу квазимаксимального правдоподобия служат модели, в которых в явном виде делается предположение о том, что t = t/t име ет распределение, отличающееся от нормального. Наиболее часто используется t-распределение Стьюдента, поскольку это распределение при малых степенях свободы имеет большой куртозис (см. Приложение A.3.2). При этом количество степеней свободы рассматривается как неизвестный параметр, причем непрерыв ный (формула плотности t-распределения подходит и в случае, когда берется неце лое количество степеней свободы). Можно использовать и другие распределения, например, так называемое обобщенное распределение ошибки (GED).

Часто распределение t является скошенным вправо. Для учета этой ситуации следует использовать асимметричные распределения с толстыми хвостами. Напри мер, можно использовать нецентральное t-распределение, известное из статисти ки. Другой вариант, более простой в использовании, — так называемое скошенное t-распределение, которое «склеивается» из двух половинок t-распределений, по разному масштабированных.

16.4.3. GARCH-M В модели GARCH-M непосредственно в уравнение регрессии добавляется условная дисперсия:

xt = Zt + g(t ) +t, где g(·) — некоторая возрастающая функция. Эта новая компонента вводится для отражения влияния волатильности временного ряда на зависимую переменную, поскольку из многих финансовых моделей следует, что доходность актива должна быть положительно связана с рискованностью этого актива.

2 2 2 В качестве g(·) обычно используют g(t ) = t, g(t ) = t = t или 2 g(t ) =ln t.

16.4.4. Стохастическая волатильность В рассмотренных моделях с авторегрессионной гетероскедастичностью услов ная дисперсия однозначно определяется предысторией. Это не оставляет места для случайных влияний на волатильность, помимо влияний лагов самого процесса. Од нако авторегрессионная гетероскедастичность может возникнуть по-другому. При 538 Модели с авторегрессионной условной...

мером является модель авторегрессионной стохастической волатильности, в кото рой логарифм условной дисперсии описывается авторегрессионным процессом.

Модель авторегрессионной стохастической волатильности первого порядка имеет следующий вид:

t NID(0, 1), t NID(0, ), t = tt, 2 ln t = + ln t-1 + t.

Эта модель по структуре проще, чем модель GARCH, и лучше обоснована тео ретически, с точки зрения финансовых моделей, однако ее широкому использова нию мешает сложность эффективного оценивания. Проблема состоит в том, что для нее, в отличие от моделей типа GARCH, невозможно в явном виде выписать функцию правдоподобия. Таким образом, в случае применения модели стохасти ческой волатильности возникает дилемма: либо использовать алгоритмы, которые дают состоятельные, но неэффективные оценки, например, метод моментов, ли бо применять алгоритмы, требующие сложных расчетов, например, алгоритмы, использующие метод Монте-Карло для интегрирования многомерной плотности.

Несложно придумать модели, которые бы объединяли черты моделей типа GARCH и моделей стохастической волатильности. Однако подобные модели на следуют описанные выше проблемы оценивания.

16.4.5. ARCH-процессы с долгосрочной памятью p q Для многих финансовых данных оценка j + j, оказывается очень близ j=1 j= кой к единице. Это дает эмпирическое обоснование для так называемой интегриро ванной модели GARCH, сокращенно IGARCH. Это обычные модели GARCH, вко торых характеристическое уравнение для условной дисперсии имеет корень равный p q единице, и, следовательно, j + j =1. В частности, процесс IGARCH(1, 1) j=1 j= можно записать следующим образом:

2 t = +(1- )t-1 + 2.

t- IGARCH-процессы могут быть строго стационарны, однако не имеют ограни ченной безусловной дисперсии и поэтому не являются слабо стационарными.

Вмод елиIGARCH(1, 1) прогноз волатильности на шагов вперед(или, что то же самое, дисперсия прогноза самого процесса на шагов вперед) равен 2 E(T + |T ) =d2 = (k - 1) + T +1.

() T 16.4. Разновидности моделей ARCH Следовательно, шок условной дисперсии инерционен в том смысле, что он влияет на будущие прогнозы всех горизонтов.

В последние годы получило распространение понятие так называемой дробной интегрированности. Дробно-интегрированный процесс (ARFIMA) с парамет ром интегрированности d (0, 1) занимает промежуточное положение между стационарными процессами ARMA ( d = 0) и интегрированными ( d = 1). Такие процессы имеют автокорреляционную функцию, которая затухает гиперболиче ски, в то время как автокорреляционная функция стационарного процесса ARMA затухает экспоненциально, т.е. более быстро. В связи с этим принято говорить, что дробно-интегрированные процессы характеризуются долгосрочной памятью. Это явление было обнаружено как в уровнях, так и в дисперсиях многих финансовых ря дов. В связи с этим появились модели дробно-интегрированных ARCH-процессов, такие как FIGARCH, HYGARCH.

16.4.6. Многомерные модели волатильности Часто из экономической теории следует, что финансовые временные ряды должны быть взаимосвязаны, в том числе и через волатильность: краткосроч ные и долгосрочные процентные ставки;

валютные курсы двух валют, выражен ные в одной и той же третьей валюте;

курсы акций фирм, зависящих от одного и того же рынка, и т.п. Кроме того, условные взаимные ковариации таких финан совых показателей могут меняться со временем. Ковариация между финансовыми активами играет существенную роль в моделях поиска оптимального инвестици онного портфеля. С этой точки зрения многомерные модели авторегрессионной условной гетероскедастичности являются естественным расширением одномерных моделей.

Pages:     | 1 |   ...   | 5 | 6 || 8 | 9 |   ...   | 10 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.