WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 40 | 41 || 43 | 44 |   ...   | 82 |

0 0 · · · xT 11.3. Основные описательные статистики для временных рядов Статистической оценкой автокорреляции k-го порядка для стационарных проck cцессов является выборочный коэффициент автокорреляции: rk =. При анализе изменения величин ck и rk в зависимости от значения k обычно пользуются выборочными автоковариационной и автокорреляционной функциями, определяемыми как последовательности {ck} и {rk}, соответственно. Выборочная автокорреляционная функция играет особую роль в анализе стационарных временных рядов, поскольку может быть использована в качестве инструмента для распознавания типа процесса. При этом обычно анализируют график автокорреляционной функции, называемый коррелограммой.

Заметим, что по ряду длиной T можно вычислить автокорреляции вплоть до rT -1. Однако «дальние» автокорреляции вычисляются неточно. С ростом порядка k количество наблюдений, по которым вычисляется коэффициент автокорреляции rk, уменьшается. Для расчета rT -1 используется два наблюдения. Таким образом, с ростом k выборочные автокорреляции rk становятся все менее надежными оценками теоретических автокорреляций k. Таким образом, при анализе ряда следует принимать во внимание только самые «ближние» автокорреляции, например, первые [T/5] автокорреляций.

По аналогии с автоковариациями и автокорреляциями для анализа совместной динамики нескольких рядов можно использовать выборочные кросс-ковариации и кросс-корреляции.

Выборочная кросс-ковариация двух временных рядов, {xt} и {yt}, рассчитывается по формуле:

T -k k = (xt+k - x)(yt - y).

T t=Она характеризует взаимосвязи двух рядов во времени с различной величиной сдвига k. Следует помнить, что, в отличие от автоковариации, кросс-ковариация не является симметричной по k, поэтому ее следует рассматривать и при положительных, и при отрицательных k.

Выборочная кросс-корреляция определяется как:

T -k (xt+k - x)(yt - y) t=.

T T (xt - x)2 (yt - y)t=1 t=356 Глава 11. Основные понятия в анализе временных рядов 11.4. Использование линейной регрессии с детерминированными факторами для моделирования временного ряда Сравнительно простой моделью временного ряда может служить модель вида:

xt = µt + t, t =1,..., T, (11.2) где µt — полностью детерминированная последовательность или систематическая составляющая, t — последовательность случайных влеичин, являющаяся белым шумом. Если µt зависит от вектора неизвестных параметров : µt = µt(), томодель (11.2) является моделью регрессии, и ее параметры можно оценить с помощью МНК.

Детерминированная компонента µt, как правило, сама моделируется как состоящая из нескольких компонент. Например, можно рассмотреть аддитивную модель, в которой временной ряд содержит три компоненты: тренд t, сезонные движения vt и случайные флуктуации t:

xt = t + vt + t.

Зачастую изучаемый экономический ряд ведет себя так, что аддитивной схеме следует предпочесть мультипликативную схему:

xt = tvt exp(t).

Однако, если это выражение прологарифмировать, то получится аддитивный вариант:

ln(xt) =ln(t) +ln(vt) +t = t + vt + t, что позволяет оставаться в рамках линейной регрессии и значительно упрощает моделирование.

11.4.1. Тренды Существует три основных типа трендов.

Первым и самим очевидным типом тренда представляется тренд среднего, когда временной ряд выглядит как колебания около медленно возрастающей или убывающей величины.

Второй тип трендов — это тренд дисперсии. В этом случае во времени меняется амплитуда колебаний переменной. Иными словами, процесс гетероскедастичен.

11.4 Использование линейной регрессии Часто экономические процессы с возрастающим средним имеют и возрастающую дисперсию.

Третий и более тонкий тип тренда, визуально не всегда наблюдаемый, — изменение величины корреляции между текущим и предшествующим значениями ряда, т.е. тренд автоковариации и автокорреляции.

Проводя разложение ряда на компоненты, мы, как правило, подразумеваем под трендом изменение среднего уровня переменной, то есть тренд среднего.

В рамках анализа тренда среднего выделяют следующие основные способы аппроксимации временных рядов и соответствующие основные виды трендов среднего.

– Полиномиальный тренд:

t = a0 + a1t +... + aptp. (11.3) Для p =1 имеем линейный тренд.

– Экспоненциальный тренд:

p t = ea0+a1t+...+apt. (11.4) – Гармонический тренд:

t = R cos(t + ), (11.5) где R — амплитуда колебаний, — угловая частота, — фаза.

– Тренд, выражаемый логистической функцией:

k t =. (11.6) 1+be-at Оценивание параметров полиномиального и экспоненциального трендов (после введения обозначения zi = ti, i =1,..., p, — в первом случае и логарифмирования функции во втором случае) производится с помощью обычного МНК.

Гармонический тренд оправдан, когда в составе временного ряда отчетливо прослеживаются периодические колебания. При этом если частота известна (или ее можно оценить), то функцию (11.5) несложно представить в виде линейной комбинации синуса и косинуса:

t = cos(t) + sin(t) и, рассчитав векторы cos(t) и sin(t), также воспользоваться МНК для оценивания параметров и.

Логистическая кривая нуждается в особом рассмотрении.

358 Глава 11. Основные понятия в анализе временных рядов 11.4.2. Оценка логистической функции Проанализируем логистическую функцию:

k t =, (11.7) 1+be-at где a, b, k — параметры, подлежащие оцениванию. Функция ограничена и имеет горизонтальную асимптоту (рис. 11.1):

lim t = k.

t В этом преимущество логистической функции перед полиномиальной или экспонен t циальной функциями, которые по мере роk ста t стремятся в бесконечность и, следовательно, не всегда годятся для прогнозирования.

Логистическая кривая наиболее часто используется при изучении социальных и, в частности, демографических процессов.

Особенностью логистической кривой t является нелинейность по оцениваемым Рис. 11.1. Логистическая кривая параметрам a, b, k, поэтому система уравнений, получаемая с помощью МНК, нелинейна относительно неизвестных параметров и для ее решения могут применяться только итеративные численные методы.

ГарольдГоттелинг (H. Hotteling) предложил интересный методдля оценки этих параметров, основанный на использовании дифференциального уравнения логистической функции. Дифференцирование функции t по времени t дает первую производную:

dt kabe-at =.

dt (1 + be-at)Поскольку t2 k k = и be-at = - 1, k (1 + be-at)2 t то, подставляя эти выражения в формулу первой производной, получаем дифференциальное уравнение, выражающее зависимость темпа прироста исследуемой 11.4 Использование линейной регрессии переменной от абсолютного уровня показателя в момент времени t:

dt/dt a = a - t. (11.8) t k Исходя из этого соотношения, можно предположить, что в реальности абсолютный прирост показателя xt связан с фактическим его уровнем xt следующей статистической зависимостью:

a xt = axt + - x2 + t, t k где t —белыйшум.

К этому уравнению теперь можно применить непосредственно метод наименьa ших квадратов, получить оценки параметров a и - и, следовательно, найти k.

k Оценка параметра b методом моментов впервые предложена Родсом. Так как k k be-at = - 1, то ln b = at +ln - 1 и с помощью метода моментов получаем:

t t T 1 T (T +1) k ln b = a · + ln - 1, T 2 t t=или фактически после замены t на xt имеем:

T k ln - a(T +1) xt t=ln b = +. (11.9) 2 T Описанный выше методГоттелинга имеет ограниченную сферу применения, его использование оправдано лишь в том случае, если наблюдения в исходном временном ряду представлены через равные промежутки времени (например, ежегодные или еженедельные данные).

11.4.3. Сезонные колебания Для моделирования сезонной составляющей t можно использовать формулу:

vt = 11t +... + hht, где jt — сезонные фиктивные переменные, соответствующие h сезонам:

jt =1, когда наблюдение относится к сезону j, и jt =0 в противном случае.

360 Глава 11. Основные понятия в анализе временных рядов Использование в линейной регрессии полного набора таких переменных связано с одной особенностью. В сумме они дают единицу:

1t +... + ht =1.

Поэтому, коль скоро в регрессии имеется константа, то будет иметь место линейная зависимость, и 1,..., h нельзя будет оценить однозначно. Таким образом, требуется наложить на коэффициенты 1,..., h какое-либо нормирующее ограничение. В частности, можно положить один из коэффициентов равным нулю, что эквивалентно неиспользованию соответствующей переменной при построении регрессии. Однако более удачная нормировка состоит в том, чтобы положить 1 +... + h =0. При этом сезонная компонента центрируется, то есть в среднем влияние эффекта сезонности на уровень ряда оказывается равным нулю.

Подставим это ограничение в сезонную компоненту, исключив коэффициент 1:

vt = -(2 +... + h)1t + 22t +... + hht = = 2(2t - 1t) +... + h(ht - 1t).

Новые переменные 2t - 1t,..., ht - 1t будут уже линейно независимыми, и их можно использовать в линейной регрессии в качестве факторов, а также получить и оценку структуры сезонности 1,..., h. Трактовать ее следует так: в j-м сезоне сезонность приводит к отклонению от основной динамики ряда на величину j.

Если для описания тренда взять полиномиальную функцию, то, используя аддитивную схему, можно представить временной ряд в виде следующей линейной регрессии:

xt = a0 + a1t +... + aptp + 11t +... + hht + t, где 1 +... + h =0.

В этой регрессии ai и j являются неизвестными коэффициентами. Применение МНК дает оценки p + h +1 неизвестных коэффициентов и приводит к выделению составляющих t, vt и t.

11.4.4. Аномальные наблюдения При моделировании временного ряда часто отбрасываются аномальные наблюдения, резко отклоняющиеся от направления эволюции ряда. Такого рода выбросы, вместо исключения, можно моделировать с помощью фиктивных переменных, соответствующих фиксированным моментам времени. Предположим, 11.5. Прогнозы по регрессии с детерминированными факторами что в момент t в экономике произошло какое-нибудь важное событие (например, отставка правительства). Тогда можно построить фиктивную переменную t t, которая равна нулю всегда, кроме момента t = t, когда она равна единиt це: t =(0,..., 0, 1, 0,..., 0).

Такая фиктивная переменная пригодна только для моделирования кратковременного отклонения временного ряда. Если же в экономике произошел структурный сдвиг, вызвавший скачок в динамике ряда, то следует использовать фиктивную переменную другого вида: (0,..., 0, 1,..., 1). Эта переменная равна нулю до некоторого фиксированного момента t, а после этого момента становится равной единице.

Заметим, что последние два вида переменных нельзя использовать для прогнозирования, поскольку они относятся к единичным непрогнозируемым событиям.

11.5. Прогнозы по регрессии с детерминированными факторами.

Экстраполирование тренда Предположим, что данные описываются линейной регрессией с детерминированными регрессорами, являющимися функциями t, и получены оценки параметров регрессии на основе данных x =(x1,..., xT ) и соответствующей матрицы факторов Z. Это позволяет построить прогноз на будущее, например на период T + k. Вообще говоря, прогноз в такой регрессии строится так же, как в любой классической линейной регрессии. Отличие состоит только в том, что значения факторов zT +k, необходимые для осуществления прогноза, в данном случае всегда известны.

Рассмотрим прогнозирование на примере, когда временной ряд моделируется по упрощенной схеме — тренд плюс шум: xt = t + t, гд е t = zt, zt — вектор-строка значения факторов регрессии в момент t, — вектор-столбец коэффициентов регрессии.

Такое моделирование имеет смысл, если циклические и сезонные компоненты отсутствуют или мало значимы. Тогда выявленный тренд t может служить основой для прогнозирования. Прогноз величины xT +k строится по формуле условного математического ожидания xT (k) =zT +ka,где a — оценки параметров, полученные с помощью МНК, т.е. a =(Z Z)-1 Z x. Известно, что такой прогноз обладает свойством оптимальности.

Предположим, что для описания тренда выбран многочлен:

t = 0 + 1t + 2t2 +... + ptp, t =1,..., T.

362 Глава 11. Основные понятия в анализе временных рядов В такой модели матрица факторов имеет следующий вид:

10 11 · · · 1p 20 21 · · · 2p Z =.

...

.

....

.

...

0 1 p T T · · · T Вектор значений факторов на момент T + k известен определенно:

zT +k = 1, (T + k), (T + k)2,..., (T + k)p.

Точечный прогноз исследуемого показателя в момент времени T на k шагов вперед равен:

xT (k) =zT +ka = a0 + a1(T + k) +a2(T + k)2 +... + ap(T + k)p.

Возвратимся к общей теории прогноза. Ошибка прогноза равна:

d = xT +k - xT (k) =xT +k - zT +ka.

Ее можно представить как сумму двух отдельных ошибок:

d =(xT +k - zT +k) +(zT +k - zT +ka) =T +k + zT +k( - a).

Первое слагаемое здесь — это будущая ошибка единичного наблюдения, а второе — ошибка, обусловленная выборкой и связанная с тем, что вместо неизвестных истинных параметров используются оценки a.

Прогноз будет несмещенным, поскольку E(d) =E(T +k) +zT +kE( - a) =0.

Величина xT (k) представляет собой точечный прогноз. Поскольку точечный прогноз всегда связан с ошибкой, то важно иметь оценку точности этого прогноза. Кроме того, вокруг точечного прогноза желательно построить доверительный интервал и, тем самым, получить интервальный прогноз.

Точность прогноза измеряется, как правило, средним квадратом ошибки прогноза, т.е. величиной E(d2), или корнем из нее — среднеквадратической ошибкой прогноза. Поскольку E(d) =0, то средний квадрат ошибки прогноза равен дисперсии ошибки прогноза. Полезным показателем точности является корень из этой 11.5. Прогнозы по регрессии с детерминированными факторами дисперсии — стандартная ошибка прогноза. В предположении отсутствия автокорреляции ошибок t дисперсия ошибки прогноза, подобно самой ошибке прогноза, является суммой двух дисперсий: дисперсии T +k и дисперсии zT +k( - a), а именно:

d = var(d) =var(T +k) +var (zT +k( - a)).

Найдем эту дисперсию, исходя из того, что ошибки гомоскедастичны:

2 d = 2 + zT +kvar( - a)zT +k = 2 + zT +kvar(a)zT +k.

Как известно, при отсутствии автокорреляции и гетероскедастичности, оценки МНК имеют дисперсию -var(a) =2 Z Z.

Поэтому -1 d = 2 1+zT +k Z Z zT +k.

Pages:     | 1 |   ...   | 40 | 41 || 43 | 44 |   ...   | 82 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.