WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 41 | 42 || 44 | 45 |   ...   | 82 |

Для того чтобы построить доверительный интервал прогноза, следует предположить нормальность ошибок. Более конкретно, предполагаем, что ошибки регрессии, включая ошибку наблюдения, для которого делается прогноз, имеют многомерное нормальное распределение с нулевым математическим ожиданием и ковариационной матрицей 2I. При таком предположении ошибка прогноза имеет нормальное распределение с нулевым математическим ожиданием и дисперсией d:

d N(0, d).

Приводя к стандартному нормальному распределению, получим d N(0, 1).

d Однако, эта формула еще не дает возможности построить доверительный интервал, поскольку истинная дисперсия прогноза d неизвестна. Вместо нее следует использовать оценку -1 s2 = 2 1+zT +k Z Z zT +k, d e где 2 — несмещенная оценка дисперсии ошибок регрессии, или остаточная дисe персия.

364 Глава 11. Основные понятия в анализе временных рядов d Оказывается, что получающаяся величина имеет распределение Стьюsd дента с (T -p-1) степенями свободы (см. Приложение A.3.2), где p — количество d факторов в регрессии (без учета константы): tT -p-1.

sd Построим на основе этого вокруг прогноза xT (k) доверительный интервал для xT +k, учитывая, что d = xT +k - xT (k):

xT (k) - sdtT -p-1,1-q; xT (k) +sdtT -p-1,1-q, где tT -p-1,1-q — (1 - q)-квантиль t-распределения Стьюдента с (T - p - 1) степенями свободы.

Рассмотрим прогнозирование на примере линейного тренда. В этом случае zT +k =(1, T + k), С учетом того, что 1 1 · · · Z =, 1 2 · · · T произведение Z Z имеет вид:

T T t t=Z Z =, T T t tt=1 t= T T 1 t2 - t t=1 t=(Z Z)-1 =, T T 2 T T t2 - t - t T t=1 t=t= T T t2 - 2(T + k) t + T (T + k) t=zT +k (Z Z)-1 zT +k = = T t= T T t2 - t t=1 t= T t2 T (T + k)2 - 2(T + k)t + t2 + - tt=1 T = = T T (t - t)t= T T ((T + k) - t)2 t2 - T t2 ((T + k) - t)2 t== T + T = T + T.

T (t - t)2 T (t - t)2 (t - t)t=1 t=1 t=Тогда:

1 ((T + k) - t)d = 2 1+ + T.

T (t - t)t=11.6. Критерии, используемые в анализе временных рядов Соответственно, 1 ((T + k) - t)sd = e 1+ + T.

T (t - t)t=Из этой формулы видно, что чем больше горизонт прогноза k, тем больше дисперсия прогноза и шире прогнозный интервал.

11.6. Критерии, используемые в анализе временных рядов В анализе временных рядов наиболее разработанными критериями являются критерии случайности, которые призваны определить, является ли ряд чисто случайным, либо в его поведении проявляются определенные закономерности, которые позволяют делать предсказания. «Чисто случайный ряд» — это в данном случае неформальный термин, подчеркивающий отсутствие закономерностей.

Здесь может, например, подразумеваться ряд, состоящий из независимых и одинаково распределенных наблюдений (что соответствует понятию выборки в обычной статистике), либо белый шум, в том смысле, который указан ранее.

Среди экономических временных рядов редко встречаются такие, которые подходят под это описание3. Типичный экономический ряд характеризуется сильной положительной корреляцией. Очень часто экономические ряды содержат тенденцию, сезонность и т.д. В связи с этим применение критериев случайности по прямому назначению не имеет особого смысла. Тем не менее, критерии случайности играют очень важную роль в анализе временных рядов, и существуют различные способы их использования:

1) Критерий может быть чувствительным к определенным отклонениям от «случайности». Тогда большое значение соответствующей статистики может указывать на наличие именно такого отклонения. Таким образом, статистика критерия может использоваться просто как описательная статистика. При этом формальная проверка гипотезы не производится.

Так, например, автокорреляционная функция, о которой речь пойдет ниже, очень чувствительна к наличию периодичностей и трендов. Кроме того, по автокорреляционной функции можно определить, насколько быстро затухает временна я зависимость в рядах4.

Близки к этому, видимо, только темпы прироста курсов ценных бумаг.

При интерпретации автокорреляционной функции возникают сложности, связанные с тем, что соседние значения автокорреляций коррелированы между собой.

366 Глава 11. Основные понятия в анализе временных рядов 2) Критерий можно применять к остаткам от модели, а не к самому исходному ряду. Пусть, например, была оценена модель вида «тренд плюс шум». После вычитания из ряда выявленного тренда получаются остатки, которые можно рассматривать как оценки случайной компоненты. Наличие в остатках каких-либо закономерностей свидетельствует о том, что модель неполна, либо в принципе некорректна. Поэтому критерии случайности можно использовать в качестве диагностических критериев при моделировании.

Следует помнить, однако, что распределение статистики, рассчитанной по остаткам, и распределение статистики, рассчитанной по исходному случайному шуму, вообще говоря, не совпадают. В некоторых случаях при большом количестве наблюдений это различие несущественно, но часто в результате критерий становится несостоятельным и критические значения в исходном виде применять нельзя5.

Существует большое количество различных критериев случайности. По-видимому, наиболее популярными являются критерии, основанные на автокорреляционной функции.

11.6.1. Критерии, основанные на автокорреляционной функции Для того чтобы сконструировать критерии, следует рассмотреть, какими статистическими свойствами характеризуется автокорреляционная функция стационарного процесса.

Известно, что выборочные автокорреляции имеют нормальное асимптотическое распределение. При большом количестве наблюдений математическое ожидание rk приближенно равно k. Дисперсия автокорреляции приближенно равна + var(rk) [2 + i-ki+k - 4kii+k +222]. (11.10) i k i T i=Для ковариации двух коэффициентов автокорреляции верно приближение cov(rk, rl) (11.11) + [i+ki+l + i-ki+l - 2kii+l - 2lii+k +2kl2] i T i=Эти аппроксимации были выведены Бартлеттом.

Так, Q-статистика, о которой идет речь ниже, в случае остатков модели ARMA(p, q) будет распределена не как 2, а как 2. Применение распределения 2 приводит к тому, что m m-p-q m нулевая гипотеза о «случайности» принимается слишком часто.

11.6. Критерии, используемые в анализе временных рядов В частности, для белого шума (учитывая, что k = 0 при k = 0) получаем согласно формуле (11.10) var(rk). (11.12) T Это только грубое приближение для дисперсии. Для гауссовского белого шума известна точная формула для дисперсии коэффициента автокорреляции:

T - k var(rk) =. (11.13) T (T +2) Кроме того, из приближенной формулы (11.11) следует, что автокорреляции rk и rl, соответствующие разным порядкам ( k = l), некоррелированы.

Эти формулы позволяют проверять гипотезы относительно автокорреляционных коэффициентов. Так, в предположении, что ряд представляет собой белый шум, можно использовать следующий доверительный интервал для отдельного коэффициента автокорреляции:

T - k T - k rk - 1-, rk + 1-, T (T +2) T (T +2) где 1- — квантиль нормального распределения. При больших T и малых k оправдано использование более простой формулы 1- 1 rk -, rk +, T T Вместо того чтобы проверять отсутствие автокорреляции для каждого отдельного коэффициента, имеет смысл использовать критерий случайности, основанный на нескольких ближних автокорреляциях. Рассмотрим m первых автокорреляций:

r1,..., rm. В предположении, что ряд является белым шумом, при большом коли честве наблюдений их совместное распределение приближенно равно N 0, Im.

T На основе этого приближения Бокс и Пирс предложили следующую статистику, называемую Q-статистикой Бокса—Пирса:

m Q (r) =T rk.

k=Она имеет асимптотическое распределение 2.

m При дальнейшем изучении выяснилось, что выборочные значения Q-статистики Бокса—Пирса могут сильно отклонятся от распределения 2. Для улучшения m 368 Глава 11. Основные понятия в анализе временных рядов аппроксимации Льюнг и Бокс предложили использовать точную формулу дисперсии (11.13) вместо (11.12). Полученная ими статистика, Q-статистика Льюнга— Бокса:

m rk Q (r) =T (T +2), T - k k=тоже имеет асимптотическое распределение 2, однако при малом количестве m наблюдений демонстрирует гораздо лучшее соответствие этому асимптотическому распределению, чем статистика Бокса—Пирса.

Было показано, что критерий не теряет своей состоятельности даже при невыполнении гипотезы о нормальности процесса. Требуется лишь, чтобы дисперсия была конечной.

Нулевая гипотеза в Q-критерии заключается в том, что рядпредставляет собой белый шум, то есть является чисто случайным процессом. Используется стандартная процедура проверки: если расчетное значение Q-статистики больше заданного квантиля распределения 2, то нулевая гипотеза отвергается и признается налиm чие автокорреляции до m-го порядка в исследуемом ряду.

Кроме критериев случайности можно строить и другие критерии на основе автокорреляций. Пусть, например, i =0 при i k, т.е. процесс автокоррелирован, но автокорреляция пропадает после порядка k. Тогда по формуле 11.10 получаем k- var(rk) 1+2 2.

i i=Если в этой формуле заменить теоретические автокорреляции выборочными, то получим следующее приближение:

k- var(rk) 1+2 ri.

i=На основе этого приближения (приближения Бартлетта) с учетом асимптотической нормальности можно стандартным образом построить доверительный интервал для rk:

rk - 1- var(rk), rk + var(rk).

1Это предположение выполнено для процессов скользящего среднего MA(q) при q < k (см. п. 14.4).

11.6. Критерии, используемые в анализе временных рядов 0.Автокорреляции 0.95%-е доверительные 0.интервалы 0.0.-0.0 10 20 30 Рис. 11.2. Коррелограмма с доверительными интервалами, основанными на формуле Бартлетта.

На рисунке 11.2 представлена коррелограмма некоторого ряда с доверительными интервалами, основанными на формуле Бартлетта7. Для удобства доверительные интервалы построены вокруг нуля, а не вокруг rk.

11.6.2. Критерий Спирмена Критерий Спирмена принадлежит к числу непараметрических8 критериев проверки случайности временного ряда и связан с использованием коэффициента ранговой корреляции Спирмена. Он позволяет уловить наличие или отсутствие тренда в последовательности наблюдений за исследуемой переменной.

Идея критерия состоит в следующем. Допустим, что имеется временной ряд, представленный в хронологической последовательности. Если ряд случайный, то распределение отдельного наблюдения не зависит от того, в каком месте ряда стоит это наблюдение, какой номер оно имеет. При расчете критерия Спирмена в соответствие исходному ряду ставится проранжированный ряд, т.е. полученный в результате сортировки изучаемой переменной по возрастанию или по убыванию.

Новый порядок, или ранг t, сравнивается с исходным номером t, соответствуПри использовании нескольких доверительных интервалов следует отдавать себе отчет, что они не являются совместными. В связи с этим при одновременном использовании интервалов вероятность ошибки первого рода будет выше В отличие от параметрических, непараметрические критерии не имеют в своей основе априорных предположений о законах распределения временного ряда.

370 Глава 11. Основные понятия в анализе временных рядов ющим хронологической последовательности. Эти порядки будут независимы для чисто случайного процесса и коррелированы при наличии тенденции.

В крайнем случае, если ряд всегда возрастает, то полученная ранжировка совпадает с исходным порядком наблюдений, т.е. t = t для всех наблюдений t =1,..., T. В общем случае тесноту связи между двумя последовательностями 1,..., T и 1,..., T можно измерить с помощью обычного коэффициента корреляции:

T xtt = t=1, (11.14) T T x2 t t=1 t t=заменяя xt на t и yt на t. Такой показатель корреляции между рангами наблюдений (когда xt и yt представляют собой перестановки первых T натуральных чисел) в статистике называется коэффициентом ранговой корреляции Спирмена:

T =1 - (t - t)2. (11.15) T (T - 1) t=Для чисто случайных процессов имеет нулевое математическое ожидание и дисперсию, равную. В больших выборках величина приближенно имеет T - нормальное распределение N(0, ). Для малых выборок предпочтительнее T - T - использовать в качестве статистики величину, которая приближенно 1 - имеет распределение Стьюдента с T - 2 степенями свободы. Если искомая расчетная величина по модулю меньше двусторонней критической границы распределения Стьюдента, то нулевая гипотеза о том, что процесс является случайным, принимается и утверждается, что тенденция отсутствует. И наоборот, если искомая величина по модулю превосходит табличное значение, т.е. значение коэффициента существенно отлично от нуля, то нулевая гипотеза о случайности ряда отвергается. Как правило, это можно интерпретировать как наличие тенденции.

11.6.3. Сравнение средних Кроме критериев случайности можно использовать различные способы проверки неизменности во времени моментов первого и второго порядков. Из всего многообразия подобных критериев рассмотрим лишь некоторые.

В статистике существует ряд критериев, оценивающих неоднородность выборки путем ранжирования наблюдений с последующим разбиением их на группы 11.6. Критерии, используемые в анализе временных рядов и сравнением межгрупповых показателей. Эти критерии применимы и к временным рядам. При анализе временных рядов нет необходимости в ранжировании наблюдений и поиске адекватного способа сортировки — их порядок автоматически закреплен на временном интервале. Например, можно проверять, является ли математическое ожидание («среднее») постоянным или же в начале ряда оно иное, чем в конце.

Разобьем ряд длиной T на две части примерно равной длины: x1,..., xTи xT1+1,..., xT. Пусть x1 — среднее, s2 — выборочная дисперсия (несмещен ная оценка), T1 — количество наблюдений по первой части ряда, а x2, s2 и T2 = = T - T1 — те же величины по второй части.

Статистика Стьюдента для проверки равенства средних в двух частях ряда равна T1 + T2 - t =(x1 - x2). (11.16) (1/T1 +1/T2) (T1 - 1)s2 +(T2 - 1)s1 В предположении, что ряд является гауссовским белым шумом, данная статистика имеет распределение Стьюдента с T1 + T2 - 2 степенями свободы. Если статистика t по модулю превосходит заданный двусторонний квантиль распределения Стьюдента, то нулевая гипотеза отвергается.

Данный критерий имеет хорошую мощность в случае, если альтернативой является ряд со структурным сдвигом. С помощью данной статистики также можно обнаружить наличие тенденции в изучаемом ряде. Для того чтобы увеличить мощность критерия в этом случае, можно среднюю часть ряда (например, треть наблюдений) не учитывать. При этом T1 + T2

Рассчитать статистику при T1 + T2 = T можно с помощью вспомогательной регрессии следующего вида:

Pages:     | 1 |   ...   | 41 | 42 || 44 | 45 |   ...   | 82 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.