WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 30 | 31 || 33 | 34 |   ...   | 82 |

k Nlsl N l=bs = — отношение средней арифметической дисперсий к сред /N k s2Nl l l=ней геометрической; это отношение в соответствии со свойством мажорантности средних (см. п. 2.2) больше или равно единице, и чем сильнее различаются дисперсии по подмножествам, тем оно выше.

8.2. Гетероскедастичность ошибок eisssssyi Рис. 8.Тогда статистика Бартлетта равна N bc = ln bs.

k 1 l=Nl N 1+ 3(k - 1) При однородности наблюдений по дисперсии (нулевая гипотеза) эта статистика распределена как 2. Проверка нулевой гипотезы проводится по обычному алk-горитму.

Если нулевую гипотезу отвергнуть не удалось, т.е. ситуация гомоскедастична, то исходная оценка модели удовлетворительна. Если же нулевая гипотеза отвергнута, то ситуация гетероскедастична.

Принцип построения статистики Бартлетта иллюстрирует рисунок 8.1.

Классический метод второй группы заключается в следующем. Все наблюдения упорядочиваются по возрастанию некоторой переменной yi. Затем оцениваются две вспомогательные регрессии: по K «малым» и по K «большим» наблюдениям (с целью повышения мощности критерия средние N - 2K наблюдения в расчете не участвуют, а K можно, например, выбрать равным приблизительно трети N).

Пусть s2 — остаточная дисперсия в первой из этих регрессий, а s2 — во второй.

1 В случае гомоскедастичности ошибок (нулевая гипотеза) отношение двух дисперсий распределено как s FK-n-1, K-n-1.

sЗдесь следует применять обычный F -критерий. Нулевая гипотеза о гомоскедастичности принимается, если рассчитанная статистика превышает 95%-ный квантиль F -распределения.

262 Глава 8. Нарушение гипотез основной линейной модели eissyi Рис. 8.Такой подход применяется, если ожидается, что дисперсия может быть только положительно коррелирована с переменной yi. Если неизвестно, положительно или отрицательно коррелирована дисперсия с рассматриваемым фактором, то следует отклонять нулевую гипотезу как при больших, так и при малых значениях стаsтистики. Можно применить следующий прием: рассчитать статистику как sотношение максимальной из дисперсий s2 и s2 к минимальной. Такая статисти1 ка будет иметь усеченное F -распределение, где усечение происходит на уровне медианы, и берется правая половина распределения. Отсюда следует, что для достижения, например, 5%-го уровня ошибки, следует взять табличную критическую границу, соответствующую, 2.5%-му правому хвосту обычного (не усеченного) F -распределения. Если указанная статистика превышает данную границу, то нулевая гипотеза о гомоскедастичности отвергается.

Данный метод известен под названием метода Голдфельда—Квандта.

Можно применять упрощенный вариант этого критерия, когда дисперсии s2 и s2 считаются на основе остатков из проверяемой регрессии. При этом s2 и s2 не 2 1 будут независимы, и их отношение будет иметь F -распределение только приближенно. Этот метод иллюстрирует рисунок 8.2.

Для того чтобы можно было применять методы третьей группы, требуется обладать конкретной информацией о том, какой именно вид имеет гетероскедастичность.

Так, например, если остатки прямо пропорциональны значениям фактора (n =1):

x = z + + z, и удовлетворяет необходимым гипотезам, то делением обеих частей уравнения на z ситуация возвращается в «штатную»:

x = + +, Z Z 8.2. Гетероскедастичность ошибок eissyi Рис. 8.в которой, правда, угловой коэффициент и свободный член меняются местами. Тем самым применяется преобразование в пространстве наблюдений такое, что диаго нальные элементы матрицы D равны.

zi Если зависимость дисперсии от других переменных известна не точно, а только с точностью до некоторых неизвестных параметров, то для проверки гомоскедастичности следует использовать вспомогательные регрессии.

Так называемый метод Глейзера состоит в следующем. Строится регрессия модулей остатков |ei| на константу и те переменные, которые могут быть коррелированными с дисперсией (например, это может быть все множество независимых факторов или какое-то их подмножество). Если регрессия оказывается статистически значимой, то гипотеза гомоскедастичности отвергается.

Построение вспомогательной регрессии от некоторой переменной yi показано на рисунке 8.3.

Другой метод (критерий Годфрея) использует аналогичную вспомогательную регрессию, в которой в качестве зависимой переменной используются квадраты остатков e2.

i Если с помощью какого-либо из перечисленных критериев (или других аналогичных критериев) проверены различные варианты возможной зависимости и нулевая гипотеза во всех случаях не была отвергнута, то делается вывод, что ситуация гомоскедастична или гетероскедастична без негативных последствий и что для оценки параметров модели можно использовать обычный МНК. Если же нулевая гипотеза отвергнута и поэтому, возможно, имеет место гетероскедастичность с негативными последствиями, то желательно получить более точные оценки, учитывающие гетероскедастичность.

Это можно сделать, используя для оценивания обобщенный МНК (см. уравнение (8.2)). Соответствующее преобразование в пространстве наблюдений состоит 264 Глава 8. Нарушение гипотез основной линейной модели в том, чтобы каждое наблюдение умножить на di, т.е. требуется оценить обычным методом наименьших квадратов преобразованную регрессию с переменными diXi и diZi. При этом не следует забывать, что если матрица факторов Z содержит свободный член, то его тоже нужно умножить на di, поэтому вместо свободного члена в регрессии появится переменная вида (d1,..., dN ). Это приводит к тому, что стандартные статистические пакеты выдают неверные значения коэффициента детерминации и F -статистики. Чтобы этого не происходило, требуется пользоваться специализированными процедурами для расчета взвешенной регрессии.

Описанный методполучил название взвешенного МНК, поскольку он равнозначен N минимизации взвешенной суммы квадратов остатков d2e2.

i i i=Чтобы это можно было осуществить, необходимо каким-то образом получить оценку матрицы D, используемой для преобразования в пространстве наблюдений.

Перечисленные в этом параграфе методы дают возможность не только проверить гипотезу об отсутствии гетероскедастичности, но и получить определенные оценки матрицы D (возможно, не очень хорошие).

Если S2 — оценка матрицы 2, гд е S2 — диагональная матрица, составленная из оценок дисперсий, то S-1 (матрица, обратная к ее квадратному корню) — оценка матрицы D.

Так, после проверки гомоскедастичности методом Глейзера в качестве диа гональных элементов матрицы S-1 можно взять — |ei|c, гд е |ei|c расчетные значения |ei|. Если используются критерии Бартлетта или Голдфельда—Квандта, то наблюдения разбиваются на группы, для каждой из которых есть оценка дисперсии, s2. Тогда для этой группы наблюдений в качестве диагональных элементов l матрицы S-1 можно взять.

sl В методе Голдфельда—Квандта требуется дополнительно получить оценку дисперсии для пропущенной средней части наблюдений. Эту оценку можно получить непосредственно по остаткам пропущенных налюдений или как среднее (s2+s2)/2.

1 Если точный вид гетероскедастичности неизвестен, и, как следствие, взвешенный МНК неприменим, то, по крайней мере, следует скорректировать оценку ковариационной матрицы оценок параметров, оцененных обычным МНК, прежде чем проверять гипотезы о значимости коэффициентов. (Хотя при использовании обычного МНК оценки будут менее точными, но как уже упоминалось, они будут несмещенными и состоятельными.) Простейший метод коррекции состоит в замене неизвестной ковариационной матрицы ошибок 2 на ее оценку S2, гд е S2 — диагональная матрица с типичным элементом e2 (т.е. квадраты остатков используются как оценки i дисперсий). Тогда получается следующая скорректированная оценка ковариационной матрицы a (оценка Уайта или устойчивая к гетероскедастичности оценка):

(Z Z)-1 Z S2Z (Z Z)-1.

8.3. Автокорреляция ошибок 8.3. Автокорреляция ошибок Если матрица ковариаций ошибок не является диагональной, то говорят об автокорреляции ошибок. Обычно при этом предполагают, что наблюдения однородны по дисперсии, и их последовательность имеет определенный смысл и жестко фиксирована. Как правило, такая ситуация имеет место, если наблюдения проводятся в последовательные моменты времени. В этом случае можно говорить о зависимостях ошибок по наблюдениям, отстоящим друг от друга на 1, 2, 3 ит.д.

момента времени. Обычно рассматривается частный случай автокорреляции, когда коэффициенты ковариации ошибок зависят только от расстояния во времени между наблюдениями; тогда возникает матрица ковариаций, в которой все элементы каждой диагонали (не только главной) одинаковы1.

Поскольку действие причин, обуславливающих возникновение ошибок, достаточно устойчиво во времени, автокорреляции ошибок, как правило, положительны.

Это ведет к тому, что значения остаточной дисперсии, полученные по стандартным («штатным») формулам, оказываются ниже их действительных значений. Что, как отмечалось и в предыдущем пункте, чревато ошибочными выводами о качестве получаемых моделей.

Это утверждение иллюстрируется рисунком 8.4 (n =1).

На этом рисунке:

a — линия истинной регрессии. Если в первый момент времени истинная ошибка отрицательна, то в силу положительной автокорреляции ошибок все облако наблюдений сместится вниз, и линия оцененной регрессии займет положение b.

Если в первый момент времени истинная ошибка положительна, то по тем же причинам линия оцененной регрессии сместится вверх и займет положение c. Поскольку В теории временных рядов это называется слабой стационарностью.

x c a b время Рис. 8.266 Глава 8. Нарушение гипотез основной линейной модели ошибки случайны и в первый момент времени они примерно с равной вероятностью могут оказаться положительными или отрицательными, то становится ясно, насколько увеличивается разброс оценок регрессии вокруг истинных по сравнению с ситуацией без (положительной) автокорреляции ошибок.

Типичный случай автокорреляции ошибок, рассматриваемый в классической эконометрии, — это линейная авторегрессия ошибок первого порядка AR(1):

i = i-1 + i, где — остатки, удовлетворяющие обычным гипотезам;

— коэффициент авторегрессии первого порядка.

Коэффициент вляется также коэффициентом автокорреляции (первого порядка).

Действительно, по определению, коэффициент авторегрессии равен (как МНКоценка):

cov(i, i-1) =, var(i-1) но, в силу гомоскедастичности, var(i-1) = var(i)var(i-1) и, следовательно,, также по определению, является коэффициентом автокорреляции.

Если = 0, то i = i и получаем «штатную» ситуацию. Таким образом, проверку того, что автокорреляция отсутствует, можно проводить как проверку нулевой гипотезы H0: =0 для процесса авторегрессии 1-го порядка в ошибках.

Для проверки этой гипотезы можно использовать критерий Дарбина— Уотсона или DW-критерий. Проверяется нулевая гипотеза о том, что автокорреляция ошибок первого порядка отсутствует. (При автокорреляции второго и более высоких порядков его мощность может быть мала, и применение данного критерия становится ненадежным.) Пусть была оценена модель регрессии и найдены остатки ei, i = 1,..., N.

Значение статистики Дарбина—Уотсона (отношения фон Неймана), или DW-статистики, рассчитывается следующим образом:

N (ei - ei-1)i=dc =. (8.3) N ei i=Оно лежит в интервале от 0 до 4, в случае отсутствия автокорреляции ошибок приблизительно равно 2, при положительной автокорреляции смещается в мень8.3. Автокорреляция ошибок 2 dL dU 4 dU 4 dL Рис. 8.шую сторону, при отрицательной — в большую сторону. Эти факты подтверждаются тем, что при больших N справедливо следующее соотношение:

dc 2(1 - r), (8.4) где r — оценка коэффициента авторегрессии.

Минимального значения величина dc достигает, если коэффициент авторегрессии равен +1. В этом случае ei = e, i = 1,..., N, и dc = 0. Если коэффициент авторегрессии равен -1 и ei = (-1)ie, i = 1,..., N, то величина dc достигает N - значения 4 (можно достичь и более высокого значения подбором остатков), N которое с ростом N стремится к 4. Формула (8.4) следует непосредственно из (8.3) после элементарных преобразований:

N N N e2 ei-1ei ei i-i=2 i=2 i=dc = - 2 +, N N N e2 e2 ei i i i=1 i=1 i=поскольку первое и третье слагаемые при больших N близки к единице, а второе слагаемое является оценкой коэффициента автокорреляции (умноженной на -2).

Известно распределение величины d, если =0 (это распределение близко к нормальному), но параметры этого распределения зависят не только от N и n, как для t-и F -статистик при нулевых гипотезах. Положение «колокола» функции плотности распределения этой величины зависит от характера Z. Тем не менее, Дарбин и Уотсон показали, что это положение имеет две крайние позиции (рис. 8.5).

Поэтому существует по два значения для каждого (двустороннего) квантиля, соответствующего определенным N и n: егонижняя dL и верхняя dU границы.

Нулевая гипотеза H0: =0 принимается, если dU dc 4- dU ; она отвергается в пользу гипотезы о положительной автокорреляции, если dc < dL, и в пользу 268 Глава 8. Нарушение гипотез основной линейной модели гипотезы об отрицательной автокорреляции, если dc > 4- dL. Если dL dc

Пусть нулевая гипотеза отвергнута. Тогда необходимо дать оценку матрицы.

Оценка r параметра авторегрессии может определяться из приближенного равенства, следующего из (8.4):

dc r 1 -, или рассчитываться непосредственно из регрессии e на него самого со сдвигом на одно наблюдение с принятием «круговой» гипотезы, которая заключается в том, что eN+1 = e1.

Оценкой матрицы является 1 r r2 · · · rN- r 1 r · · · rN-, 1 - r2 r2 r 1 · · · rN-....

.

.....

.

....

rN-1 rN-2 rN-3 · · · а матрица D преобразований в пространстве наблюдений равна - r2 0 0 · · · -r 1 0 · · · 0 -r 1 · · · 0.

....

.

.....

.

....

0 0 0 · · · Для преобразования в пространстве наблюдений, называемом в данном случае авторегрессионным, используют обычно указанную матрицу без 1-й строки, что ведет к сокращению количества наблюдений на одно. В результате такого преобразования из каждого наблюдения, начиная со 2-го, вычитается предыдущее, умноженное на r, теоретическими остатками становятся, которые, по предположению, удовлетворяют гипотезе g4.

8.3. Автокорреляция ошибок После этого преобразования снова оцениваются параметры регрессии. Если новое значение DW-статистики неудовлетворительно, то можно провести следующее авторегрессионное преобразование.

Обобщает процедуру последовательных авторегрессионных преобразований метод Кочрена—Оркатта, который заключается в следующем.

Для одновременной оценки r, a и b используется критерий ОМНК (в обозначениях исходной формы уравнения регрессии):

Pages:     | 1 |   ...   | 30 | 31 || 33 | 34 |   ...   | 82 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.