WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 10 |

«Оглавление Введение................................... 11 I Введение в социально-экономическую статистику 15 1. Основные понятия 17 1.1. Краткая историческая справка.. ...»

-- [ Страница 4 ] --

s1 s Система нормальных уравнений для f-1 имеет следующий вид:

1 Y Y1 = Y Y-1f-1, -1 - N N 6.4. Многообразие оценок регрессии или, учитывая зависимость Y от X из (6.36), S-1m-1 = S-1M-1S-1 f-1.

-1 - s1 - ------ ----- R- r- Что и требовалось доказать.

Преобразование в пространстве переменных в ортогональной регрессии при использовании любой квадратной и невырожденной матрицы C = In приводит к получению новых оценок параметров.

В пункте 4.2 при n =2 этот факт графически иллюстрировался в случае, когда 1 C =.

0 k В общем случае верно утверждение, состоящее в том, что в результате пре образования и «возвращения» в исходное пространство для получения оценок a надо решить следующую задачу:

(M - ) a =0, a a =1, (6.37) где =C -1C-1.

Действительно:

После преобразования в пространстве переменных задача ортогональной регрессии записывается следующим образом (6.24, 6.25):

(MY - In) f =0, f f =1, (6.38) где, учитывая (6.33), MY = C MC, f = C-1a.

Выражение (6.37) получается в результате элементарных преобразований (6.38).

Понятно, что решение задачи (6.37) будет давать новую оценку параметрам a при любой квадратной и невырожденной матрице C = In. Такую регрессию иногда называют регрессией в метрике -1.

216 Глава 6. Алгебра линейной регрессии 6.5. Упражнения и задачи Упражнение По наблюдениям из таблицы 6.1:

Таблица 6. 1.1. Вычислите 1 M-1 = X X-1, m-1 = X X -1 - X1 X-1 N N и для регрессии X1 = X-1a-1+1N b1+e1 найдите X2 X оценки a-1 и b1.

0.58 1.00 1. c 1.2. Рассчитайте вектор X1 = X-1a-1 +1N b1 и век 1.10 2.00 4.00 c тор e1 = X1 - X1. Убедитесь, что 1 e1 = 0 и N 1.20 3.00 9. cov(X-1, e) = X e1 =0.

- N 1.30 4.00 16. 1.3. Вычислите объясненную дисперсию различными 1.95 5.00 25. способами:

2.55 6.00 36.00 c cX1;

s2 = X q N 2.60 7.00 49. s2 = a m-1;

q1 - 2.90 8.00 64. s2 = m M-1m-1.

q1 -1 - 3.45 9.00 81. 1.4. Вычислите остаточную дисперсию различными 3.50 10.00 100. способами:

3.60 11.00 121. s2 = e e1;

e1 4.10 12.00 144. N 4.35 13.00 169. s2 = s2 - s2 = X1X1 - s2.

e1 1 q1 q N 4.40 14.00 196. 1.5. Вычислите коэффициент детерминации различны 4.50 15.00 225. ми способами:

s q R1 = ;

s cov(x1, xc) 2 R1 =.

s1sq 1.6. Оцените параметры и коэффициент детерминации для ортогональной ре грессии x = +.

6.5. Упражнения и задачи – сравните эти оценки с оценками линии регрессии, полученными в 1.1;

– рассчитайте расчетные значения переменных.

1.7. Оцените матрицу оценок и значений главных компонент ( AQ и Q), а также расчетное значение переменных.

1.8. Пусть единицы измерения x1 увеличились в 100 раз. Как в этом случае долж на выглядеть матрица преобразования D? Как изменятся оценки уравнения прямой и ортогональной регрессий?

Задачи 1. Может ли матрица 9.2 -3.8 -2 5.2 -3.8 - а) б) -3.8 2 0.6 -3.8 2 0. -2 0.5 2 -2 0.6 являться ковариационной матрицей переменных, для которых строится урав нение регрессии? Ответ обосновать.

1 2. Для x = (x1, x2) = найдите оценки ковариаций переменных x, 2 6 оценки параметров уравнения прямой (x1 = a12x2 +1N b1 + e1) и обратной регрессии (x2 = a21x1 +1N b2 + e2). Покажите, что a12 =. Рассчитайте a вектор-столбец остатков по прямой и обратной регрессии. Убедитесь, что сумма остатков равна нулю, вектора остатков и x2 ортогональны при пря мой регрессии, вектора остатков и x1 ортогональны при обратной регрес сии. Найдите объясненную и остаточную дисперсии различными способами, а также коэффициент детерминации.

3. Предположим, что мы, используя модель регрессии x1 = x-1a-1 +1N b1 + + e1, из условия минимизации e e1 получили следующую систему линейных b1 +2a12 + a13 =3, уравнений:

2b1 +5a12 + a13 =9, b1 + a12 +6a13 = -8.

218 Глава 6. Алгебра линейной регрессии Запишите условия задачи в матрично-векторной форме, решите ее, используя метод, указанный в приложении для обратных матриц, и найдите оценки параметров регрессии.

4. Оцените регрессию x1 = a12x2 + a13x3 +1N b1 + e1 и рассчитайте:

– оценку остаточной дисперсии, – объясненную дисперсию, – коэффициент детерминации, если a) матрица наблюдений имеет вид:

5 1 1 2 X =(X1, X2, X3) =, -2 3 0 4 -4 5 б) X1X1 = 96, X2X2 = 55, X3X3 = 129, X1X2 = 72, X1X3 = 107, X2X3 = 81, X11N = 20, X21N = 15, X31N = 25, N =5.

5. Дисперсии двух переменных совпадают, корреляция отсутствует. Изобра зить на графике — в пространстве переменных — линии прямой, обратной и ортогональной регрессий. Ответ обосновать.

6. Дисперсии выпуска продукции и количества занятых по предприятиям равны, соответственно, 10 и 20, их ковариация равна 12. Чему равен коэффициент детерминации в регрессии выпуска по занятым, коэффициент зависимости выпуска от занятых по прямой, обратной и ортогональной регрессии?

7. Дисперсии временных рядов индекса денежной массы и сводного индекса цен равны, соответственно, 150 и 200, их ковариация равна 100. Чему равен параметр влияния денежной массы на цены по модели прямой регрессии и доля объясненной дисперсии в дисперсии индекса цен?

14 3 8. По заданной матрице ковариации двух переменных найти оста 5 3 точную дисперсию уравнения регрессии первой переменной по второй.

6.5. Упражнения и задачи 9. В регрессии x1 = a12x2 +1Nb1 + e1, гд е x =(5, 3, 7, 1) коэффициент детерминации оказался равным 50%. Найдите сумму квадратов остатков.

10. Оцените модель x1 = a12x2 +1N b1 + e1, используя следующие данные:

3 1 (x1, x2) =.

8 3 5 5 Вычислите остатки (ei) и покажите, что ei =0, x2iei =0.

i=1 i= 11. Две парные регрессии построены на одних и тех же данных: x1 = a12x2 + +1N b1 + e1 и x2 = a21x1 +1N b2 + e2. R1 — коэффициент детерминации в 2 2 первой регрессии, R2 — во второй. Запишите соотношение между R1 и R2.

Ответ обосновать.

12. Возможна ли ситуация, когда угловые коэффициенты в уравнениях прямой и обратной регрессии построены на одних и тех же данных, соответственно равны 0.5 и 3.0. Почему?

13. Что геометрически означает R2 =0 и R2 =1?

14. Регрессия x1 = 12x2 + 1 + 1 оценивается по двум наблюдениям. Чему равен коэффициент детерминации?

1 15. Для x =(x1, x2) = оцените параметры ортогональной регрессии 2 6 и коэффициент детерминации. Покажите, что линия ортогональной регрес сии находится между линиями прямой и обратной регрессии.

16. Какая из двух оценок коэффициента зависимости выпуска продукции от ко личества занятых в производстве больше: по прямой или по ортогональной регрессии? Ответ обосновать.

17. Какая из двух оценок коэффициента зависимости спроса от цены больше:

по прямой или по ортогональной регрессии? Ответ обосновать.

220 Глава 6. Алгебра линейной регрессии 18. Какой вид имеет уравнение ортогональной регрессии для переменных x и x2 с одинаковыми значениями дисперсий и средних, а также имеющих положительную корреляцию равную ?

19. Покажите, что решение задачи m11 m12 1 0 - =0, min!

m12 m22 0 0 -a эквивалентно решению задачи прямой регрессии x1 = a12x2 +1N b1 + e1.

20. Пусть x1 и x2 — центрированные переменные. Уравнение ортогональной регрессии, поcтроенные по множеству наблюдений над величинами x1 и x2, есть x1 - x2 =0. Запишите вектор первой главной компоненты.

21. Оценка парной регрессии ведется в стандартизированной шкале. Как связан коэффициент детерминации и коэффициент регрессии (угловой)?

22. Была оценена регрессия x1 = 12x2 + 1 + 1, гд е x1 измеряется в рублях, а x2 — в килограммах. Затем ту же регрессию оценили, изменив единицы измерения на тысячи рублей и тонны. Как при этом поменялись следующие величины: а) оценка коэффициента 12;

б) коэффициент детерминации? Как в этом случае должна выглядеть матрица преобразования D?

23. Пусть в ортогональной регрессии, построенной для переменных x1 и x2, из-за деноминации рубля единица измерения x2 изменилась в 1000 раз. Как в этом случае должна выглядеть матрица преобразования D?Изменятсяли оценки? Ответ обосновать.

24. Пусть в наблюдениях задачи 2 единица измерения x1 увеличилась в 10 раз.

Как в этом случае должна выглядеть матрица преобразования D? Как изме нятся оценки уравнения прямой и обратной регрессии?

9 25. В регрессии в метрике 1 матрица равна. Как преобразовать 0 исходные переменные, чтобы свести эту регрессию к ортогональной?

Рекомендуемая литература 1. Айвазян С.А. Основы эконометрики. Т.2. — М.: «Юнити», 2001. (Гл. 2).

6.5. Упражнения и задачи 2. Болч Б., Хуань К.Дж. Многомерные статистические методы для экономи ки. — М.: «Статистика», 1979. (Гл. 7).

3. Джонстон Дж. Эконометрические методы. — М.: «Статистика», 1980.

(Гл. 2, 11).

4. Дрейпер Н., Смит Г. Прикладной регрессионный анализ: В 2-х кн. Кн.1. — М.: «Финансы и статистика», 1986. (Гл. 1, 2).

5. Езекиэл М., Фокс К. Методы анализа корреляций и регрессий. — М.: «Ста тистика», 1966. (Гл. 5, 7).

6. Кейн Э. Экономическая статистика и эконометрия. Вып. 2. — М.: «Стати стика», 1977. (Гл. 10, 11).

7. Лизер С. Эконометрические методы и задачи. — М.: «Статистика», 1971.

(Гл. 2).

8. (*) Маленво Э. Статистические методы эконометрии. Вып. 1. — М.: «Ста тистика», 1975. (Гл. 1).

9. Judge G.G., Hill R.C., Griffiths W.E., Luthepohl H., Lee T. Introduction to the Theory and Practice of Econometric. John Wiley & Sons, Inc., 1993. (Ch. 5).

10. William E., Griffiths R., Carter H., George G. Judge Learning and Practicing econometrics, N 9 John Wiley & Sons, Inc., 1993. (Ch. 3).

Глава Основная модель линейной регрессии 7.1. Различные формы уравнения регрессии Основная модель линейной регрессии относится к классу простых регрессий, в левой части уравнения которых находится одна переменная: объясняемая, моде лируемая, эндогенная, а в правой — несколько переменных: объясняющих, фак торных, независимых, экзогенных. Объясняющие переменные называют также факторами, регрессорами.

Для объясняемой переменной сохраняется прежнее обозначение — x. Авек тор-строка размерности n объясняющих переменных будет теперь обозначаться через z, поскольку свойства этих переменных в основной модели регрессии суще ственно отличаются от свойств объясняемой переменной. Через X и Z обозна чаются, соответственно, вектор-столбец размерности N наблюдений за объясня емой переменной и матрица размерности N n наблюдений за объясняющими переменными. Обозначения параметров регрессии и остатков по наблюдениям со храняются прежними (отличие в том, что теперь вектор-столбцы и a имеют размерность n).

Уравнения регрессии в исходной форме имеют следующий вид:

X = Z +1N +, (7.1) 7.1. Различные формы уравнения регрессии или в оценках X = Za +1Nb + e. (7.2) В сокращенной форме:

X = +, (7.3) или X = a + e. (7.4) Оператор МНК-оценивания ((6.11, 6.13) в п. 6.2) принимает теперь вид:

a = M-1m, b = - za, (7.5) x где M = Z Z — ковариационная матрица переменных z между собой, N m = Z X — вектор ковариаций переменных z с переменной x. Первую часть N оператора (7.5) часто записывают в форме:

- a = Z Z Z X. (7.6) МНК-оценки e обладают следующими свойствами ((6.6, 6.12) в предыдущей главе):

1 = 1 e =0, cov (Z, e) = Z e =0. (7.7) N N N Коэффициент детерминации рассчитывается следующим образом (см. (6.20)):

s s q e R2 = =1 -, (7.8) s2 s x x где s2 — дисперсия объясняемой переменной, s2 — остаточная дисперсия, x e (6.2.6) s2 = a Ma = a m = m a = m M-1m (7.9) q — объясненная дисперсия.

Уравнение регрессии часто записывают в форме со скрытым свободным членом:

X = Z +, (7.10) X = Za + e, (7.11) 224 Глава 7. Основная модель линейной регрессии a где Z =[Z 1N ], =, a =.

b При таком представлении уравнения регрессии оператор МНК-оценивания записывается следующим, более компактным, чем (7.5), образом:

a = M-1m, (7.12) 1 где M = Z Z, m = Z X, или N N - a = Z Z Z X. (7.13) M и m также, как M и m, являются матрицей и вектором вторых моментов, но не центральных, а начальных. Кроме того, их размерность на единицу больше.

Оператор (7.12) дает, естественно, такой же результат, что и оператор (7.5).

Этот факт доказывался в п. 4.2 для случая одной переменной в правой части урав нения.

В общем случае этот факт доказывается следующим образом.

Учитывая, что X = X +1Nx, (7.14) Z = (7.15) Z +1N z 1N, можно установить, что M + z z z M =, (7.16) z m + x z m =, x и записать систему нормальных уравнений, решением которой является (7.12) в сле дующей форме:

M + z z a m + x z z =.

z 1 b x 7.1. Различные формы уравнения регрессии Вторая (нижняя) часть этой матричной системы уравнений эквивалентна второй части оператора (7.5). После подстановки b, выраженного через a, впервую(верх нюю) часть данной матричной системы уравнений она приобретает следующий вид:

Ma + za + x - z za = m + x, z z z и после приведения подобных становится очевидной ее эквивалентность первой ча сти оператора (7.5).

Что и требовалось доказать.

Кроме того, можно доказать, что M-1 -M-1z M-1 =. (7.17) - 1+ zM-1 zM-1z Этот факт потребуется ниже. (Правило обращения блочных матриц см. в Прило жении A.1.2.) Справедливость этого утверждения проверяется умножением M-1 из (7.17) на M из (7.16). В результате получается единичная матрица.

МНК-оценки вектора e ортогональны столбцам матрицы Z:

Z e =0. (7.18) Доказательство наличия этого свойства получается как побочный результат при вы воде оператора оценивания (7.12) путем приравнивания нулю производных оста точной дисперсии по параметрам регрессии, как это делалось в п. 6.2.

Поскольку последним столбцом матрицы Z является 1N, из (7.18) следует, что 1 e =0, (7.19) N т.е. =0. Из остальной части (7.18):

Z e =0, (7.20) что в данном случае означает, что cov(Z, e) =0.

Действительно, раскрывая (7.20):

(7.15) Z e = Z e + 1 e = Z e =0.

z N - = 226 Глава 7. Основная модель линейной регрессии Таким образом, (7.18) эквивалентно (7.7).

Однако уравнения (7.10) допускают и иную интерпретацию. Если последним в Z является не 1N, а столбец «обычной» переменной, то это — регрессия без свободного члена. В таком случае из (7.18) не следует (7.19), и свойства (7.7) не вы полняются. Кроме того, для такой регрессии, очевидно, не возможна сокращенная запись уравнения. Этот случай в дальнейшем не рассматривается.

В дальнейшем будет применяться в основном форма записи уравнения со скры тым свободным членом, но чтобы не загромождать изложение материала, символ «» будет опускаться, т.е. соотношения (7.10, 7.11, 7.12, 7.13, 7.18) будут исполь зоваться в форме X = Z +, (7.21) X = Za + e, (7.22) a = M-1m, (7.23) - a = Z Z Z X, (7.24) Z e =0. (7.25) Случаи, когда a, Z, m, M означают не a, Z, m, M, а собственно a, Z, m, M, будут оговариваться специально.

7.2. Основные гипотезы, свойства оценок Применение основной модели линейной регрессии корректно, если выполня ются следующие гипотезы:

g1. Между переменными x и z существует линейная зависимость, и (7.10) является истинной моделью, т.е., в частности, правильно определен набор факторов z — модель верно специфицирована.

g2. Переменные z детерминированы, наблюдаются без ошибок и линейно независимы.

g3. E() =0.

g4. E ( ) =2IN.

Гипотеза g2 является слишком жесткой и в экономике чаще всего нарушается.

Возможности ослабления этого требования рассматриваются в следующей главе.

Здесь можно заметить следующее: в тех разделах математической статистики, в ко торых рассматривается более общий случай, и z также случайны, предполагается, что не зависит от этих переменных-регрессоров.

7.2. Основные гипотезы, свойства оценок В этих предположениях a относится к классу линейных оценок, поскольку a = LX, (7.26) (7.13) где L = (Z Z)-1 Z — детерминированная матрица размерности (n +1) N, и доказывается ряд утверждений о свойствах этих МНК-оценок.

1) a — несмещенная оценка.

Действительно:

(7.26), g1 LZ=In+ a = L (Z + ) =LZ + L = + L (7.27) и g E (a) =.

2) Ее матрица ковариации Ma удовлетворяет следующему соотношению:

Ma = 2M-1, (7.28) N в частности, 2 2 aj = m-1, j =1,..., n+1 (an+1 b ), jj N где m-1 — j-й диагональный элемент матрицы M-1.

jj Действительно:

(7.27) g Ma = E ((a - )(a - ) ) = E (L L ) = 2LL = 2 (Z Z)-1= 2M-1.

N 2 Этот результат при n =1 означает, что a =, иегоможнополучить, исполь N s z зуя формулу (5.17) распространения ошибок первичных измерений.

zi - z Действительно, a = di (xi - x), гд е di =. Тогд а (zi - z) N a = - dl +di = di xi N l= ---- = и в соответствии с указанной формулой:

(zi - z)2 2 2 a = 2 d2 = 2 =.

2 = i (zi - z)2 N s z (zi - z) 228 Глава 7. Основная модель линейной регрессии Здесь важно отметить следующее.

Данная формула верна и в случае использования исходной или сокращенной за писи уравнения регрессии, когда M — матрица ковариации регрессоров. Это сле дует из (7.17). Но в такой ситуации она (эта формула) определяет матрицу ковариа ции только оценок коэффициентов регрессии при объясняющих переменных, а дис персию оценки свободного члена можно определить по формуле 1+ M-1z, z N как это следует также из (7.17).

Следует также обратить внимание на то, что несмещенность оценок при учете только что полученной зависимости их дисперсий от N свидетельствует о состоя тельности этих оценок.

Иногда формулу (7.28) используют в другой форме:

- Ma = 2 Z Z. (7.29) 3) Несмещенной оценкой остаточной дисперсии 2 является N 2 = s2 = e e. (7.30) e e N - n - 1 N - n - Для доказательства этого факта сначала устанавливается зависимость МНК-оценок ошибок от их истинных значений, аналогично (5.10):

g1, (7.27) e = X - Za = Z + - Z ( + L) =(IN - ZL) = B, (7.31) и устанавливаются свойства матрицы B (аналогично тому, как это делалось в п. 5.1) B = IN - ZL = IN - Z (Z Z)-1 Z = IN - ZM-1Z. (7.32) N Эта матрица:

а) вещественна и симметрична: B = B, б) вырождена и имеет ранг N - n - 1, т.к. при любом =0 выполняется BZ = (7.32) (поскольку BZ = 0), а в множестве Z в соответствии с g2 имеется точно n + линейно независимых векторов, в) идемпотентна: B2 = B, г) положительно полуопределена в силу симметричности и идемпотентности:

B = B2 = B B 0.

Теперь исследуется зависимость остаточной дисперсии от 2:

1 (7.31) 1 s2 = e e = B B = B, e N N N 1 g E s2 = E ( B) = tr (B), (7.33) e N N - bii 7.2. Основные гипотезы, свойства оценок где tr(·)— операция следа матрицы, результатом которой является сумма ее диаго нальных элементов.

Далее, в силу коммутативности операции следа матрицы tr (B) =tr (IN ) - tr (ZL) =N - tr (LZ) = N - n - 1.

In+ (См. Приложение A.1.2.) N - n - 1 Таким образом, E s2 = 2, и E e e = 2.

e N N - n - Что и требовалось доказать.

Тогда оценкой матрицы ковариации Ma является (в разных вариантах расчета) - 2 e e e e e M-1 = M-1 = Z Z, (7.34) N N (N - n - 1) N - n - и, соответственно, несмещенными оценками дисперсий (квадратов ошибок) оценок параметров регрессии:

e e 2 = m-1, j =1,..., n+1 (s2 s2). (7.35) aj jj an+1 b N (N - n - 1) 4) Дисперсии a являются наименьшими в классе линейных несмещенных оце нок, т.е. оценки a относятся к классу BLUE (см. п. 5.1). Это утверждение называ ется теоремой Гаусса—Маркова.

Доказательство этого факта будет проведено для оценки величины c, гд е c — любой детерминированный вектор-столбец размерности n +1. Если в качестве c выбирать орты, данный факт будет относиться к отдельным параметрам регрессии.

(7.26) МНК-оценка этой величины есть c a = c LX, она линейна, не смещена, т.к. E (c a) =c, и ее дисперсия определяется следующим образом:

(7.28) var (c a) = c M-1c. (7.36) N Пусть d X — любая линейная оценка c,где d — некоторый детерминированный вектор-столбец размерности N.

g1 g E (d X) = E (d Z + d ) = d Z, (7.37) ид лятого, чтобыэтаоценкабыланесмещенной, т.е. чтобы d Z = c, необход имо d Z = c. (7.38) 230 Глава 7. Основная модель линейной регрессии Из (7.37) следует, что d X = E (d X) +d, итогд а g var (d X) =E((d X - E(d X) ) =E (d d) = 2d d. (7.39) --------) d И, наконец, в силу положительной полуопределенности матрицы B (из (7.32)):

(7.36,7.40) 2 (7.38) var (d X) - var (c a) = 2d d - c M-1c = N 1 (7.32) = 2d IN - ZM-1Z d = 2d Bd 0, N т.е. дисперсия МНК-оценки меньше либо равна дисперсии любой другой оценки в классе линейных несмещенных.

Что и требовалось доказать.

Теперь вводится еще одна гипотеза:

g5. Ошибки имеют многомерное нормальное распределение:

N 0, 2IN.

(Поскольку по предположению g4 они некоррелированы, то по свойству мно гомерного нормального распределения они независимы).

Тогда оценки a будут также иметь нормальное распределение:

a N (, Ma), (7.40) в частности, aj N j, aj, j =1,..., n+1 (an+1 b, n+1 ), они совпадут с оценками максимального правдоподобия, что гарантирует их со стоятельность и эффективность (а не только эффективность в классе линейных несмещенных оценок).

Применение метода максимального правдоподобия в линейной регрессии рас сматривается в IV-й части книги. Здесь внимание сосредоточивается на других важных следствиях нормальности ошибок.

Поскольку aj - j N (0, 1), (7.41) aj для j можно построить (1 - )100-процентный доверительный интервал:

j aj ± aj 1-. (7.42) 7.2. Основные гипотезы, свойства оценок Чтобы воспользоваться этой формулой, необходимо знать истинное значение остаточной дисперсии 2, но известна только ее оценка. Для получения соответ ствующей формулы в операциональной форме, как и в п. 5.1, проводятся следую щие действия.

Сначала доказывается, что e e 2. (7.43) 2 N-n- Это доказательство проводится так же, как и в пункте 5.1 для (5.9). Только теперь матрица B, связывающая в (7.31) оценки ошибок с их истинными значениями, имеет ранг N - n - 1 (см. свойства матрицы B, следующие из (7.32)), а не N - 1, как аналогичная матрица в (5.10).

Затем обращается внимание на то, что e и a не коррелированы, а значит, не коррелированы случайные величины в (7.41, 7.43).

Действительно (как и в 5.1):

(7.27) a - = L и (7.31) g cov (a, e) =E ((a - )e ) = E (L B) = 2 (Z Z)-1 Z B =0.

= Что и требовалось доказать.

Поэтому по определению случайной величины, имеющей t-распределение:

(aj - j) N e e (7.35) aj - j / (N - n - 1) = tN-n-1. (7.44) 2 aj m- jj Таким образом, для получения операциональной формы доверительного интер вала в (7.42) необходимо заменить aj на aj и 1- на tN-n-1,1-:

j aj ± aj tN-n-1,1-. (7.45) Полезно заметить, что данный в этом пункте материал обобщает результаты, полученные в п. 5.1. Так, многие приведенные здесь формулы при n = 0 пре образуются в соответствующие формулы п. 5.1. Полученные результаты можно использовать также и для проверки гипотезы о том, что j =0 (нулевая гипотеза).

232 Глава 7. Основная модель линейной регрессии Рассчитывается t-статистика aj tc =, (7.46) j aj которая в рамках нулевой гипотезы, как это следует из (7.44), имеет t-распреде ление.

Проверка нулевой гипотезы осуществляется по схеме, неоднократно применя емой в I части книги. В частности, если уровень значимости t-статистики sl (напо минание: sl таково, что tc = tN-n-1,sl)непревышает (обычно 0.05), то нулевая j гипотеза отвергается с ошибкой (1-го рода) и принимается, что j =0. Впро тивном случае, если нулевую гипотезу не удалось отвергнуть, считается, что j-й фактор не значим, и его не следует вводить в модель.

Операции построения доверительного интервала и проверки нулевой гипоте зы в данном случае в определенном смысле эквивалентны. Так, если построенный доверительный интервал содержит нуль, то нулевая гипотеза не отвергается, и на оборот.

Гипотеза о нормальности ошибок позволяет проверить еще один тип нулевой гипотезы: j =0, j =1,..., n, т.е. гипотезы о том, что модель некорректна и все факторы введены в нее ошибочно.

При построении критерия проверки данной гипотезы уравнение регрессии ис пользуется в сокращенной форме, и условие (7.40) записывается в следующей форме:

a N, M-1, (7.47) N где a и — вектора коэффициентов при факторных переменных размерности n, M — матрица ковариации факторных переменных. Тогда N a - M (a - ) 2. (7.48) n Действительно:

Матрица M-1 вследза M является вещественной, симметричной и положительно полуопределенной, поэтому ее всегда можно представить в виде:

M-1 = CC, (7.49) где C — квадратная неособенная матрица.

Чтобы убедиться в этом, достаточно вспомнить (6.29) и записать аналогичные со отношения: M-1Y = Y, Y Y = YY = In, 0, гд е Y — матрица, столбцы 7.2. Основные гипотезы, свойства оценок которой есть собственные вектора M-1, — диагональная матрица соответству ющих собственных чисел. Тогда M-1 = Y Y = Y 0.5 0.5Y -- -- C C (см. Приложение A.1.2).

N Вектор случайных величин u = C-1(a-) обладает следующими свойствами:

по построению E(u) =0, и в силу того, что (7.47) E ((a - )(a - ) ) = M-1, N N (7.49) cov(u) =E (uu ) = C-1E ((a - )(a - ) ) C -1 = C-1M-1C -1 = In.

Следовательно, по определению 2 случайная величина N u u = (a - ) C -1C-1 (a - ) 2 ---- M имеет указанное распределение (см. Приложение A.3.2).

Как было показано выше, e и a не коррелированы, поэтому не коррелированы случайные величины, определенные в (7.43, 7.48), и в соответствии с определением случайной величины, имеющей F -распределение:

N e e a - M (a - )(N - n - 1) n Fn, N-n-1.

2 Отсюда следует, что при нулевой гипотезе = s2 (N a Ma (N - n - 1) (7.9) - n - 1) q = Fn, N-n-1, (e e) n s2n e N или R2 (N - n - 1) c = F Fn, N-n-1. (7.50) (1 - R2) n Сама проверка нулевой гипотезы проводится по обычной схеме. Так, если зна c чение вероятности pv статистики F (величина, аналогичная sl для t-статистики) не превышает (например, 0.05), нулевая гипотеза отвергается с вероятностью ошибки, и модель считается корректной. В противном случае нулевая гипотеза не отвергается, и модель следует пересмотреть.

234 Глава 7. Основная модель линейной регрессии 7.3. Независимые факторы: спецификация модели В этом пункте используется модель линейной регрессии в сокращенной фор ме, поэтому переменные берутся в центрированной форме, а m и M — вектор и матрица соответствующих коэффициентов ковариации переменных.

Под спецификацией модели в данном случае понимается процесс и результат определения набора независимых факторов. При построении эконометрической модели этот набор должен обосновываться экономической теорией. Но это удается не во всех случаях. Во-первых, не все факторы, важные с теоретической точки зрения, удается количественно выразить. Во-вторых, эмпирический анализ часто предшествует попыткам построения теоретической модели, и этот набор просто неизвестен. Потому важную роль играют и методы формального отбора факторов, также рассматриваемые в этом пункте.

В соответствии с гипотезой g2 факторные переменные не должны быть ли нейно зависимыми. Иначе матрица M в операторе МНК-оценивания будет необ ратима. Тогда оценки МНК по формуле a = M-1m невозможно будет рассчитать, но их можно найти, решая систему нормальных уравнений (6.14):

Ma = m.

Решений такой системы нормальных уравнений (в случае необратимости матри цы M) будет бесконечно много. Следовательно, оценки нельзя найти однозначно, т.е. уравнение регрессии невозможно идентифицировать. Действительно, пусть оценено уравнение x = 1a1 + e, (7.51) где 1 — вектор-строка факторных переменных размерности n1, a1 — вектор столбец соответствующих коэффициентов регрессии, и пусть в это уравнение вво дится дополнительный фактор 2, линейно зависимый от 1, т.е. 2 = 1c21.

Тогда оценка нового уравнения x = 1a + 2a2 + e (7.52) («звездочкой» помечены новые оценки «старых» величин) эквивалентна оценке уравнения x = 1 (a + a2c21) +e. Очевидно, что a1 = a + a2c21, e = e, и, про 1 извольно задавая a2, можно получать множество новых оценок a = a1 - a2c21.

Логичнее всего положить a2 =0, т.е. не вводить фактор 2. Хотя, если из со держательных соображений этот фактор следует все-таки ввести, то тогда надо исключить из уравнения какой-либо ранее введенный фактор, входящий в 1. Та ким образом, вводить в модель факторы, линейно зависимые от уже введенных, бессмысленно.

7.3. Независимые факторы: спецификация модели Случаи, когда на факторных переменных су A ществуют точные линейные зависимости, встре чаются редко. Гораздо более распространена си туация, в которой зависимости между фактор ными переменными приближаются к линейным.

O Такая ситуация называется мультиколлинеарно стью. Она чревата высокими ошибками получа емых оценок и высокой чувствительностью ре зультатов оценивания к ошибкам в факторных C переменных, которые, несмотря на гипотезу g2, обычно присутствуют в эмпирическом анализе. B Действительно, в такой ситуации матрица M Рис. 7. плохо обусловлена и диагональные элементы M-1, определяющие дисперсии оценок, могут принимать очень большие значения.

Кроме того, даже небольшие изменения в M, связанные с ошибками в факторных переменных, могут повлечь существенные изменения в M-1 и, как следствие, — воценках a.

Последнее наглядно иллюстрируется рисунком (рис. 7.1) в пространстве наблюдений при n =2.

На этом рисунке: OA — x, OB — 1, OC — 2.

Видно, что факторные переменные сильно коррелированы (угол между соответству ющими векторами мал).

Поэтому даже небольшие колебания этих векторов, связанные с ошибками, зна чительно меняют положение плоскости, которую они определяют, и, соответствен но, — нормали на эту плоскость.

Из рисунка видно, что оценки параметров регрессии «с легкостью» меняют не только свою величину, но и знак.

По этим причинам стараются избегать ситуации мультиколлинеарности.

Для этого в уравнение регрессии не включают факторы, сильно коррелирован ные с другими.

Можно попытаться определить такие факторы, анализируя матрицу коэффи циентов корреляции факторных переменных S-1MS-1, гд е S — диагональная матрица среднеквадратических отклонений. Если коэффициент sjj этой матри цы достаточно большой, например, выше 0.75, то один из пары факторов j и j не следует вводить в уравнение. Однако такого элементарного «парного» анализа может оказаться не достаточно. Надежнее построить все регрессии на множестве факторных переменных, последовательно оставляя в левой части уравнения эти переменные по отдельности. И не вводить в уравнение специфицируемой моде ли (с x в левой части) те факторы, уравнения регрессии для которых достаточно значимы по F -критерию (например, значение pv не превышает 0.05).

236 Глава 7. Основная модель линейной регрессии Однако в эмпирических исследованиях могут A возникать ситуации, когда только введение сильно D коррелированных факторов может привести к по строению значимой модели.

O Это утверждение можно проиллюстрировать ри сунком (рис. 7.2) в пространстве наблюдений при n =2.

На этом рисунке: OA — x, OB — 1, OC — 2, AD — нормаль на плоскость, определяе C мую векторами OB и OC, OD —проекция B OA на эту плоскость.

Из рисунка видно, что 1 и 2 по отдельности Рис. 7. не объясняют x (углы между соответствующими векторами близки к 90), но вместе они определяют плоскость, угол между которой ивектором OA очень мал, т.е. коэффициент детерминации в регрессии x на 1, близок к единице.

Рисунок также показывает, что такая ситуация возможна только если факторы силь но коррелированы.

В таких случаях особое внимание должно уделяться точности измерения фак торов.

Далее определяются последствия введения в уравнение дополнительного фак тора. Для этого сравниваются оценки уравнений (7.51, 7.52) в предположении, что 2 линейно независим от 1.

В этом анализе доказываются два утверждения.

1) Введение дополнительного фактора не может привести к сокращению ко эффициента детерминации, в большинстве случаев он растет (растет объясненная дисперсия). Коэффициент детерминации остается неизменным тогда и только то гда, когда вводимый фактор ортогонален остаткам в исходной регрессии (линейно независим от остатков), т.е. когда m2e = Z2e =0 (7.53) N (понятно, что коэффициент детерминации не меняется и в случае линейной зависи мости 2 от 1, но такой случай исключен сделанным предположением о линейной независимости этих факторов;

в дальнейшем это напоминание не делается).

Для доказательства этого факта проводятся следующие действия.

Записываются системы нормальных уравнений для оценки регрессий (7.51, 7.52):

m1 = M11a1, (7.54) 7.3. Независимые факторы: спецификация модели m12 m1 M11 a =, (7.55) m2 m21 m22 a 1 1 1 где m1 = Z1X, m2 = Z2X, M11 = Z1Z1, m12 = m = Z1Z2, N N N N m22 = Z2Z2.

N Далее, с помощью умножения обеих частей уравнения (7.51), расписанного по на блюдениям, слева на Z2, устанавливается, что N (7.53) m2 - m21a1 = m2e, (7.56) а из регрессии Z2 = Z1a21 + e21, в которой по предположению e21 =0, наход ится остаточная дисперсия:

1 (7.9) - s2 = e e21 = m22 - m21M11 m12 > 0. (7.57) e21 N Из первой (верхней) части системы уравнений (7.55) определяется:

(7.54) M11a + m12a2 = m1 = M11a1, ид алее - a = a1 - M11 m12a2. (7.58) Из второй (нижней) части системы уравнений (7.55) определяется:

(7.58) - m22a2 = m2 - m21a = m2 - m21 a1 - M11 m12a2.

Откуда - m22 - m21M11 m12 a2 = m2 - m21a и, учитывая (7.56, 7.57), s2 a2 = m2e. (7.59) e Наконец, определяется объясненная дисперсия после введения дополнительного фактора:

(7.9) (7.58) (7.56) m - s2 = m a + m2a2 = m a1 + - m M11 m12 a2 = s2 + m2ea2, q 1 1 1 1 q -- --- s2 a q (7.60) 238 Глава 7. Основная модель линейной регрессии т.е.

(7.59) m 2e s2 = s2 +.

q q s e Что и требовалось доказать.

Это утверждение легко проиллюстрировать рисунком 7.3 в пространстве наблюде ний при n1 =1.

На этом рисунке: OA — x, OB — 1, OC — 2, AD —нормаль x на ( DA —вектор e).

Рисунок показывает, что если 2 ортогонален e, тонормаль x на плоскость, опре деляемую 1 и 2, совпад аетс AD, т.е. угол между этой плоскостью и x совпадает сугломмежд у x и 1, введение в уравнение нового фактора 2 не меняет коэффи циент детерминации. Понятно также и то, что во всех остальных случаях (когда не ортогонален e) этот угол уменьшается и коэффициент детерминации растет.

После введения дополнительного фактора в уравнение максимально коэффициент детерми- A нации может увеличиться до единицы. Это про изойдет, если 2 является линейной комбинацией x и 1.

Рост коэффициента детерминации с увеличе- O C нием количества факторов — свойство коэффи циента детерминации, существенно снижающее D B его содержательное (статистическое) значение.

Введение дополнительных факторов, даже если Рис. 7. они по существу не влияют на моделируемую пе ременную, приводит к росту этого коэффициента. И, если таких факторов введено достаточно много, то он начнет приближаться к единице. Он обязательно достигнет единицы при n = N - 1. Более приемлем в роли критерия качества коэффициент детерминации, скорректированный на число степеней свободы:

N - R2 =1 - 1 - R N - n - ( 1 - R2 — отношение остаточной дисперсии к объясненной, которые имеют, со ответственно, N - n - 1 и N - 1 степеней свободы), этот коэффициент может снизиться после введения дополнительного фактора. Однако наиболее правильно c при оценке качества уравнения ориентироваться на показатель pv статистики F.

Скорректированный коэффициент детерминации построен так, что он, так сказать, штрафует за то, что в модели используется слишком большой набор факторов.

На этом же принципе построено и большинство других критериев, используемых 7.3. Независимые факторы: спецификация модели для выбора модели: на них положительно отражается уменьшение остаточной дис персии s2(z1) (здесь имеется в виду смещенная оценка дисперсии из регрессии e по z1) и отрицательно — количество включенных факторов n1 (без константы).

Укажем только три наиболее известных критерия (из огромного числа предложенных в литературе):

Критерий Маллоуза:

2(n1 +1) Cp = s2(z1) + 2(z), e e N где 2(z) — несмещенная оценка дисперсии в регрессии с полным набором факто e ров.

Информационный критерий Акаике:

2(n1 +1) AIC =ln 2s2(z1) +.

e N Байесовский информационный критерий (критерий Шварца):

ln(N)(n1 +1) BIC =ln 2s2(z1) +.

e N В тех же обозначениях скорректированный коэффициент детерминации имеет вид s2(z1) N - e R2 =1 -, s2() N - n1 - e где s2() — остаточная дисперсия из регрессии с одной константой.

e Регрессия тем лучше, чем ниже показатель Cp ( AIC, BIC ). Для R2 используется противоположное правило — его следует максимизировать. Вместо R2 при неиз менном количестве наблюдений N можно использовать несмещенную остаточную дисперсию 2 = 2(z1), которую уже следует минимизировать.

e e В идеале выбор модели должен происходить при помощи полного перебора воз можных регрессий. А именно, берутся все возможные подмножества факторов z1, для каждого из них оценивается регрессия и вычисляется критерий, а затем выби рается набор z1, дающий наилучшее значение используемого критерия.

Чем отличается поведение критериев R2 ( 2), Cp, AIC, BIC при выборе моде e ли? Прежде всего, они отличаются по степени жесткости, то есть по тому, насколько велик штраф за большое количество факторов и насколько более «экономную» мо дель они имеют тенденцию предлагать. R2 является наиболее мягким критерием.

Критерии Cp и AIC занимают промежуточное положение;

при больших N они ве дут себя очень похоже, но Cp несколько жестче AIC, особенно при малых N. BIC является наиболее жестким критерием, причем, как можно увидеть из приведенной формулы, в отличие от остальных критериев его жесткость возрастает с ростом N.

Различие в жесткости проистекает из различия в целях. Критерии Cp и AIC на правлены на достижение высокой точности прогноза: Cp направлен на миними зацию дисперсии ошибки прогноза (о ней речь пойдет в следующем параграфе), 240 Глава 7. Основная модель линейной регрессии а AIC — на минимизацию расхождения между плотностью распределения по ис тинной модели и по выбранной модели. В основе BIC лежит цель максимизации вероятности выбора истинной модели.

2) Оценки коэффициентов регрессии при факторах, ранее введенных в уравне ние, как правило, меняются после введения дополнительного фактора. Они оста ются прежними в двух и только двух случаях: а) если неизменным остается ко эффициент детерминации и выполняется условие (7.53) (в этом случае уравнение в целом остается прежним, т.к. a2 =0);

б) если новый фактор ортогонален старым ( 1 и 2 линейно не зависят друг от друга), т.е.

A m12 = Z1Z2 =0 (7.61) N (в этом случае объясненная дисперсия равна сумме C F дисперсий, объясненных факторами 1 и 2 по от O дельности).

D - Действительно, в соотношении (7.58) M11 m E не может равняться нулю при m12 =0, т.к. M невырожденная матрица. Поэтому из данного со B отношения следует, что оценки a1 не меняются, если a2 =0 (случай «а») или/и m12 =0 (случай Рис. 7. «б»).

Случай «а», как это следует из (7.59), возникает, когда выполняется (7.53).

В случае «б» соотношение (7.60) переписывается следующим образом:

(7.9) a=a s2 = m a + m2a2 = m a1 + m2a2, q 1 1 т.к. вторая (нижняя) часть системы (7.55) означает в этом случае, что m22a2 = m2, т.е. a2 — оценка параметра в регрессии x по 2:

x = 2a2 + e2 = s2 + s2, (7.62) q q где s2 — дисперсия x, объясненная только 2.

q Что и требовалось доказать.

Иллюстрация случая «а» при n1 =1 достаточно очевидна и дана выше. Рисунок 7. иллюстрирует случай «б». На этом рисунке: OA — x, OB — 1, OC — 2, EA — e, нормаль x на 1, FA — e2, нормаль x на 2, DA — e, нормаль x на плоскость, определенную 1 и 2, ED —нормаль к 1, FD —нормаль к 2.

Понятно (геометрически), что такая ситуация, когда точка E является одновре менно началом нормалей EA и ED, а точка F — началом нормалей FA и FD, возможна только в случае, если угол COB равен 90.

7.3. Независимые факторы: спецификация модели Но именно этот случай означает (как это следует из рисунка) одновременное вы полнение соотношений регрессий (7.51) ( OE + EA = OA), (7.52) (при a = a1) ( OE+OF +DA = OA) и (7.62) ( OF +FA = OA), т.е. что введение нового фактора не меняет оценку при «старом» факторе, а «новая» объясненная дисперсия равна сумме дисперсий, объясненных «старым» и «новым» факторами по отдельности (сумма квадратов длин векторов OE и OF равна квадрату длины вектора OD).

На основании сделанных утверждений можно сформулировать такое правило введения новых A факторов в уравнение регрессии: вводить в ре грессию следует такие факторы, которые имеют высокую корреляцию с остатками по уже введен ным факторам и низкую корреляцию с этими уже O введенными факторами. В этом процессе следует D C пользоваться F -критерием: вводить новые фак торы до тех пор, пока уменьшается показатель pv B F -статистики.

В таком процессе добавления новых факторов Рис. 7. в регрессионную модель некоторые из ранее вве денных факторов могут перестать быть значимыми, и их следует выводить из урав нения.

Эту возможность иллюстрирует рисунок 7.5 в пространстве наблюдений при n1 =1.

На этом рисунке: OA — x, OB— 1, OC — 2, AD —нормаль x на плос кость, определенную 1 и 2.

Рисунок показывает, что нормаль AD «легла» на вектор вновь введенного фактора.

Следовательно, «старый» фактор входит в «новую» регрессию с нулевым коэффи циентом.

Это — крайний случай, когда «старый» фактор автоматически выводится из уравне ния. Чаще встречается ситуация, в которой коэффициенты при некоторых «старых» факторах оказываются слишком низкими и статистически незначимыми.

Процесс, в котором оценивается целесообразность введения новых факторов и выведения ранее введенных факторов, называется шаговой регрессией. Враз витой форме этот процесс можно организовать следующим образом.

Пусть z — полный набор факторов, потенциально влияющих на x. Рассмат ривается процесс обращения матрицы ковариации переменных x, z, в начале ко торого рядом с этой матрицей записывается единичная матрица. С этой парой мат риц производятся одновременные линейные преобразования. Известно, что если первую матрицу привести таким образом к единичной, то на месте второй будет по лучена матрица, обратная к матрице ковариации. Пусть этот процесс не завершен, 242 Глава 7. Основная модель линейной регрессии и только n1 строк первой матрицы, начиная с ее второй строки (т.е. со стро ки первого фактора), преобразованы в орты;

z1 — множество факторов, строки которых преобразованы в орты, z2 — остальные факторы. Это — ситуация на те кущем шаге процесса.

В начале процесса пара преобразуемых матриц имеет вид (над матрицами по казаны переменные, которые соответствуют их столбцам):

x z1 z2 x z1 z mxx m m 1 0 1, m1 M11 M12 и 0 I1 m2 M12 M22 0 0 I где mxx = X X — дисперсия x, N m1 = Z1X — вектор-столбец коэффициентов ковариации z1 и x, N m2 = Z2X — вектор-столбец коэффициентов ковариации z2 и x, N M11 = Z1Z1 — матрица коэффициентов ковариации z1 между собой, N M12 = Z1Z2 — матрица коэффициентов ковариации z1 и z2, N M22 = Z2Z2 — матрица коэффициентов ковариации z2 между собой.

N На текущем шаге эти матрицы преобразуются к виду:

xz1 z -1 -1 - mxx - m M1 m1 m M1 m - m M1 M 1 1 2 ---- ------------ a1 ce 0 I1 - - - m2 - M12M1 m1 M12M1 M2 - M12M1 M xz1 z 10 -1 -1 - и -M1 m1 M1 -M1 M12.

00I 7.3. Независимые факторы: спецификация модели Информация, используемая в шаговой регрессии, расположена в 1-й строке первой матрицы: остаточная дисперсия в текущей регрессии (в столбце x), коэф фициенты a1 текущей регрессии при переменных z1 (в столбцах z1), коэффи циенты ce2 ковариации текущих остатков e с переменными z2, не включенными в текущую регрессию (в столбцах z2).

Для введения очередного фактора в регрессию (шаг вперед) следует его строку в первой матрице преобразовать в орт, для исключения фактора из регрессии (шаг назад) следует преобразовать в орт его строку во второй матрице. Шаг вперед увеличивает количество элементов в векторе z1 на единицу и сокращает на единицу количество элементов в векторе z2. Шаг назад приводит к обратным изменениям.

Последствия любого из этих шагов можно оценить по F -критерию, рассчитав c показатель pv F -статистики (информацию для такого расчета дает остаточная дисперсия — первый элемент первой строки первой матрицы).

На текущем шаге процесса проверяются последствия введения всех ранее не введенных факторов z2 и исключения всех введенных факторов z1. Выби рается тот вариант, который дает минимальное значение показателя pv. Процесс заканчивается, как только этот показатель перестает падать. В результате опреде ляется наилучшая регрессия. Такой процесс не приводит, как правило, к включению в регрессию сильно коррелированных факторов, т.е. позволяет решить проблему мультиколлинеарности.

Если бы расчеты проводились в стандартизированной шкале (по коэффици ентам корреляции, а не ковариации), «кандидатом» на введение был бы фактор с максимальным значением показателя в множестве ce2 (как было показано вы ше), а на исключение — фактор с минимальным значением показателя в множе стве a1. Но даже в этом случае для окончательного выбора (вводить-исключать) и решения вопроса о завершении процесса требуется использование F -критерия.

При «работе» с коэффициентами ковариации использование F -критерия необ ходимо.

На последних шагах процесса, при приближении к минимуму критериального показателя pv, его величина меняется, как правило, весьма незначительно. Поэто му один из возможных подходов к использованию шаговой регрессии заключается в определении некоторого множества регрессий, получаемых на последних шагах процесса, которые практически одинаковы по своему качеству. И на этом мно жестве следует делать окончательный выбор, пользуясь содержательными крите риями.

Иногда процесс шаговой регрессии предлагают строить на основе t-критерия:

фактор вводится в уравнение, если его t-статистика больше некоторой заданной величины t1, выводится из уравнения, если эта статистика меньше заданной вели чины t2;

как правило, t1 >t2. Такой процесс не гарантирует получение наилучшей 244 Глава 7. Основная модель линейной регрессии регрессии, его использовали в то время, когда вычислительные возможности были еще слабо развиты, и, в частности, точные значения показателя pv было трудно определить.

7.4. Прогнозирование Пусть получены оценки параметров уравнения (7.11). Задача прогнозирования заключается в определении возможного значения (прогноза) переменной x, объ ясняемой этой моделью, при некоторых заданных значениях факторов z, которые не совпадают ни с одним из наблюдений в матрице Z. Более того, как прави ло, z лежит вне области, представляемой матрицей Z. При этом предполагается, что гипотезы g1-g3 по-прежнему выполняются.

Обычно термин «прогнозирование» используется в случае, когда наблюдения i =1,..., N в матрице Z даны по последовательным моментам (периодам) вре мени, и заданные значения факторов z, для которых требуется определить прогноз x, относятся к какому-то будущему моменту времени, большему N (т.е. z лежит вне области, представляемой матрицей Z).

Методы прогнозирования могут быть различными. Если применяются отно сительно простые статистические методы, как в данном случае, то часто исполь зуют термин «экстраполирование». Если аналогичная задача решается для z, лежащих внутри области, представляемой наблюдениями в матрице Z (например, для «пропущенных» по каким-то причинам наблюдений), то используют термин «интерполирование». Процедуры экстраполирования и интерполирования с ис пользованием модели (7.11) с формальной точки зрения одинаковы.

Итак, задан некоторый zr =[zr1 · · · zrn 1], который отличается от всех zi, i =1,..., N (если i — обозначает момент времени, то r >N).

xr = zr + r — истинное значение искомой величины, x0 = zr — ожидаемое значение, r xp = zra — искомый (точечный) прогноз.

r Предполагаем, что гипотезы g1-g4 выполнены как для i = 1,..., N, так и для r >N.

(7.26) Это линейный (относительно случайных величин X) прогноз: xp = zrLX, r он не смещен относительно ожидаемого значения вслед за несмещенностью a:

E (xp) =x0. Его ошибка p = xr - xp имеет нулевое математическое ожидание r r r r и дисперсию -1 p = 2 1+zr Z Z zr, (7.63) 7.4. Прогнозирование которая минимальна на множестве всех возможных линейных несмещенных про гнозов.

Действительно:

p = zr ( - a) +r.

r Поскольку случайные величины a и r не зависят друг от друга, p = E (p)2 = E (zr( - a)( - a) zr) +E 2 = r r (7.29) = zrMazr + 2 = 2 1+zr (Z Z)-1 zr.

Эта дисперсия минимальна среди всех возможных дисперсий линейных несмещен ных прогнозов вслед за аналогичным свойством оценок a. Это является прямым следствием того, что оценки МНК относятся к классу BLUE. Для того чтобы в этом убедиться, достаточно в доказательстве данного свойства оценок a, которое приве дено в п. 7.2, заменить c на zr.

Следует иметь в виду, что ошибка любого расчетного по модели значения xc, i являясь формально такой же: c = xi - xc, имеет также нулевое математическое i i ожидание, но принципиально другую, существенно меньшую, дисперсию:

-1 i = 2 1 - zi Z Z zi.

Видно, что эта дисперсия даже меньше остаточной.

Действительно, как и прежде: c = zi ( - a) +i. Но теперь случайные величины i a и i коррелированы и поэтому:

g E(i) = 2oi, где oi — i-й орт i = 2 1+zi (Z Z)-1 zi +2ziE(( - a)i) = -- (7.27) = -L = 2 1+zi (Z Z)-1 zi - 22zi (Z Z)-1 zi = 2 1 - zi (Z Z)-1 zi.

Величины 1-zi (Z Z)-1 zi (i =1,..., N), естественно, неотрицательны, посколь ку они являются диагональными элементами матрицы B из (7.32), которая поло жительно полуопределена.

Структуру дисперсии ошибки прогноза (7.63) можно пояснить на примере n =1. В этом случае (используются обозначения исходной формы уравнения ре грессии, и все z — одномерные величины):

1 (zr - z) p = 2 1+ +. (7.64) N i 246 Глава 7. Основная модель линейной регрессии В этом легко убедиться, если перейти к обозначениям исходной формы урав нения регрессии, подставить в (7.63) вместо zr и Z, соответственно, zr и Z 1N и сделать необходимые преобразования (правило обращения матрицы (2 2) см. в Приложении A.1.2), учитывая, что - 2 1 4 - 1 = и Z Z = i + Nz2 :

14 - 3 4 -3 - Nz zr p = 2 1+ zr 1 Z Z = Nz N z 1 1 zr = 2 1+ = zr Z Z - Nz - Z Z z N 2 zr - 2 + i + Nz zzr N 1 (zr - z) = 2 1+ = 2 1+ +.

2 i N i Что и требовалось доказать.

Это выражение показывает «вклады» в дисперсию ошибки прогноза собствен но остаточной дисперсии, ошибки оценки свободного члена и ошибки оценки угло вого коэффициента. Первые две составляющие постоянны и не зависят от горизон та прогнозирования, т.е. от того, насколько сильно условия прогноза (в частности, значение zr) отличаются от условий, в которых построена модель (в частности, значение z). Третья составляющая — ошибка оценки углового коэффициента — определяет расширяющийся конус ошибки прогноза.

Мы рассмотрели точечный прогноз. Если дополнительно к гипотезам g1-g предположить выполнение гипотезы g5 для i =1,..., N ид ля r >N, то можно построить также интервальный прогноз.

По формуле (7.27) ошибка прогноза имеет вид:

p = zr( - a) +r = zrL + r.

r Таким образом, она имеет нормальное распределение:

p = xr - xp N(0, p).

r r Если бы дисперсия ошибки 2 была известна, то на основе того, что xr - xp r N(0, 1), p 7.5. Упражнения и задачи для xr можно было бы построить (1 - )100-процентный Таблица 7. прогнозный интервал:

X Z1 Z xr [xp ± p1-].

r 65.7 26.8 Вместо неизвестной дисперсии p = 2(1+zr(Z Z)-1zr) 74.2 25.3 берется несмещенная оценка 74 25.3 s2 = 2(1 + zr(Z Z)-1zr).

p e 66.8 31.1 64.1 33.3 По аналогии с (7.44) можно вывести, что 67.7 31.2 xr - xp r tN-n-1.

sp 70.9 29.5 69.6 30.3 Тогда в приведенной формуле прогнозного интервала необ ходимо заменить p на sp и 1- на tN-n-1, 1-:

67 29.1 68.4 23.7 xr xp ± sptN-n-1, 1-.

r 70.7 15.6 69.6 13.9 7.5. Упражнения и задачи 63.1 18.8 Упражнение 48.4 27.4 По наблюдениям за объясняемой переменной X и за 55.1 26.9 объясняющими переменными Z =(Z1, Z2) из таблицы 7.1:

55.8 27.7 1.1. Вычислите ковариационную матрицу переменных z 58.2 24.5 (M = Z Z), вектор ковариаций переменных z спе 64.7 22.2 N ременной x ( m = Z X), дисперсию объясняемой 73.5 19.3 N переменной s2. Для регрессии X = Za +1Nb + e най 68.4 24.7 x дите оценки a и b, объясненную дисперсию s2 = m a q и остаточную дисперсию s2 = s2 - s2, а также коэф e x q фициент детерминации R2.

1.2. Запишите для данной модели уравнение регрессии в форме со скрытым сво бодным членом X = Za + e. Рассчитайте для переменных начальные момен ты второго порядка двумя способами:

1 а) M = Z Z и m = Z X N N 248 Глава 7. Основная модель линейной регрессии M + z z m + x z z б) M = и m =.

z 1 x 1.3. Найдите оценку a, рассчитайте s2 = X X - x2 и s2 = m a - x2 иубе x q N дитесь, что результат совпадает с результатом пункта 1 упражнения 1.

1.4. Рассчитайте несмещенную оценку остаточной дисперсии N 2 = s e e N - n - и оцените матрицу ковариации параметров уравнения регрессии e Ma = M-1.

N 1.5. Используя уровень значимости =0.05, вычислите доверительные интер валы для коэффициентов уравнения регрессии и проверьте значимость фак торов.

R2(N - n - 1) c 1.6. Рассчитайте статистику F = и, используя уровень значи (1 - R2)n мости = 0.05, проверьте гипотезу о том, что модель некорректна и все факторы введены в нее ошибочно.

1.7. Рассчитайте коэффициент детерминации, скорректированный на число сте пеней свободы R2.

1.8. По найденному уравнению регрессии и значениям а) z =(min Z1, min Z2);

б) z =(Z1, Z2);

в) z =(max Z1, max Z2);

вычислите предсказанное значение для x и соответствующую интервальную оценку при =0.05.

Упражнение Дано уравнение регрессии: X = Z + = -1.410z1 +0.080z2 +56.962 120 +, где X— вектор-столбец 20 наблюдений за объясняемой переменной (20 1), — вектор-столбец случайных ошибок (20 1) с нулевым средним и ковариа ционной матрицей 2I20 =21.611I20 и Z — матрица размерности (20 3) на блюдений за объясняющими переменными. Используя нормальное распределение 7.5. Упражнения и задачи с независимыми наблюдениями, со средним 0 и ковариационной матрицей 2I20 = =21.611I20, получите 100 выборок вектора (N 1), k =1,..., 100, гд е N = = 20. Эти случайные векторы потом используйте вместе с известным вектором = (-1.410, 0.080, 56.962) и матрицей Z = (Z1, Z2, 1) из таблицы 7.1. Снача ла получите ожидаемое значения X0 = Z, затем, чтобыполучить 100 выборок вектора X (20 1), добавьте случайные ошибки: X0 + = X.

2.1. Используйте 10 из 100 выборок, чтобы получить выборочные оценки для 1, 2,, и R2.

2.2. Вычислите матрицу ковариаций параметров уравнения регрессии Ma для каж дого элемента выборки и сравните с истинным значением ковариационной матрицы:

0.099813 -0.004112 -0. - 2 Z Z =.

-0.004112 0.000290 -0. -0.233234 -0.057857 39. Дайте интерпретацию диагональных элементов ковариационных матриц.

2.3. Вычислите среднее и дисперсию для 10 выборок для каждого из параметров, полученных в упражнении 2.1, и сравните эти средние значения с истинными параметрами. Обратите внимание, подтвердилась ли ожидаемые теоретиче ские результаты.

2.4. Используя уровень значимости =0.05, вычислите и сравните интерваль ные оценки для 1, 2, и для 10 выборок.

2.5. Объедините 10 выборок, по 20 наблюдений каждая, в 5 выборок по 40 на блюдений и повторите упражнения 2.1 и 2.2. Сделайте выводы о результатах увеличения объема выборки.

2.6. Повторите упражнения 2.1 и 2.5 для всех 100 и д ля 50 выборок и проана лизируйте разницу в результатах.

2.7. Постройте распределения частот для оценок, полученных в упражнении 2.6, сравните и прокомментируйте результаты.

250 Глава 7. Основная модель линейной регрессии Задачи 1. В регрессии X = Za +1N b + e матрица вторых начальных моментов ре 9 грессоров равна. Найдите дисперсию объясняющей переменной.

2 2. На основании ежегодных данных за 10 лет с помощью МНК была сделана оценка параметров производственной функции типа Кобба—Дугласа. Чему равна несмещенная оценка дисперсии ошибки, если сумма квадратов остат ков равна 32?

3. В регрессии X = Za +1N b + e с факторами Z =(1, 2, 3) сумма квадра тов остатков равна 6. Найдите ковариационную матрицу оценок параметров регрессии.

4. Какие свойства МНК-оценок коэффициентов регрессии теряются, если ошибки по наблюдениям коррелированы и/или имеют разные дисперсии?

5. Что обеспечивает гипотеза о нормальности распределения ошибок при по строения уравнения регрессии? Ответ обоснуйте.

6. Какие ограничения на параметры уравнения проверяются с помощью t-кри терия (написать ограничения с расшифровкой обозначений)?

7. Четырехфакторное уравнение регрессии оценено по 20-ти наблюдениям.

В каком случае отношение оценки коэффициента регрессии к ее стандарт ной ошибке имеет распределение t-Стьюдента? Сколько степенией свободы в этом случае имеет эта статистика?

8. Оценки МНК в регрессии по 20-ти наблюдениям равны (2, -1), а ковариа 9 ционная матрица этих оценок равна. Найти статистики t-Стьюдента 2 для этих коэффициентов.

9. По 10 наблюдениям дана оценка 4 одному из коэффициентов двухфакторной регрессии. Дисперсия его ошибки равна 4. Построить 99%-ный доверитель ный интервал для этого коэффициента.

10. МНК-оценка параметра регрессии, полученная по 16 наблюдениям, рав на 4, оценка его стандартной ошибки равна 1. Можно ли утверждать с веро ятностью ошибки не более 5%, что истинное значение параметра равно 5.93?

Объяснить почему.

7.5. Упражнения и задачи 11. Оценка углового коэффициента регрессии равна 4, а дисперсия этой оценки равна 4. Значим ли этот коэффициент, если табличные значения:

tN-n-1, 0.95 =2.4, tN-n-1, 0.90 =1.9?

12. В результате оценивания регрессии x = z +1N + на основе N = наблюдений получены следующие результаты:

x =1.2z1+ 1.0z2- 0.5z3+ 25. Стандартные ошибки оценок ( ) (1.3) (0.06) (2.1) t-статистика (0.8) ( ) ( ) ( ) 95% доверительные интервалы (-1.88;

4.28) ( ) ( ) ( ) Заполните пропуски в скобках.

13. На основе годовых отчетов за 1973–1992 годы о затратах на продукты пи тания Q, располагаемом доходе Y, индексе цен на продукты питания PF и индексе цен на непродовольственные товары PNF, группа исследовате лей получила различные регрессионные уравнения для функции спроса на продукты питания:

ln Q = 3.87 - 1.34 ln PF (1.45) (-4.54) R2 = 0. ln Q = 2.83 - 0.92 ln PF + 1.23 ln Y (1.25) (-2.70) (2.99) R2 = 0. ln Q = 2.35 - 0.52 ln PF + 0.95 ln Y + 1.54 ln PNF (1.54) (-1.80) (0.79) (2.45) R2 = 0. В скобках приведены значения t-статистики.

Прокомментируйте полученные оценки коэффициентов и t-статистики, объ ясните, почему значения могут различаться в трех уравнениях. Можете ли вы предложить решение проблемы статистической незначимости коэффициен тов в последнем уравнении?

252 Глава 7. Основная модель линейной регрессии 14. Используя приведенные ниже данные, оцените параметры модели xt = + + 1z1t + 2z2t + t и, делая все необходимые предположения, проверьте статистическую значимость коэффициента 1.

2 а) 1t =10, 2t =8, 1t2t =8, 1txt = -10, 2txt = -8, x2 =20, t =1,..., 5;

t 2 б) z1t =55, z2t =28, z1tz2t =38, z1txt =35, z2txt =22, xt =15, z1 =15, z2 =10, N =5, x2 =65.

15. Анализ годовых данных (21 наблюдение) о спросе на некоторый товар привел к следующим результатам:

Средние Стандартные Парные коэффициенты отклонения корреляции z =51.843 sz =9.205 rxz =0. x =8.313 sx =1.780 rxt =0. t =0 st =6.055 rzt =0. z — потребление на душу населения, x — цена с учетом дефлятора, t — время (годы).

а) Найдите коэффициент при времени в оцененной регрессии x по z и t.

б) Проверьте, будет ли этот коэффициент значимо отличен от нуля.

в) Кратко объясните экономический смысл включения в регрессию вре мени в качестве объясняющей переменной.

16. Какие ограничения на параметры уравнения можно проверить с помощью F -критерия? Написать ограничения с расшифровкой обозначений.

17. Пяти-факторное уравнение линейной регрессии для переменной x оценено по 31 наблюдению. При этом объясненная и смещенная остаточная дис персии соответственно равны 8 и 2. Вычислить коэффициент детерминации и расчетное значение F -статистики.

18. В регрессии x = z11+z22++ по 5-ти наблюдениям смещенная оценка остаточной дисперсии равна 1, а дисперсия зависимой переменной равна 2.

Значима ли эта зависимость?

19. По 10 наблюдениям оценено двухфакторное уравнение линейной регрессии, коэффициент детерминации составляет 90%. При каком уровне доверия это уравнение статистически значимо? Записать уравнение для нахождения этого уровня значимости.

7.5. Упражнения и задачи 20. Используя следующие данные:

X =(5, 1, -2, 5, -4), Z =(1, 2, 3, 4, 5), и делая все необходимые предположения а) для X = Z +1N + оценить 95-процентные доверительные интер валы для параметров регрессии;

б) проверить значимость коэффициентов регрессии и оценить качество регрессии с вероятностью ошибки 5%.

21. Пусть X = 1Z1 + 2Z2 +, X = (4, -2, 4, 0), Z1 = (1, 1, 2, 2) и Z2 = 2Z1. Постройте систему нормальных уравнений и покажите, что существует бесконечное множество решений для a1 и a2. Выберите любые два решения, покажите, что они дают одинаковые расчетные значения X и, таким образом, одинаковые значения суммы квадратов ошибок.

22. Для уравнения регрессии X = Z +15 + имеются следующие данные:

4 1.03 2.08 0. 8 1.46 2.80 2. X =, Z =(Z1 Z2 Z3) = 5.5 1.14 2.30 0.98.

5.8 1.71 3.05 0. 7.0 1.06 2.17 1. а) Являются ли факторы линейно зависимыми?

б) Найти матрицу коэффициентов корреляции факторных переменных, рассчитать определитель данной матрицы и сделать вывод о мульти коллинеарности факторов.

в) Рассчитать определитель матрицы коэффициентов корреляции фактор ных переменных в случае, если из уравнения выводится фактор Z2.

г) Учесть дополнительную внешнюю информацию: 1 = 1.52 (с помо щью подстановки в уравнение регрессии) и найти определитель матрицы коэффициентов корреляции факторных переменных.

д) Построить точечный прогноз x (xp) для значений экзогенных перемен r ных zr =(z1r, z2r, z3r) =(0.8, 1.6, 0.6):

– при использовании исходного уравнения;

– при исключении из уравнения фактора Z2;

254 Глава 7. Основная модель линейной регрессии – при использовании внешней информации из пункта (г).

23. Пусть цены сильно коррелируют с денежной массой и неплатежами. Ко эффициент корреляции между денежной массой и неплатежами равен 0.975 R2 =0.95. Имеет ли смысл строить регрессию цен на эти два (сильно мультиколлинеарных) фактора?

24. Модель x = 1z1 + 2z2 + + (1) была оценена по МНК, и был получен коэффициент детерминации R1, ад ля преобразованной модели x = 1z1 + 2z2 + 3z3 + + (2) был получен коэффициент детерминации R2.

а) Объясните, почему не может быть больше, чем. При каких R2 R условиях они равны?

б) Объясните последствия оценки модели (1), если верной является мо дель (2).

25. В регрессии x = 1z1 + + остатки равны (-2, 1, 0, 1). Оценивается регрессия x = 1z1 + 2z2 + +. Привести пример переменной z2, чтобы коэффициенты детерминации в обеих регрессиях совпадали.

26. В регрессию x = 1z1 + + добавили переменную z2. Переменная z оказалась совершенно незначимой. Как изменились обычный и скорректи рованный коэффициенты детерминации?

27. Коэффициент детерминации в регрессии выпуска продукции по численности занятых в производстве, оцененной по 12 наблюдениям, равен 0.8. После введения в регрессию дополнительного фактора — основного капитала — он вырос до 0.819. Имело ли смысл вводить этот дополнительный фактор?

Ответ обосновать без применения статистических критериев.

28. Дана модель регрессии xi = 1zi + + i.

а) Как оценивается точечный прогноз xN+1, если известно, что = 0?

zN+ Покажите, что дисперсия ошибок прогноза будет равна 2 1+.

N zi i= 7.5. Упражнения и задачи б) Как оценивается точечный прогноз xN+1, если известно, что = 0?

Покажите, что дисперсия ошибок прогноза будет равна 2 1+.

N 29. Почему ошибки прогнозирования по линейной регрессии увеличиваются с ростом горизонта прогноза?

30. Была оценена регрессия x = 1z + + по 50 наблюдениям. Делается прогноз x в точке z51. При каком значении z51 доверительный интервал прогноза будет самым узким?

31. Вычислите предсказанное значение для x и соответствующую интервальную оценку прогноза при =0.05 в точке z26 =14, если регрессионная модель x =3z + 220 + e построена по 25 наблюдениям, остаточная дисперсия равна 25 исред няяпо z равна 14.

Рекомендуемая литература 1. Айвазян С.А. Основы эконометрики. Т.2. — М.: Юнити, 2001. (Гл. 2).

2. Демиденко Е.З. Линейная и нелинейная регрессия. — М.: «Финансы и ста тистика», 1981. (Гл. 1, 2, 6).

3. Джонстон Дж. Эконометрические методы. — М.: «Статистика», 1980.

(Гл. 2, 5).

4. Дрейпер Н., Смит Г. Прикладной регрессионный анализ: В 2-х книгах.

Кн.1 — М.: «Финансы и статистика», 1986, (Гл. 1, 2).

5. Кейн Э. Экономическая статистика и эконометрия. Вып. 2. — М.: «Стати стика», 1977. (Гл. 10, 11, 14).

6. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика — начальный курс. — М.: «Дело», 2000. (Гл. 3, 4, 8).

7. (*) Маленво Э. Статистические методы эконометрии. Вып. 1. — М.: «Ста тистика», 1975. (Гл. 3, 6).

8. Себер Дж. Линейный регрессионый анализ. — М.: Мир, 1980.

9. Тинтер Г. Введение в эконометрию. — М.: «Статистика», 1965. (Гл. 5).

10. Davidson, Russel, Mackinnon, James. Estimation and Inference in Econo metrics, N 9, Oxford University Press, 1993. (Ch. 2).

256 Глава 7. Основная модель линейной регрессии 11. Greene W.H. Econometric Analysis, Prentice-Hall, 2000. (Ch. 6, 7).

12. Judge G.G., Hill R.C., Griffiths W.E., Luthepohl H., Lee T. Introduction to the Theory and Practice of Econometric. John Wiley & Sons, Inc., 1993. (Ch. 5, 21).

13. (*) William E., Griffiths R., Carter H., George G. Judge. Learning and Prac ticing econometrics, N 9 John Wiley & Sons, Inc., 1993. (Ch. 8).

Глава Нарушение гипотез основной линейной модели 8.1. Обобщенный метод наименьших квадратов (взвешенная регрессия) Пусть нарушена гипотеза g4 и матрица ковариации ошибок по наблюдени ям равна не 2IN, а 2, гд е — вещественная симметричная положительно полуопределенная матрица (см. Приложение A.1.2), т.е. ошибки могут быть кор релированы по наблюдениям и иметь разную дисперсию. В этом случае обычные МНК-оценки параметров регрессии (7.26) остаются несмещенными и состоятель ными, но перестают быть эффективными в классе линейных несмещенных оценок.

Ковариационная матрица оценок МНК в этом случае приобретает вид -1 - Ma = 2 Z Z Z Z Z Z.

Действительно, a - E (a) =a - =(Z Z)-1 Z, поэтому E (a - E(a)) (a - E(a)) =(Z Z)-1 Z E ( ) Z (Z Z)-1 = = 2 (Z Z)-1 Z Z (Z Z)-1.

(Ср. с выводом формулы (7.28), где =2I.) 258 Глава 8. Нарушение гипотез основной линейной модели Обычная оценка ковариационной матрицы s2 (Z Z)-1 при этом является сме e щенной и несостоятельной. Как следствие, смещенными и несостоятельными ока зываются оценки стандартных ошибок оценок параметров (7.35): чаще всего они преуменьшаются (т.к. ошибки по наблюдениям обычно коррелированы положи тельно), и заключения о качестве построенной регрессии оказываются неоправ данно оптимистичными.

По этим причинам желательно применять обобщенный МНК (ОМНК), заклю чающийся в минимизации обобщенной остаточной дисперсии e -1e.

N В обобщенной остаточной дисперсии остатки взвешиваются в соответствии со структурой ковариационной матрицы ошибок. Минимизация приводит к полу чению следующего оператора ОМНК-оценивания (ср. с (7.13), где =IN ):

a =(Z -1Z)-1Z -1X. (8.1) Для обоснования ОМНК проводится преобразование в пространстве наблю дений (см. параграф 6.4) с помощью невырожденной матрицы D размерности N N, такой, что D-1D -1 = (такое представление допускает любая ве щественная симметричная положительно определенная матрица, см. Приложение A.1.2):

DX = DZ + D. (8.2) Такое преобразование возвращает модель в «штатную» ситуацию, поскольку новые остатки удовлетворяют гипотезе g4:

E(D D ) =D2D = 2DD-1D -1D = 2IN.

Остаточная дисперсия теперь записывается как e D De, а оператор оцени N вания — как a =(Z D DZ)-1Z D DX.

Что и требовалось доказать, поскольку D D =-1.

Обычно ни дисперсии, ни тем более ковариации ошибок по наблюдениям не из вестны. В классической эконометрии рассматриваются два частных случая.

8.2. Гетероскедастичность ошибок Пусть ошибки не коррелированы по наблюдениям, и матрица (а вследза ней и матрица D) диагональна. Если эта матрица единична, т.е. дисперсии ошибок 8.2. Гетероскедастичность ошибок одинаковы по наблюдениям (гипотеза g4 не нарушена), то имеет место гомос кедастичность или однородность ошибок по дисперсии — «штатная» ситуация.

В противном случае констатируют гетероскедастичность ошибок или их неодно родность по дисперсии.

Пусть var(i) = i — дисперсия ошибки i-го наблюдения. Гомоскедастич ность означает, что все числа i одинаковы, а гетероскедастичность — что среди них есть несовпадающие.

Факт неоднородности остатков по дисперсии мало сказывается на качестве оце нок регрессии, если эти дисперсии не коррелированы с независимыми факторами.

Это — случай гетероскедастичности «без негативных последствий».

Данное утверждение можно проиллюстрировать в случае, когда в матрице Z все го один столбец, т.е. n = 1 и свободный член отсутствует. Тогда формула (7.33) приобретает вид:

2 i zi i E(s2) = i -.

e N zi i i Если ситуация штатная и i = 2, то правая часть этой формулы преобразуется к ви N - 1 N ду 2, и s2 оказывается несмещенной оценкой 2, как и было пока e N N - зано в параграфе 7.2. Если i и zi не коррелированы, то, обозначив 2 = i, N i можно утверждать, что 2 2 i zi 2 zi i i 2 zi zi = 2, i i т.е. ситуация остается прежней. И только если i и zi положительно (или отрица тельно) коррелированы, факт гетероскедастичности имеет негативные последствия.

2 i zi Действительно, в случае положительной корреляции > 2 и, следова zi N тельно, E s2 <2. Обычная «несмещенная» оценка остаточной диспер e N - сии оказывается по математическому ожиданию меньше действительного значе ния остаточной дисперсии, т.е. она (оценка остаточной дисперсии) дает основания для неоправданно оптимистичных заключений о качестве полученной оценки модели.

Следует заметить, что факт зависимости дисперсий ошибок от независимых факторов в экономике весьма распространен. В экономике одинаковыми по диспер сии скорее являются относительные ( ), а не абсолютные () ошибки. Поэтому, z когда оценивается модель на основе данных по предприятиям, которые могут иметь 260 Глава 8. Нарушение гипотез основной линейной модели и, как правило, имеют различные масштабы, гетероскедастичности с негативными последствиями просто не может не быть.

Если имеет место гетероскедастичность, то, как правило, дисперсия ошибки связана с одной или несколькими переменными, в первую очередь — с факторами регрессии. Пусть, например, дисперсия может зависеть от некоторой перемен ной yi, которая не является константой:

i = 2(yi), i =1,..., N.

Как правило, в качестве переменной yi берется один из независимых факторов или математическое ожидание изучаемой переменной, т.е. x0 = Z (в качестве его оценки используют расчетные значения изучаемой переменной Za).

В этой ситуации желательно решить две задачи: во-первых, определить, имеет ли место предполагаемая зависимость, а во-вторых, если зависимость обнаружена, получить оценки с ее учетом. При этом могут использоваться три группы методов.

Методы первой группы позволяют работать с гетероскедастичностью, которая за дается произвольной непрерывной функцией 2(·). Для методов второй группы функция 2(·) должна быть монотонной. В методах третьей группы функция 2(·) предполагается известной с точностью до конечного числа параметров.

Примером метода из первой группы является критерий Бартлетта, который заключается в следующем.

Пусть модель оценена и найдены остатки ei, i =1,..., N. Для расчета bc — статистики, лежащей в основе применения этого критерия, все множество наблю дений делится по какому-либо принципу на k непересекающихся подмножеств.

В частности, если требуется выявить, имеется ли зависимость от некоторой пе ременной yi, то все наблюдения упорядочиваются по возрастанию yi, а затем в соответствии с этим порядком делятся на подмножества. Пусть k Nl — количество элементов в l-м подмножестве, Nl = N;

l= s2 — оценка дисперсии остатков в l-м подмножестве, найденная на основе l остатков ei;

k Nls l N l= bs = — отношение средней арифметической дисперсий к сред /N k s2Nl l l= ней геометрической;

это отношение в соответствии со свойством мажорантности средних (см. п. 2.2) больше или равно единице, и чем сильнее различаются диспер сии по подмножествам, тем оно выше.

8.2. Гетероскедастичность ошибок ei s s s s s yi Рис. 8. Тогда статистика Бартлетта равна N bc = ln bs.

k 1 l= Nl N 1+ 3(k - 1) При однородности наблюдений по дисперсии (нулевая гипотеза) эта статистика распределена как 2. Проверка нулевой гипотезы проводится по обычному ал k- горитму.

Если нулевую гипотезу отвергнуть не удалось, т.е. ситуация гомоскедастична, то исходная оценка модели удовлетворительна. Если же нулевая гипотеза отверг нута, то ситуация гетероскедастична.

Принцип построения статистики Бартлетта иллюстрирует рисунок 8.1.

Классический метод второй группы заключается в следующем. Все наблюдения упорядочиваются по возрастанию некоторой переменной yi. Затем оцениваются две вспомогательные регрессии: по K «малым» и по K «большим» наблюдениям (с целью повышения мощности критерия средние N - 2K наблюдения в расчете не участвуют, а K можно, например, выбрать равным приблизительно трети N).

Пусть s2 — остаточная дисперсия в первой из этих регрессий, а s2 — во второй.

1 В случае гомоскедастичности ошибок (нулевая гипотеза) отношение двух дисперсий распределено как s FK-n-1, K-n-1.

s Здесь следует применять обычный F -критерий. Нулевая гипотеза о гомос кедастичности принимается, если рассчитанная статистика превышает 95%-ный квантиль F -распределения.

262 Глава 8. Нарушение гипотез основной линейной модели ei s s yi Рис. 8. Такой подход применяется, если ожидается, что дисперсия может быть только по ложительно коррелирована с переменной yi. Если неизвестно, положительно или отрицательно коррелирована дисперсия с рассматриваемым фактором, то следу ет отклонять нулевую гипотезу как при больших, так и при малых значениях ста s тистики. Можно применить следующий прием: рассчитать статистику как s отношение максимальной из дисперсий s2 и s2 к минимальной. Такая статисти 1 ка будет иметь усеченное F -распределение, где усечение происходит на уровне медианы, и берется правая половина распределения. Отсюда следует, что для до стижения, например, 5%-го уровня ошибки, следует взять табличную критиче скую границу, соответствующую, 2.5%-му правому хвосту обычного (не усеченного) F -распределения. Если указанная статистика превышает данную границу, то нуле вая гипотеза о гомоскедастичности отвергается.

Данный метод известен под названием метода Голдфельда—Квандта.

Можно применять упрощенный вариант этого критерия, когда дисперсии s2 и s2 считаются на основе остатков из проверяемой регрессии. При этом s2 и s2 не 2 1 будут независимы, и их отношение будет иметь F -распределение только прибли женно. Этот метод иллюстрирует рисунок 8.2.

Для того чтобы можно было применять методы третьей группы, требуется обладать конкретной информацией о том, какой именно вид имеет гетероскеда стичность.

Так, например, если остатки прямо пропорциональны значениям фактора (n =1):

x = z + + z, и удовлетворяет необходимым гипотезам, то делением обеих частей уравнения на z ситуация возвращается в «штатную»:

x = + +, Z Z 8.2. Гетероскедастичность ошибок ei s s yi Рис. 8. в которой, правда, угловой коэффициент и свободный член меняются местами. Тем самым применяется преобразование в пространстве наблюдений такое, что диаго нальные элементы матрицы D равны.

zi Если зависимость дисперсии от других переменных известна не точно, а только с точностью до некоторых неизвестных параметров, то для проверки гомоскеда стичности следует использовать вспомогательные регрессии.

Так называемый метод Глейзера состоит в следующем. Строится регрессия модулей остатков |ei| на константу и те переменные, которые могут быть коррели рованными с дисперсией (например, это может быть все множество независимых факторов или какое-то их подмножество). Если регрессия оказывается статисти чески значимой, то гипотеза гомоскедастичности отвергается.

Построение вспомогательной регрессии от некоторой переменной yi показано на рисунке 8.3.

Другой метод (критерий Годфрея) использует аналогичную вспомогательную регрессию, в которой в качестве зависимой переменной используются квадраты остатков e2.

i Если с помощью какого-либо из перечисленных критериев (или других анало гичных критериев) проверены различные варианты возможной зависимости и ну левая гипотеза во всех случаях не была отвергнута, то делается вывод, что ситуа ция гомоскедастична или гетероскедастична без негативных последствий и что для оценки параметров модели можно использовать обычный МНК. Если же нуле вая гипотеза отвергнута и поэтому, возможно, имеет место гетероскедастичность с негативными последствиями, то желательно получить более точные оценки, учи тывающие гетероскедастичность.

Это можно сделать, используя для оценивания обобщенный МНК (см. уравне ние (8.2)). Соответствующее преобразование в пространстве наблюдений состоит 264 Глава 8. Нарушение гипотез основной линейной модели в том, чтобы каждое наблюдение умножить на di, т.е. требуется оценить обычным методом наименьших квадратов преобразованную регрессию с переменными diXi и diZi. При этом не следует забывать, что если матрица факторов Z содержит свободный член, то его тоже нужно умножить на di, поэтому вместо свободного члена в регрессии появится переменная вида (d1,..., dN ). Это приводит к тому, что стандартные статистические пакеты выдают неверные значения коэффициен та детерминации и F -статистики. Чтобы этого не происходило, требуется поль зоваться специализированными процедурами для расчета взвешенной регрессии.

Описанный методполучил название взвешенного МНК, поскольку он равнозначен N минимизации взвешенной суммы квадратов остатков d2e2.

i i i= Чтобы это можно было осуществить, необходимо каким-то образом получить оценку матрицы D, используемой для преобразования в пространстве наблюдений.

Перечисленные в этом параграфе методы дают возможность не только проверить гипотезу об отсутствии гетероскедастичности, но и получить определенные оценки матрицы D (возможно, не очень хорошие).

Если S2 — оценка матрицы 2, гд е S2 — диагональная матрица, состав ленная из оценок дисперсий, то S-1 (матрица, обратная к ее квадратному кор ню) — оценка матрицы D.

Так, после проверки гомоскедастичности методом Глейзера в качестве диа гональных элементов матрицы S-1 можно взять — |ei|c, гд е |ei|c расчетные значения |ei|. Если используются критерии Бартлетта или Голдфельда—Квандта, то наблюдения разбиваются на группы, для каждой из которых есть оценка дис персии, s2. Тогда для этой группы наблюдений в качестве диагональных элементов l матрицы S-1 можно взять.

sl В методе Голдфельда—Квандта требуется дополнительно получить оценку дис персии для пропущенной средней части наблюдений. Эту оценку можно получить непосредственно по остаткам пропущенных налюдений или как среднее (s2+s2)/2.

1 Если точный вид гетероскедастичности неизвестен, и, как следствие, взвешенный МНК неприменим, то, по крайней мере, следует скорректировать оценку ковариа ционной матрицы оценок параметров, оцененных обычным МНК, прежде чем про верять гипотезы о значимости коэффициентов. (Хотя при использовании обычного МНК оценки будут менее точными, но как уже упоминалось, они будут несмещенны ми и состоятельными.) Простейший метод коррекции состоит в замене неизвестной ковариационной матрицы ошибок 2 на ее оценку S2, гд е S2 — диагональная матрица с типичным элементом e2 (т.е. квадраты остатков используются как оценки i дисперсий). Тогда получается следующая скорректированная оценка ковариацион ной матрицы a (оценка Уайта или устойчивая к гетероскедастичности оценка):

(Z Z)-1 Z S2Z (Z Z)-1.

8.3. Автокорреляция ошибок 8.3. Автокорреляция ошибок Если матрица ковариаций ошибок не является диагональной, то говорят об ав токорреляции ошибок. Обычно при этом предполагают, что наблюдения однород ны по дисперсии, и их последовательность имеет определенный смысл и жестко фиксирована. Как правило, такая ситуация имеет место, если наблюдения про водятся в последовательные моменты времени. В этом случае можно говорить о зависимостях ошибок по наблюдениям, отстоящим друг от друга на 1, 2, 3 ит.д.

момента времени. Обычно рассматривается частный случай автокорреляции, когда коэффициенты ковариации ошибок зависят только от расстояния во времени меж ду наблюдениями;

тогда возникает матрица ковариаций, в которой все элементы каждой диагонали (не только главной) одинаковы1.

Поскольку действие причин, обуславливающих возникновение ошибок, доста точно устойчиво во времени, автокорреляции ошибок, как правило, положительны.

Это ведет к тому, что значения остаточной дисперсии, полученные по стандартным («штатным») формулам, оказываются ниже их действительных значений. Что, как отмечалось и в предыдущем пункте, чревато ошибочными выводами о качестве получаемых моделей.

Это утверждение иллюстрируется рисунком 8.4 (n =1).

На этом рисунке:

a — линия истинной регрессии. Если в первый момент времени истинная ошибка отрицательна, то в силу положительной автокорреляции ошибок все облако наблю дений сместится вниз, и линия оцененной регрессии займет положение b.

Если в первый момент времени истинная ошибка положительна, то по тем же причи нам линия оцененной регрессии сместится вверх и займет положение c. Поскольку В теории временных рядов это называется слабой стационарностью.

x c a b время Рис. 8. 266 Глава 8. Нарушение гипотез основной линейной модели ошибки случайны и в первый момент времени они примерно с равной вероятно стью могут оказаться положительными или отрицательными, то становится ясно, насколько увеличивается разброс оценок регрессии вокруг истинных по сравнению с ситуацией без (положительной) автокорреляции ошибок.

Типичный случай автокорреляции ошибок, рассматриваемый в классической эконометрии, — это линейная авторегрессия ошибок первого порядка AR(1):

i = i-1 + i, где — остатки, удовлетворяющие обычным гипотезам;

— коэффициент авторегрессии первого порядка.

Коэффициент вляется также коэффициентом автокорреляции (первого по рядка).

Действительно, по определению, коэффициент авторегрессии равен (как МНК оценка):

cov(i, i-1) =, var(i-1) но, в силу гомоскедастичности, var(i-1) = var(i)var(i-1) и, следовательно,, также по определению, является коэффициентом автокорреляции.

Если = 0, то i = i и получаем «штатную» ситуацию. Таким образом, проверку того, что автокорреляция отсутствует, можно проводить как проверку нулевой гипотезы H0: =0 для процесса авторегрессии 1-го порядка в ошибках.

Для проверки этой гипотезы можно использовать критерий Дарбина— Уотсона или DW-критерий. Проверяется нулевая гипотеза о том, что автокорре ляция ошибок первого порядка отсутствует. (При автокорреляции второго и более высоких порядков его мощность может быть мала, и применение данного критерия становится ненадежным.) Пусть была оценена модель регрессии и найдены остатки ei, i = 1,..., N.

Значение статистики Дарбина—Уотсона (отношения фон Неймана), или DW-ста тистики, рассчитывается следующим образом:

N (ei - ei-1) i= dc =. (8.3) N e i i= Оно лежит в интервале от 0 до 4, в случае отсутствия автокорреляции ошибок приблизительно равно 2, при положительной автокорреляции смещается в мень 8.3. Автокорреляция ошибок 2 dL dU 4 dU 4 dL Рис. 8. шую сторону, при отрицательной — в большую сторону. Эти факты подтвержда ются тем, что при больших N справедливо следующее соотношение:

dc 2(1 - r), (8.4) где r — оценка коэффициента авторегрессии.

Минимального значения величина dc достигает, если коэффициент авторегрессии равен +1. В этом случае ei = e, i = 1,..., N, и dc = 0. Если коэффициент авторегрессии равен -1 и ei = (-1)ie, i = 1,..., N, то величина dc достигает N - значения 4 (можно достичь и более высокого значения подбором остатков), N которое с ростом N стремится к 4. Формула (8.4) следует непосредственно из (8.3) после элементарных преобразований:

N N N e2 ei-1ei e i i- i=2 i=2 i= dc = - 2 +, N N N e2 e2 e i i i i=1 i=1 i= поскольку первое и третье слагаемые при больших N близки к единице, а второе слагаемое является оценкой коэффициента автокорреляции (умноженной на -2).

Известно распределение величины d, если =0 (это распределение близко к нормальному), но параметры этого распределения зависят не только от N и n, как для t-и F -статистик при нулевых гипотезах. Положение «колокола» функции плотности распределения этой величины зависит от характера Z. Тем не менее, Дарбин и Уотсон показали, что это положение имеет две крайние позиции (рис. 8.5).

Поэтому существует по два значения для каждого (двустороннего) квантиля, соответствующего определенным N и n: егонижняя dL и верхняя dU границы.

Нулевая гипотеза H0: =0 принимается, если dU dc 4- dU ;

она отвергается в пользу гипотезы о положительной автокорреляции, если dc < dL, и в пользу 268 Глава 8. Нарушение гипотез основной линейной модели гипотезы об отрицательной автокорреляции, если dc > 4- dL. Если dL dc

Пусть нулевая гипотеза отвергнута. Тогда необходимо дать оценку матрицы.

Оценка r параметра авторегрессии может определяться из приближенного равенства, следующего из (8.4):

dc r 1 -, или рассчитываться непосредственно из регрессии e на него самого со сдвигом на одно наблюдение с принятием «круговой» гипотезы, которая заключается в том, что eN+1 = e1.

Оценкой матрицы является 1 r r2 · · · rN- r 1 r · · · rN-, 1 - r2 r2 r 1 · · · rN-....

.

.....

.

....

rN-1 rN-2 rN-3 · · · а матрица D преобразований в пространстве наблюдений равна - r2 0 0 · · · -r 1 0 · · · 0 -r 1 · · · 0.

....

.

.....

.

....

0 0 0 · · · Для преобразования в пространстве наблюдений, называемом в данном слу чае авторегрессионным, используют обычно указанную матрицу без 1-й строки, что ведет к сокращению количества наблюдений на одно. В результате такого пре образования из каждого наблюдения, начиная со 2-го, вычитается предыдущее, умноженное на r, теоретическими остатками становятся, которые, по предпо ложению, удовлетворяют гипотезе g4.

8.3. Автокорреляция ошибок После этого преобразования снова оцениваются параметры регрессии. Если новое значение DW-статистики неудовлетворительно, то можно провести следую щее авторегрессионное преобразование.

Обобщает процедуру последовательных авторегрессионных преобразований метод Кочрена—Оркатта, который заключается в следующем.

Для одновременной оценки r, a и b используется критерий ОМНК (в обозна чениях исходной формы уравнения регрессии):

N ((xi - rxi-1) - (zi - rzi-1)a - (1 - r)b)2 min, N i= где zi — n-вектор-строка значений независимых факторов в i-м наблюдении (i-строка матрицы Z).

Поскольку производные функционала по искомым величинам нелинейны от носительно них, применяется итеративная процедура, на каждом шаге которой сначала оцениваются a и b при фиксированном значении r предыдущего шага (на первом шаге обычно r =0), а затем — r при полученных значениях a и b.

Процесс, как правило, сходится.

Как и в случае гетероскедастичности, можно не использовать модифицированные методы оценивания (тем более, что точный вид автокорреляции может быть неиз вестен), а использовать обычный МНК и скорректировать оценку ковариационной матрицы параметров. Наиболее часто используемая оценка Ньюи—Уэста (устой чивая к гетероскедастичности и автокорреляции) имеет следующий вид:

(Z Z)-1 Q (Z Z)-1, где N L N Q = e2 + keiei-k(zizi-k + zi-kzi), i i=1 k=1 i=k+ а k — понижающие коэффициенты, которые Ньюи и Уэст предложили рассчи k тывать по формуле k = 1 -. При k > L понижающие коэффициенты L + становятся равными нулю, т.е. более дальние корреляции не учитываются Обоснование этой оценки достаточно сложно2. Заметим только, что если заменить попарные произведения остатков соответствующими ковариациями и убрать пони жающие коэффициенты, то получится формула ковариационной матрицы оценок МНК.

Приведенная оценка зависит от выбора параметра отсечения L. Внастоящее вре мя не существует простых теоретически обоснованных методов для такого выбора.

/ T На практике можно ориентироваться на грубое правило L = 4.

Оно связано с оценкой спектральной плотности для многомерного временного ряда.

270 Глава 8. Нарушение гипотез основной линейной модели 8.4. Ошибки измерения факторов Пусть теперь нарушается гипотеза g2, и независимые факторы наблюдаются с ошибками. Предполагается, что изучаемая переменная зависит от истинных зна чений факторов (далее в этом пункте используется сокращенная форма уравнения регрессии), 0, а именно:

x = 0 +, но истинные значения неизвестны, а вместо этого имеются наблюдения над неко торыми связанными с 0 переменными :

= 0 + z, где z — вектор-строка длиной n ошибок наблюдений.

В разрезе наблюдений:

X = Z0 +, Z = Z0 + z, где Z0 и z — соответствующие N n-матрицы значений этих величин по на блюдениям (т.е., в зависимости от контекста, z обозначает вектор или матрицу ошибок).

Предполагается, что ошибки факторов по математическому ожиданию равны нулю, истинные значения регрессоров и ошибки независимы друг от друга (по край ней мере не коррелированы друг с другом) и известны матрицы ковариации:

E(z) =0, E(0, ) =0, E(0, z) =0, (8.5) E(0, 0) =M0, E(, z) =, E(, ) =.

z z Важно отметить, что эти матрицы и вектора ковариации одинаковы во всех наблюдениях, а ошибки в разных наблюдениях не зависят друг от друга, т.е. речь, фактически, идет о «матричной» гомоскедастичности и отсутствии автокорреляции ошибок.

Через наблюдаемые переменные x и уравнение регрессии записывается в следующей форме:

x = + - z. (8.6) В такой записи видно, что «новые» остатки не могут быть независимыми от факто ров-регрессоров, т.е. гипотезы основной модели регрессии нарушены. В рамках 8.4. Ошибки измерения факторов сделанных предположений можно доказать, что приближенно E(a) (M0 +)-1(M0 + ) = +(M0 +)-1( - ), (8.7) т.е. МНК-оценки теряют в такой ситуации свойства состоятельности и несмещен ности3, если = (в частности, когда ошибки регрессии и ошибки факторов не коррелированны, т.е. когда =0, а и отличны от нуля).

Для обоснования (8.7) перейдем к теоретическому аналогу системы нормальных уравнений, для чего обе части соотношения (8.6) умножаются на транспонирован ную матрицу факторов:

E ( x) =E ( ) + E ( ) - E ( z).

Здесь, как несложно показать, пользуясь сделанными предположениями, E ( ) =M0 +, E ( ) =, E ( z) =, Поэтому E ( x) =E ( ) + - или - E ( )-1 E ( x) = + M0 + ( - ).

Левая часть приближенно равна E(a).

1 Действительно, a = M-1m, гд е M = Z Z и m = Z x. Выборочные ковари N N ационные матрицы M и m по закону больших чисел с ростом числа наблюдений сходятся по вероятности к своим теоретическим аналогам:

p p M -E ( ) и m -E ( x).

По свойствам сходимости по вероятности предел функции равен функции от предела, если функция непрерывна. Поэтому p a = M-1m - E ( )-1 E ( x) =(M0 +)-1(M0 + ).

Существуют разные подходы к оценке параметров регрессии в случае наличия ошибок измерения независимых факторов. Здесь приводятся два из них.

Они смещены даже асимптотически, т.е. при стремлении количества наблюдений к бесконечно стисмещениенестремитсякнулю.

272 Глава 8. Нарушение гипотез основной линейной модели а) Простая регрессия. Если имеется оценка W ковариационной матрицы и w — ковариационного вектора, то можно использовать следующий оператор оценивания:

a =(M - W )-1(m - w), который обеспечивает состоятельность оценок и делает их менее смещенными.

Это формула следует из E ( x) =E ( ) + - заменой теоретических моментов на их оценки.

Обычно предполагается, что W — диагональная матрица, а w =0.

б) Ортогональная регрессия. Поскольку z теперь такие же случайные пере менные, наблюдаемые с ошибками, как и x, имеет смысл вернуться к обозначениям 6-го раздела, где через x обозначался n-мерный вектор-строка всех переменных.

Пусть — вектор их ошибок наблюдения, а x0 — вектор их истинных значений, то есть x = x0 +, X = X0 +.

Предположения (8.5) записываются следующим образом:

E(0, ) =0, E(0, x0) =M0, E(, ) =2.

x x Теперь через M0 обозначается матрица, которую в обозначениях, используемых в этом пункте выше, можно записать следующим образом:

2 m x, m0 M а через 2 матрица.

Поскольку речь идет о линейной регрессии, предполагается, что между истин ными значениями переменных существует линейная зависимость:

x0 =0.

8.5. Метод инструментальных переменных Это означает, что M0 =0.

Рассуждая так же, как при доказательстве соотношения (8.7), легко установить, что E(M) =M0 + 2, (M — фактическая матрица ковариации X) т.е.

(E(M) - 2) =0.

Таким образом, если считать, что известна, а 2 — минимизируемый параметр (в соответствии с логикой МНК), то решение задачи (M - 2)a =0, 2 min!

даст несмещенную оценку вектора. А это, как было показано в пункте 6.4, есть задача регрессии в метрике -1 (см. (6.37)). Преобразованием в пространстве переменных она сводится к «обычной» ортогональной регрессии.

Т.е. если для устранения последствий нарушения гипотезы g4 используется преобразование в пространстве наблюдений, то при нарушении гипотезы g2 надо «работать» с преобразованием в пространстве переменных.

Несмотря на то, что методы ортогональной регрессии и регрессии в метрике -1 в наибольшей степени соответствуют реалиям экономики (ошибки есть во всех переменных, стоящих как в левой, так и в правой частях уравнения регрессии), они мало используются в прикладных исследованиях. Основная причина этого заклю чается в том, что в большинстве случаев невозможно получить надежные оценки матрицы. Кроме того, ортогональная регрессия гораздо сложнее простой с вы числительной точки зрения, и с теоретической точки зрения она существенно менее изящна и прозрачна.

В следующем параграфе излагается еще один метод, который позволяет решить проблему ошибок в переменных (и в целом может использоваться при любых нарушениях гипотезы g2).

8.5. Метод инструментальных переменных Предполагаем, что в регрессии x = z + переменные-факторы z являются случайными, и нарушена гипотеза g2 в обобщенной формулировке: ошибка зави сит от факторов z, так что корреляция между z иошибкой не равна нулю. Такую 274 Глава 8. Нарушение гипотез основной линейной модели регрессию можно оценить, имея набор вспомогательных переменных y, называ емых инструментальными переменными. Часто инструментальные переменные называют просто инструментами.

Для того, чтобы переменные y можно было использовать в качестве инстру ментальных, нужно, чтобы они удовлетворяли следующим требованиям:

1) Инструменты y некоррелированы с ошибкой. (В противном случае метод даст несостоятельные оценки, как и МНК.) Если это условие не выполнено, то такие переменные называют негодными инструментами4.

2) Инструменты y достаточно сильно коррелированы с факторами z. Если данное условие не выполнено, то это так называемые «слабые» инструменты.

Если инструменты слабые, то оценки по методу будут неточными и при малом количестве наблюдений сильно смещенными.

Обычно z и y содержат общие переменные, т.е. часть факторов используется в качестве инструментов. Например, типична ситуация, когда z содержит константу;

тогда в y тоже следует включить константу.

Пусть имеются N наблюдений, и X, Z и Y — соответствующие данные в матричном виде. Оценки по методу инструментальных переменных (сокращенно IV от англ. instrumental variables) вычисляются по следующей формуле:

-1 -1 - aIV = Z Y Y Y Y Z Z Y Y Y Y X. (8.8) В случае, если количество инструментальных переменных в точности равно количеству факторов, ( rank Y = n +1) получаем собственно классический ме тод инструментальных переменных. При этом матрица Y Z квадратная и оценки вычисляются как -1 -1 - aIV = Y Z Y Y Z Y Z Y Y Y Y X.

Средняя часть формулы сокращается, поэтому - aIV = Y Z Y X. (8.9) Рассмотрим вывод классического метода инструментальных переменных, т.е. случай точной идентификации (ср. с (6.15) в главе 6):

Умножим уравнение регрессии x = z + слева на инструменты y (с транс понированием). Получим следующее уравнение:

y x = y z + y.

В модели ошибок в переменных ошибка регрессии имеет вид - z, гд е —ошибка в исходном уравнении, а z — ошибка измерения факторов z. Чтобы переменные y можно было использовать в качестве инструментов, достаточно, чтобы y были некоррелированы с и z.

8.5. Метод инструментальных переменных Если взять от обеих частей математическое ожидание, то получится E(y x) =E(y z), где мы учли, что инструменты некоррелированы с ошибкой, E(y ) =0.

Заменяя теоретические моменты на выборочные, получим следующие нормаль ные уравнения, задающие оценки a:

Myx = Myza, 1 где Myx = Y X и Myz = Y Z. Очевидно, что эти оценки совпадут с (8.9).

N N Фактически, мы применяем здесь метод моментов.

Метод инструментальных переменных можно рассматривать как так называе мый двухшаговый метод наименьших квадратов. (О нем речь еще пойдет ниже в пункте 10.3.) 1-й шаг. Строим регрессию каждого фактора Zj на Y. Получим в этой ре c грессии расчетный значения Zj. По формуле расчетных значений в регрессии c Zj = Y (Y Y )-1 Y Z. Заметим, что если Zj входит в число инструментов, то по c этой формуле получим Zj = Zj, т.е. эта переменная останется без изменений.

Поэтому данную процедуру достаточно применять только к тем факторам, которые не являются инструментами (т.е. могут быть коррелированы с ошибкой). В целом для всей матрицы факторов можем записать Zc = Y (Y Y )-1 Y Z.

2-й шаг. В исходной регрессии используются Zc вместо Z. Смысл состоит в том, чтобы использовать факторы «очищенные от ошибок».

Получаем следующие оценки:

- a2M = Zc Zc Zc x = -1 -1 -1 - = Z Y Y Y Y Y Y Y Y Z Z Y Y Y Y x = -1 -1 - = Z Y Y Y Y Z Z Y Y Y Y x = aIV.

Видим, что оценки совпадают.

Если записать оценки в виде aIV =(Zc Z)-1 Zc x, то видно, что обобщенный методинструментальных переменных можно рассматривать как простой методин струментальных переменных с матрицей инструментов Zc.

Такая запись позволяет обосновать обобщенный метод инструментальных пе ременных. Если исходных инструментов Y больше, чем факторов Z, и мы хотим построить на их основе меньшее количество инструментов, то имеет смысл сопо ставить каждому фактору Zj в качестве инструмента такую линейную комбинацию исходных инструментов, которая была бы наиболее сильно коррелирована с Zj.

c Этому требованию как раз и удовлетворяют расчетные значения Zj.

276 Глава 8. Нарушение гипотез основной линейной модели Другое обоснование обобщенного метода инструментальных переменных со стоит, как и выше для классического метода, в использовании уравнений E(y x) = = E(y z). Заменой теоретических моментов выборочными получим уравнения Myx = Myza, число которых больше числа неизвестных. Идея состоит в том, чтобы невязки Myx - Myza были как можно меньшими. Это достигается минимизацией следующей квадратичной формы от невязок:

- (Myx - Myza) Myy (Myx - Myza), где Myy = Y Y. Минимум достигается при N - -1 - a = MzyMyy Myz MzyMyy Myx.

Видим, что эта формула совпадает с (8.8). Эти рассуждения представляют собой применение так называемого обобщенного метода моментов, в котором количе ство условий на моменты может превышать количество неизвестных параметров.

Чтобы можно было использовать метод инструментальных переменных на практике, нужна оценка ковариационной матрицы, с помощью которой можно было бы вычислить стандартные ошибки коэффициентов и t-статистики. Такая оценка имеет вид - MaIV = s2 Zc Zc.

Здесь s2 — оценка дисперсии ошибок 2, например s2 = e e/N или s2 = = e e/(N - 1). Остатки рассчитываются по обычной формуле e = x - ZaIV.

(Здесь следует помнить, что остатки, получаемые на втором шаге тут не годят ся, поскольку они равны x - ZcaIV. Если использовать их для расчета оценки дисперсии, то получим заниженную оценку дисперсии и ковариационной матрицы.

Отсюда следует, что из регрессии второго шага можно использовать только оценки коэффициентов. Стандартные ошибки и t-статистики требуется пересчитывать.) Обсудим теперь более подробно проблему идентификации5.

Чтобы можно было вычислить оценки (8.8), нужно, чтобы выполнялись следу ющие условия:

1) Матрица инструментов должна иметь полный ранг по столбцам, иначе (Y Y )-1 не существует.

2) Z Y (Y Y )-1 Y Z должна быть невырожденной.

В частности, матрица Z Y (Y Y )-1 Y Z необратима, когда rank Y < rank Z.

Предположим, что матрица факторов Z имеет полный ранг, т.е. rank Z = n+1.

См. также обсуждение идентификации в контексте систем уравнений ниже в пункте 10.2.

8.5. Метод инструментальных переменных Т.е. если rank Y < n +1, то уравнение неидентифицируемо, т.е. невозмож но вычислить оценки (8.8). Таким образом, количество инструментов (включая константу) должно быть не меньше n +1 (количество регрессоров, включая кон станту). Если rank Y > n +1, то говорят, что уравнение сверхидентицировано.

Если количество инструментов равно n +1, то это точная идентификация.

Если возможен случай сверхидентификации, то это обобщенный метод инстру ментальных переменных. При точной идентификации ( rank Y = n +1) получаем собственно классический метод инструментальных переменных.

Таким образом, необходимое условие идентификации имеет следующий вид:

rank Y rank Z(= n +1).

Это так называемое порядковое условие идентификации, условие на размерность матриц.

Словесная формулировка порядкового условия:

Количество инструментов Y должно быть не меньше количества ре грессоров Z (учитывая константу).

Заметим, что можно сначала «вычеркнуть» общие переменные в Z и Y и смотреть только на количество оставшихся. Количество оставшихся инструментов должно бытьнеменьшеколичестваоставшихся регрессоров.

Почему это только необходимое условие? Пусть, например, некоторый фактор c Zj ортогонален Y. Тогд а Zj =0, и невозможно получить оценки aIV, т.е. данное условие не является достаточным.

Необходимое и достаточное условие идентификации формулируется следую щим образом:

Матрица Zc имеет полный ранг по столбцам: rank Zc = n +1.

Это так называемое ранговое условие идентификации.

Встречаются случаи, когда ранговое условие идентификации соблюдается, но матрица Zc близка к вырожденности, т.е. в Zc наблюдается мультиколли неарность. Например, если инструмент Zj является слабым ( Zj и Y почти ор тогональны), то Zc близка к вырожденности. Один из способов проверки того, является ли инструмент слабым, состоит в анализе коэффициентов детерминации и F -статистик в регрессиях на первом шаге.

278 Глава 8. Нарушение гипотез основной линейной модели 8.6. Упражнения и задачи Упражнение Дано уравнение регрессии X = Z + = -1.410z1 + +0.080z2 +56.962 +, гд е — вектор-столбец нормальный Таблица 8. случайных ошибок с нулевым средним и ковариационной мат рицей Z1 Z2 26.8 541 1 E = 2= 25.3 616 1 2 · · · N- 25.3 610 1 · · · N- 31.1 636 = (8.10) 1 - 2 2 1 · · · N- 33.3 651....

.

.....

.

....

31.2 645 N-1 N-2 N-3 · · · 29.5 653 30.3 682 с =0.9 и 2 =21.611.

29.1 604 Используя нормальное распределение с незасисимыми на блюдениями, средним 0 и ковариационной матрицей (8.10), 23.7 515 получите 100 выборок вектора размерности (N 1), 15.6 390 k =1,..., 100, где N = 20. Эти случайные векторы потом используйте вместе с известным вектором = 13.9 364 =(-1.410, 0.080, 56.962) и матрицей регрессоров (табл. 8.1).

18.8 411 Сначала получите ожидаемое значения X0 = Z, затем, 27.4 459 1 чтобы получить 100 выборок вектора X размерности (20 1), добавьте случайные ошибки: X0 + = X.

26.9 517 1.1. Рассчитайте невырожденную матрицу D такую, что 27.7 551 D-1D -1 =.

24.5 506 1.2. Найдите истинную матрицу ковариации для МНК-оценки 22.2 538 (a =(Z Z)-1 Z X):

19.3 576 E (a - )(a - ) = 24.7 697 - - = E Z Z Z Z Z Z = -1 - = 2 Z Z Z Z Z Z 8.6. Упражнения и задачи и истинную матрицу ковариации для ОМНК-оценки - (aомнк = Z -1Z Z -1X):

- E (aомнк - )(aомнк - ) = 2 (Z D DZ) =2 Z -1Z.

Результат поясните.

1.3. Используйте 10 из 100 выборок, чтобы посчитать по каждой выборке зна чения следующих оценок:

– МНК-оценки a =(Z Z)-1 Z X;

– ОМНК-оценки - aомнк = Z -1Z Z -1X;

– МНК-оценки остаточной дисперсии (x - Za)(x - Za) 2 = ;

e N - n - – ОМНК-оценки остаточной дисперсии (x - Zaомнк)-1 (x - Zaомнк) 2 =.

ej омнк N - n - Объясните результаты.

1.4. Вычислите среднее и дисперсию для 10 выборок для каждого из параметров, полученных в упражнении 1.3 и сравните эти средние значения с истинными параметрами.

1.5. На основе упражнения 1.3 рассчитайте Sa1 омнк, который является первым -1 диагональным элементом матрицы 2 Z -1Z и Sa1, который явля e омнк ется первым диагональным элементом матрицы 2 (Z Z)-1. Сравните раз e 2 личные оценки Sa1 и Sa1 омнк друг с другом и с соответствующими значени ями из упражнения 1.2.

1.6. На основе результатов упражнений 1.3 и 1.5 рассчитайте значения t-статис тики, которые могут быть использованы для проверки гипотез: H0 : 1 =0.

1.7. Повторите упражнение 1.3 для всех 100 выборок, постройте распределения частот для оценок и прокомментируйте результаты.

280 Глава 8. Нарушение гипотез основной линейной модели Упражнение Предположим, есть данные, состоящие из 100 выборок X, по 20 значений в каждой, сгенерированных при помощи моде Таблица 8. ли X = Z + = 1z1 + 2z2 +1N +, гд еi — нормально и независимо распределенная случайная величина с E (i) =0, z1 z2 1N 2 E 2 = i и i = e(1zi2+2). Наблюдения за X были полу i 13,9 364 1 чены с использованием следующих значений параметров: = =(1 2 ) =(-1.410, 0.080, 56.962) и =(1 2) = 15,6 390 = (0.25, -2), а матрица значений факторов, упорядоченных 18,8 411 в соответствии с величиной z2, имеет следующий вид (табл.

8.2).

27,4 459 24,5 506 2.1. Найдите матрицу ковариации для - 23,7 515 – ОМНК-оценки aомнк = Z -1Z Z -1X;

26,9 517 – МНК-оценки a =(Z Z)-1 Z X.

22,2 538 Что вы можете сказать об относительной эффективности 26,8 541 этих оценок?

27,7 551 2.2. Используйте 10 из 100 выборок, чтобы посчитать по каждой выборке значения следующих оценок:

19,3 576 29,1 604 1 – МНК-оценки a =(Z Z)-1 Z X;

- N N 25,3 610 – оценки = yiyi yi ln(e2), где yi = i i=1 i= 25,3 616 =(zi2, 1) и ei = xi - zia;

31,1 636 – ОМНК-оценки a, используя найденую оценку.

31,2 645 Сравните все эти оценки друг с другом и с соответствую 33,3 651 щими истинными значениями.

29,5 653 2.3. На основе упражнения 2.2 рассчитайте Sa1 омнк, кото рый является первым диагональным элементом матри 30,3 682 цы 2 (Z -1Z)-1, Sa1, который является первым e омнк 24,7 697 диагональным элементом матрицы 2 (Z Z)-1, а также e Sa1 Уайта, который является первым диагональным эле ментом скорректированной оценки ковариационной матрицы (оценка Уайта или устойчивая к гетероскедастичности оценка). Сравните различные оцен 2 2 ки Sa1, Sa1 омнк и Sa1 Уайта друг с другом и с соответствующими значениями из упражнения 2.1.

8.6. Упражнения и задачи 2.4. На основе результатов упражнений 2.1 и 2.3 рассчитайте значения t-статис тики, которые могут быть использованы для проверки гипотез H0 : 1 =0.

2.5. Возьмите те же выборки, что и в упражнении 2.2, и проведите проверку на гетероскедастичность с помощью:

– критерия Бартлета;

– метода второй группы (метод Голдфельда—Квандта) с пропуском 4-х значений в середине выборки;

– метода третьей группы (метод Глейзера).

2.6. Выполните упражнение 2.2 для всех 100 выборок и, используя результаты, оцените математическое ожидание и матрицу среднеквадратических ошибок для каждой оценки. Есть ли среди оценок смещенные? Что можно сказать об относительной эффективности МНК-оценки и ОМНК-оценки?

Упражнение Предположим, есть данные, состоящие из 100 выборок X, по 20 значений в каждой, сгенерированных при помощи модели X = Z+ = 1z1+2z2+1N + +, гд е i = i-1 + i, и — нормально распределенная случайная величина 2 с E (i) = 0, E i =. Наблюдения за X были получены с использованием следующих значений параметров: = (1 2 ) = (-1.410, 0.080, 56.962), =0.8 и =6.4, а матрица значений факторов взята из упражнения 1.

3.1. Найдите матрицу ковариации для:

- – ОМНК-оценки aомнк = Z -1Z Z -1X;

– МНК-оценки a =(Z Z)-1 Z X.

Что вы можете сказать об относительной эффективности этих оценок?

3.2. Используйте 10 из 100 выборок, чтобы посчитать по каждой выборке зна чения следующих оценок:

– МНК-оценки a =(Z Z)-1 Z X;

N eiei- i= – оценку r = ;

N e i i= – ОМНК-оценки, используя найденую оценку r.

282 Глава 8. Нарушение гипотез основной линейной модели Сравните все эти оценки друг с другом и с соответствующими истинными значениями.

3.3. Возьмите те же выборки, что и в упражнении 3.2, и проверьте гипотезу об ав токорреляции ошибок.

3.4. Найдите скорректированную оценку ковариационной матрицы, устойчивую к гетероскедастичности и автокорреляции (оценку Ньюи—Уэста).

3.5. Выполните упражнение 3.2 для всех 100 выборок и, используя результаты, оцените математическое ожидание и матрицу среднеквадратических ошибок для каждой оценки. Есть ли среди оценок смещенные? Что можно сказать об относительной эффективности МНК-оценки и ОМНК-оценки?

Упражнение 0 0 Для уравнения X = Zo+ = -1.410z1 +0.080z2 +1N56.962+, z1 = z1 +z1, z2 = z2 + z2 и при предположении, что i N(0, 21.611), z1 N(0, 21.700) и z2 N(0, 21.800), были генерированы 20 значений выборки. Результаты при ведены в таблице 8.3.

Предполагая, что истинная матрица факторов Z0 неизвестна, выполните сле дующие задания:

4.1. Найдите МНК-оценки a =(Z Z)-1 Z X параметров уравнения регрессии X = Z + = 1z1 + 2z2 +1N +.

4.2. Рассчитайте ковариационную матрицу ошибок измерения факторов — W и ковариационный вектор — w и оцените параметры регрессии как a =(M - W )-1(m - w).

4.3. Найдите оценку через ортогональную регрессию.

4.4. Сравните эти все оценки друг с другом и с соответствующими истинными значениями.

Задачи 1. Какие свойства МНК-оценок коэффициентов регрессии теряются, если ошибки по наблюдениям коррелированы и/или имеют разные дисперсии?

2. Как оцениваются параметры уравнения регрессии, если известна матрица ковариации ошибок и она не диагональна с равными элементами по диа гонали?

8.6. Упражнения и задачи Таблица 8. 0 N z1 z2 z1 z2 z1 z2 X 1 26.19 1.96 37.94 13.9 364 15.86 401.94 92. 2 6.94 –5.94 3.57 15.6 390 9.66 393.57 73. 3 5.55 –13.85 –18.78 18.8 411 4.95 392.22 68. 4 14.00 24.48 14.49 27.4 459 51.88 473.49 69. 5 0.89 23.91 51.48 24.5 506 48.41 557.48 63. 6 46.61 –32.80 10.99 23.7 515 –9.10 525.99 111. 7 –20.52 13.27 11.07 26.9 517 40.17 528.07 39. 8 10.15 –16.17 18.86 22.2 538 6.03 556.86 78. 9 –13.95 –28.22 –18.57 26.8 541 –1.42 522.43 48. 10 14.94 20.64 –10.89 27.7 551 48.34 540.11 76. 11 19.38 –36.99 –0.91 19.3 576 –17.69 575.09 95. 12 5.72 –32.44 –12.71 29.1 604 –3.34 591.29 69. 13 1.08 25.91 7.70 25.3 610 51.21 617.70 71. 14 11.07 10.90 9.24 25.3 616 36.20 625.24 81. 15 5.81 –42.77 8.25 31.1 636 –11.67 644.25 69. 16 27.21 25.63 –29.14 31.2 645 56.83 615.86 91. 17 –11.63 –13.07 13.20 33.3 651 20.23 664.20 50. 18 –4.24 10.27 –37.62 29.5 653 39.77 615.38 63. 19 46.56 44.81 33.93 30.3 682 75.11 715.93 115. 20 –7.57 –40.10 –6.34 24.7 697 –15.40 690.66 70. 284 Глава 8. Нарушение гипотез основной линейной модели 3. Рассматривается регрессионная модель X = Z +. Пусть = AX — это любая несмещенная оценка параметра. Полагая, что E ( ) =2, покажите, что матрица ковариации превышает матрицу ковариации омнк =(Z -1Z)-1Z -1X на какую-то положительно полуопределенную матрицу.

(x - z) -1 (x - z) 4. Докажите, что омнк = есть оценка 2.

N - n - 5. Какое преобразование матрицы наблюдений перед оценкой регрессии полез но сделать, если среднеквадратические отклонения ошибок регрессии про порциональны какому-либо фактору?

6. Оценивается регрессия по 10 наблюдениям. Известно, что дисперсия оши бок для первых 5 наблюдений в два раза больше, чем дисперсия ошибок остальных 5 наблюдений. Опишите процедуру оценивания этой регрессии.

7. Рассмотрите регрессию xt = 1t + + t, t =1,..., 5, где E(t) =0, E(2) =2t2, E(ts) =0, при t = s.

t Пусть =(1, 2, 3, 4, 5) и E( ) =2.

– определите ;

– найдите -1;

– найдите матрицу ковариации МНК-оценки параметра = ;

– найдите матрицу ковариации ОМНК-оценки параметра =.

8. Рассмотрите регрессию xt = 1t + t, t =1,..., 5, где E(t) =0, E(2) =2t2, E(ts) =0, t = s. Если x =(6, 4, 9, 8, 7) :

t – определите оценку МНК для 1 и ее дисперсию;

– определите оценку ОМНК для 1 и ее дисперсию;

– сравните эти оценки друг с другом и сделайте вывод.

9. Рассматривается модель X = Z +, гд е i — нормально и независимо распределенная случайная величина с E (i) =0 и E 2 = i = eyi.

i 8.6. Упражнения и задачи 4 2 1 2 8 5 1 3 В предположении, что X =, Z = 6 2 1, Y = 1 1, 2 1 1 0 9 10 1 2 – найдите МНК-оценки a =(Z Z)-1 ZX;

- – найдите ОМНК-оценки aомнк = Z -1Z Z -1X;

– постройте два 95%-х доверительных интервала для 1: один непра вильный, основанный на результатах МНК, а другой правильный, осно ванный на результатах ОМНК;

– проверьте гипотезу 1 =0.

10. Параметры трехфакторного уравнения регрессии оценены по 20 наблю дениям. S1 и S2 — остаточные дисперсии по первой и второй половинам временного ряда. В каком случае гипотезы о гомоскедастичности следует отвергнуть?

11. Приведите примеры графиков зависимостей ошибки от времени в авторе гресионной схеме первого порядка для случаев, когда модуль коэффициента авторегрессии превышает единицу. Что можно сказать об автокорреляции ошибок, если этот коэффициент равен нулю?

12. Ошибка в регрессии задана процессом i = 0.6i-1 + i, и — нор 2 мально распределенная случайная величина с E(i) = 0, E(i ) = и i =1,..., 5. Как выглядит матрица преобразования в пространстве пе ременных для ОМНК?

13. Проверьте, что D D =-1, гд е - r2 0 0 · · · -r 1 0 · · · D = 0 -r 1 · · · 0,....

.

.....

.

....

0 0 0 · · · 286 Глава 8. Нарушение гипотез основной линейной модели 1 r r2 · · · rN- r 1 r · · · rN- =.

1 - r2 r2 r 1 · · · rN-....

.

.....

.

....

rN-1 rN-2 rN-3 · · · 14. Найдите D0D0,где D0 — это матрица размерности (N -1)N, полученная из матрицы D путем удаления первой строки, и сравните ее с матрицей -1.

15. Какое преобразование матрицы наблюдений перед оценкой регрессии полез но сделать, если ошибки в каждом наблюдении имеют одинаковую дисперсию и коррелированы с ошибками в предыдущем наблюдении?

16. Почему при использовании критерия Дарбина—Уотсона требуется знать два критических значения для расчетной статистики?

17. Фактическое значение dc статистики Дарбина—Уотсона равно 0.5. Чтоэто означает? Какое преобразование следует применить к этой модели (запишите формулу)?

18. В регрессионной модели X = Z + существует автокорреляции ошибок первого порядка и =0.6. Предположим, что 4 2 8 5 X =, Z = 6 2 1, 2 1 9 10 – найдите преобразованные наблюдения Dx и Dz;

– найдите ОМНК-оценки параметра ;

– найдите фактическое значение dc статистики Дарбина—Уотсона по остаткам после применения ОМНК.

8.6. Упражнения и задачи 19. Положим, построили регрессию для N =20 и n =4 инашлиоценку N eiei- i= z = =0.5, e e =40, e2 =1, e2 =4.

1 N N e i i= Найдите фактическое значение dc статистики Дарбина—Уотсона и с ее по мощью проведите тест на автокорреляцию.

20. На основе годовых данных 1959–1983 годов были оценены следующие функ ции спроса на продовольственные товары.

ln Qt = 2.83 - 0.47 ln PFt + 0.64 ln Yt, (6.69) (-3.94) (24.48) R2 =0.987, DW = dc =0.627, ln Qt = 1.87 - 0.36 ln PFt + 0.38 ln Yt + 0.44Qt-1, (3.24) (-2.79) (3.20) (24.10) R2 =0.990, DW = dc =1.65, где Q — спрос на продукты питания, PF — цены на продукты питания, Y — доход, в скобках приведены значения t-статистики.

Проверьте каждое уравнение на наличие автокорреляции первого порядка и дайте короткий комментарий результатов.

21. Пусть остатки в регрессии xi = + zi + i равны (1, 2, 0, -1, -2).

Опишите первый шаг метода Кочрена—Оркарта.

22. Денежная масса измеряется с ошибкой. Как смещен коэффициент зависимо сти динамики цен от динамики денежной массы относительно его истинного значения?

23. Пусть в парной линейной регрессии ошибки зависимой переменной и фактора независимы и имеют одинаковую дисперсию. Запишите задачу для нахожде ния оценок коэффициентов данной регрессии (с объяснением обозначений).

Рекомендуемая литература 1. Айвазян С.А. Основы эконометрики. Т.2. — М.: Юнити, 2001. (Гл. 2) 288 Глава 8. Нарушение гипотез основной линейной модели 2. Демиденко Е.З. Линейная и нелинейная регрессия. — М.: «Финансы и ста тистика», 1981. (Гл. 1).

3. Джонстон Дж. Эконометрические методы. — М.: «Статистика», 1980.

(Гл. 7, 8).

4. Доугерти К. Введение в эконометрику. — М.: «Инфра-М», 1997. (Гл. 7).

5. Дрейпер Н., Смит Г. Прикладной регрессионный анализ: В 2-х книгах.

Кн.1 — М.: «Финансы и статистика», 1986. (Гл. 2, 3).

6. Кейн Э. Экономическая статистика и эконометрия. — М.: «Статистика», 1977. Вып. 2. (Гл. 15).

7. Лизер С. Эконометрические методы и задачи. — М.: «Статистика», 1971.

(Гл. 2).

8. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика — начальный курс. — М.: Дело, 2000. (Гл. 6, 7, 9).

9. Маленво Э. Статистические методы эконометрии. Вып. 1. — М.: «Стати стика», 1975. (Гл. 10).

10. Тинтер Г. Введение в эконометрию. — М.: «Статистика», 1965. (Гл. 6).

11. Baltagi, Badi H. Econometrics, 2nd edition, Springer, 1999. (Ch. 5).

12. Davidson, Russel, Mackinnon, James. Estimation and Inference in Econo metrics, N 9, Oxford University Press, 1993. (Ch. 16).

13. William E., Griffiths R., Carter H., George G. Judge Learning and Practicing econometrics, N 9 John Wiley & Sons, Inc., 1993. (Ch. 9, 15, 16).

14. Greene W.H. Econometric Analysis, Prentice-Hall, 2000. (Ch. 9, 12, 13).

15. Judge G.G., Hill R.C., Griffiths W.E., Luthepohl H., Lee T. Introduction to the Theory and Practice of Econometric. John Wiley & Sons, Inc., 1993. (Ch 8, 9).

16. Maddala G.S. Introduction to Econometrics, 2nd ed., Prentice Hall, 1992.

(Ch. 5, 6, 7).

Глава Целочисленные переменные в регрессии 9.1. Фиктивные переменные С помощью фиктивных или псевдопеременных, принимающих дискретные, обычно целые значения, в регрессию включают качественные факторы.

Уточнение обозначений:

Z — N n-матрица наблюдений за «обычными» независимыми факторами;

— n-вектор-столбец параметров регрессии при этих факторах;

Z0 =1N;

0=.

В этих обозначениях уравнение регрессии записывается следующим образом:

X = Z + Z00 +.

Пусть имеется один качественный фактор, принимающий два значения (напри мер: «мужчина» и «женщина», если речь идет о модели некоторой характеристики отдельных людей, или «годы войны» и «годы мира» — в модели, построенной на временных рядах наблюдений, которые охватывают периоды войны и мира и т.д.).

Ставится вопрос о том, влияет ли этот фактор на значение свободного члена ре грессии.

290 Глава 9. Целочисленные переменные в регрессии G ZG = {zij } — N2-матрица наблюдений за качественным фактором (мат G рица фиктивных переменных): zi1 равен единице, если фактор в i-м наблюдении G принимает первое значение, и нулю в противном случае;

zi2 равен единице, если фактор в i-м наблюдении принимает второе значение, и нулю в противном случае.

= — двухкомпонентный вектор-столбец параметров при фиктивных переменных.

Исходная форма регрессии с фиктивными переменными:

X = Z + Z00 + ZG +.

Поскольку сумма столбцов матрицы равна Z0, оценка параметоров непосред ственно по этому уравнению невозможна.

Проводится преобразование фиктивных переменных одним из двух способов.

а) В исходной форме регрессии исключается один из столбцов матрицы фик тивных переменных, в данном случае — первый.

ZG — матрица фиктивных переменных без первого столбца;

1 1 C =.

0 -1 Тогда эквивалентная исходной запись уравнения имеет вид:

X = Z + Z0, ZG C +, и после умножения матрицы C справа на вектор параметров получается за пись уравнения регресии, в которой отсутствует линейная зависимость между факторами-регрессорами:

X = Z + Z00 + ZG +, где 0 = 0 + 1, = 2 - 1.

После оценки этих параметров можно определить значения исходных пара метров 0 и, предполагая, что сумма параметров при фиктивных переменных 9.1. Фиктивные переменные (в данном случае 1+2) равна нулю, т.е. влияние качественного фактора приводит к колебаниям вокруг общего уровня свободного члена:

2 = /2, 1 = -2, 0 = 0 + 2.

б) Предполагая, что сумма параметров при фиктивных переменных равна ну лю, в исходной форме регрессии исключается один из этих параметров, в данном случае — первый.

— вектор-стобец параметров при фиктивных переменных без первого эле мента;

- C =.

Эквивалентная исходной запись уравнения принимает форму:

X = Z + Z00 + ZGC +, и после умножения матрицы C слева на матрицу наблюдений за фиктивными переменными получается запись уравнения регрессии, в которой также отсутствует линейная зависимость между регрессорами:

X = Z + Z00 + ZG +.

После оценки параметров этого уравнения недостающая оценка параметра определяется из условия 1 = -2.

Качественный фактор может принимать больше двух значений. Так, в класси ческой модели выделения сезонных колебаний он принимает 4 значения, в случае поквартальных наблюдений, и 12 значений, если наблюдения проводились по ме сяцам. Матрица ZG в этой модели имеет размерность, соответственно, N 4 или N 12.

Пусть в общем случае качественный фактор принимает k значений. Тогда:

матрица ZG имеет размерность N k, вектор-столбец — размерность k, матрицы ZG и ZG — N (k - 1), вектор-столбцы и — (k - 1);

1 1 k (k +1) матрица C = ;

0 -1k-1 Ik- - k- k (k - 1) матрица C = ;

Ik- 292 Глава 9. Целочисленные переменные в регрессии 0 1 =0, C =, ZGC = ZG.

k Можно показать, что 1 -1 0 k- =, или 0 Ik-1 - 1k- 1 1 (Ik-1 - 1k-1) 0 k- k =, 0 Ik-1 - 1k- k где 1k-1 =1k-11 — (k-1)(k-1)-матрица, состоящая из единиц;

и далее по k- казать, что результаты оценки параметров уравнения с фиктивными переменными при использовании обоих указанных подходов к устранению линейной зависимости факторов-регрессоров одинаковы.

В дальнейшем для устранения линейной зависимости столбцов значений фик тивных переменных используется способ «б».

После оценки регрессии можно применить t-критерий для проверки значимо сти влияния качественного фактора на свободный член уравнения.

Если k слишком велико и приближается к N, то на параметры при фиктив ных переменных накладываются более жесткие ограничения (чем равенство нулю их суммы). Так, например, если наблюдения проведены в последовательные мо менты времени, и вводится качественный фактор «время», принимающий особое значение в каждый момент времени, то ZG = IN, и обычно предполагается, что значение параметра в каждый момент времени (при фиктивной переменной каж дого момента времени) больше, чем в предыдущий момент времени на одну и ту же величину. Тогда роль матрицы C играет N-вектор-столбец T, состоящий из чи сел натурального ряда, начиная с 1, и = TT, гд е T — скаляр. Уравнение регрессии с фактором времени имеет вид (эквивалентная исходной форма уравне ния при использовании способа «б» исключения линейной зависимости фиктивных переменных):

X = Z + Z00 + TT +.

Метод фиктивных переменных можно использовать для проверки влияния ка чественного фактора на коэффициент регрессии при любом обычном факторе. Ис ходная форма уравнения, в которое вводится качественный фактор для параметра, имеет следующий вид:

X = Z + Z00 + ZjZGj +, 9.1. Фиктивные переменные где Zj — j-й столбец матрицы Z;

j — k-вектор-столбец параметров влияния качественного фактора на j;

в векторе j-я компонента теперь обозначает ся 0 — средний уровень параметра j;

— операция прямого произведения j столбцов матриц.

Прямое произведение матриц A B (произведение Кронекера, см. Приложе ние A.1.2), имеющих размерность, соответственно, mA nA и mB nB, есть матрица размерности (mAmB) (nAnB) следующей структуры:

a11B · · · a1n B A..

.

...

.

.

..

am 1B · · · am nAB A A Прямое произведение матриц обладает следующими свойствами:

(A1 · · · Am)(B1 · · · B2) =(A1B1) · · · (AmBm), если, конечно, соответствующие матричные произведения имеют смысл:

(A1 · · · Am) = A · · · A, 1 m (A1 · · · Am)-1 = A-1 · · · A-1, 1 m если все матрицы A квадратны и неособенны.

Прямое произведение столбцов матриц применимо к матрицам, имеющим одинако вое число строк, и осуществляется путем проведения операции прямого произведе ния последовательно с векторами-строками матриц:

A1 B1 A1 B...

...

AB = =.

...

Am Bm Am Bm Эта операция обладает следующим важным свойством:

(A1· · · Am)(B1 · · · B2) =(A1B1)· · · (AmBm).

Приоритет прямого произведения матриц выше, чем обычного матричного произве дения.

При использовании способа «а» эквивалентная исходной форма уравнения имеет вид (форма «а»):

j X = Z-j-j + Z00 + Zj Z0, ZG C +, j 294 Глава 9. Целочисленные переменные в регрессии где Z-j — матрица Z без j-го столбца, -j — вектор без j-го элемента, и после устранения линейной зависимости фиктивных переменных:

X = Z + Z00 + ZjZGCj +.

Все приведенные выше структуры матриц и соотношения между матрицами и векторами сохраняются.

В уравнение регрессии можно включать более одного качественного фактора.

В случае двух факторов, принимающих, соответственно, k1 и k2 значения, форма «б» уравнения записывается следующим образом:

X = Z + Z00 + Z11 + Z22 +, где вместо «G» в качестве индекса качественного фактора используется его номер.

Это уравнение может включать фиктивные переменные совместного влияния качественных факторов (взаимодействия факторов). В исходной форме компонента совместного влияния записывается следующим образом:

Z1Z212, 12 12 12 12 12 где 12 =(11,..., 1k2, 21,..., 2k2,..., k11,..., k1k2) — k1 k2-вектор столбец, а i1i2 — параметр при фиктивной переменной, которая равна 1, если первый фактор принимает i1-е значение, а второй фактор — i2-е значение, и равна 0 в остальных случаях (вектор-столбцом наблюдений за этой переменной является (k1(i1 - 1) + i2)-й столбец матрицы Z1Z2).

Как и прежде, вектор параметров, из которого исключены все компоненты, линейно выражаемые через остальные, обозначается 12. Он имеет размерность (k1 - 1) (k2 - 1) и связан с исходным вектором параметров таким образом:

12 = C1 C212, где C1 и C2 — матрицы размерности k1 (k1 - 1) и k2 (k2 - 1), имеющие описанную выше структуру (матрица C).

Теперь компоненту совместного влияния можно записать следующим образом:

(Z1Z2)(C1 C2)12 =(Z1C1)(Z2C2)12 = Z1Z212 = Z1212, а уравнение, включающее эту компоненту (форма «б») — X = Z + Z00 + Z11 + Z22 + Z1212 +.

Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 10 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.