WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 7 | 8 || 10 |

«Оглавление Введение................................... 11 I Введение в социально-экономическую статистику 15 1. Основные понятия 17 1.1. Краткая историческая справка.. ...»

-- [ Страница 9 ] --

10. Для модели дисперсионного анализа с двумя факторами, первый из которых имеет три уровня, а второй — два, рассчитать матрицу C12.

11. Рассмотрим модель дисперсионного анализа с двумя факторами, первый из которых принимает два уровня, а второй — три уровня. Рассчитайте мат рицы Z1, Z2.

624 Глава 20. Дисперсионный анализ 12. В первой группе 20 человек, а во второй — 30 человек. Дисперсия оценок по «Эконометрии» в первой группе равна 1.5, а во второй — 1. Вычислите остаточную дисперсию в модели дисперсионного анализа.

13. В первой группе 20 человек, а во второй — 30 человек. Средняя оценка по «Эконометрии» в первой группе равна 3.5, а во второй — 4. Вычислите объясненную дисперсию в модели дисперсионного анализа.

14. В первой группе 20 человек, а во второй — 30 человек. Средняя оценка по «Философии» в первой группе равна 4.5, а во второй — 3. Вычислите коэффициенты в модели дисперсионного анализа.

15. В первой группе 20 человек, а во второй — 30 человек. Средняя оценка по «Эконометрии» в первой группе равна 3.5, а во второй — 4. Дисперсия оценок в первой группе равна 1.5, а во второй — 1. Вычислите общую дисперсию оценок двум группам.

16. Проводится дисперсионный анализ без повторений с двумя факторами, один из которых принимает три уровня, а другой — четыре. Как вычисляется статистика для проверки значимости эффектов второго порядка? Какое она имеет распределение (сколько степеней свободы)?

Рекомендуемая литература 1. Болч Б., Хуань К.Дж. Многомерные статистические методы для экономи ки. — М.: «Статистика», 1979. (Гл. 5) 2. Себер Дж. Линейный регрессионый анализ. — М.: «Мир», 1980.

3. Шеффе Г. Дисперсионный анализ. — М.: «Наука», 1980.

Глава Модели с качественными зависимыми переменными При изучении экономических явлений на дезагрегированном уровне (уровне от дельных экономических субъектов) возникает потребность в новых методах. Дело в том, что стандартные эконометрические методы, такие как классическая мо дель регрессии, предназначены для анализа переменных, которые могут прини мать любое значение на числовой прямой, причем предполагается фактически, что распределение изучаемой переменной похоже на нормальное. Модели, в ко торых диапазон значений зависимой переменной ограничен, называют моделями с ограниченной зависимой переменной. Среди них важную роль играют модели, в которых изучаемая переменная дискретна и может принимать только некоторые значения (конечное число), либо даже имеет нечисловую природу (так называемые модели с качественной зависимой переменной). Модели такого рода помогают, в частности, моделировать выбор экономических субъектов. В качестве примера можно привести выбор предприятия: внедрять какую-то новую технологию или нет. Если индивидуальный выбор исследовать методами, предназначенными для непрерывных переменных, то будет неправомерно проигнорирована информация о поведенческой структуре ситуации.

21.1. Модель дискретного выбора для двух альтернатив Анализ дискретного выбора основывается на микроэкономической теории, ко торая моделирует поведение индивидуума как выбор из данного множества аль 626 Глава 21. Модели с качественными зависимыми переменными тернатив такой альтернативы, которая бы максимизировала его полезность. Этот выбор с точки зрения стороннего наблюдателя, однако, не полностью предопре делен. Исследователь не может наблюдать все факторы, определяющие результат выбора конкретного индивидуума. Коль скоро ненаблюдаемые факторы случайны, то выбор двух индивидуумов может быть разным при том, что наблюдаемые фак торы совпадают. С его точки зрения это выглядит как случайный разброс среди индивидуумов с одними и теми же наблюдаемыми характеристиками.

Предполагается, что выбор осуществляется на основе ненаблюдаемой полез ности альтернатив u(x). Если u(1) >u(0), то индивидуум выбирает x =1, если u(1) < u(0), то индивидуум выбирает x = 0. В простейшем случае полезность является линейной функцией факторов: u(1) = z1 и u(0) = z0. Чтобы модель была вероятностной, ее дополняют отклоняющими факторами, так что u(1) = z1 + 1, u(0) = z0 + 0.

Предполагается, что распределение отклонений 1 и 0 непрерывно.

Заметим, что для описания выбора вполне достаточно знать разность между полезностями вместо самих полезностей:

x = u(1) - u(0) = z(1 - 0) +1 - 0 = z +, при этом оказывается, что в основе выбора лежит переменная x, которая пред ставляет собой сумму линейной комбинации набора факторов z и случайного от клонения, имеющего некоторое непрерывное распределение:

x = z +.

Эта переменная является ненаблюдаемой. Наблюдается только дискретная ве личина x, которая связана с x следующим образом: если x больше нуля, то x =1, если меньше, то x =0.

Ясно, что по наблюдениям за x и z мы могли бы оценить коэффициенты только с точностью до множителя. Умножение ненаблюдаемых величин x, и на один и тот же коэффициент не окажет влияния на наблюдаемые величины x и z. Таким образом, можно произвольным образом нормировать модель, например, положить дисперсию ошибки равной единице.

Кроме того, в этой модели есть дополнительный источник неоднозначности:

одним и тем же коэффициентам могут соответствовать разные пары 0 и 1.

Таким образом, можно сделать вывод, что исходная модель выбора принципиально неидентифицируема. Однако это не мешает ее использованию для предсказания результата выбора, что мы продемонстрируем в дальнейшем.

21.1 Оценивание модели с биномиальной зависимой переменной Без доказательства отметим, что если в модели выбора 1 и 0 имеют распре -y деление F (y) =e-e (распределение экстремального значения) и независимы, то = 1 - 0 имеет логистическое распределение. При этом получается модель, называемая логит.

Если 1 и 0 имеют нормальное распределение с параметрами 0 и инеза висимы, то = 1 - 0 имеет стандартное нормальное распределение. При этом получается модель, называемая пробит.

Модели логит и пробит рассматривались в главе 9.

21.2. Оценивание модели с биномиальной зависимой переменной методом максимального правдоподобия Предыдущие рассуждения приводят к следующей модели:

x = z +, 0, x<0, x = 1, x>0.

Пусть F(·) — функция распределения отклонения. Выведем из распреде ления распределение x, а из распределения x — распределение x:

Pr(x =1) =Pr(x>0) = Pr(z + >0) = Pr( >-z) =1 - F(-z).

Для удобства обозначим F (y) =1-F(-y). (При симметричности относитель но нуля распределения будет выполнено F (y) =1 - F(-y) = F(y).) Таким образом, Pr(x =1) =F (z).

Пусть имеются N наблюдений, (xi, zi), i =1,..., N, которые соответствуют этой модели, так что xi имеют в основе ненаблюдаемую величину xi = zi + i.

Предполагаем, что ошибки i имеют нулевое математическое ожидание, одина ково распределены и независимы. Рассмотрим, как получить оценки коэффициен тов методом максимального правдоподобия.

Обозначим через pi = pi() = F (zi). Также пусть I0 = {i| xi =0}, I1 = {i| xi =1}. Функция правдоподобия, то есть вероятность получения наблю дений xi при данных zi, имеет вид:

L() = pi() (1 - pi()).

iI1 iI 628 Глава 21. Модели с качественными зависимыми переменными Вместо самой функции правдоподобия удобно использовать логарифмическую функцию правдоподобия:

ln L() = ln pi() + ln(1 - pi()), iI1 iI которую можно записать как N ln L() = xi ln pi() +(1- xi)ln(1 - pi()). (21.1) i= В результате максимизации этой функции по получаем оценки максималь ного правдоподобия. Условия первого порядка максимума (уравнения правдоподо бия), т.е.

ln L() =0, имеют простой вид:

N f(zi) (xi - pi) zi =0, pi(1 - pi) i= где мы учли, что pi() dF (zi) = = f(zi)zi, d где f — производная функции F (·). Поскольку F (·) представляет собой функцию распределения, то f(·) — плотность распределения.

Можно использовать следующий метод, который дает те же оценки, что и ме тод максимального правдоподобия. Пусть a0 — некоторая приближенная оценка коэффициентов модели. Аппроксимируем функцию F (·) ее касательной в точке zi (т.е. применим линеаризацию):

F (zi) F (zia0) +f(zia0)zi - a0.

Подставим затем эту аппроксимацию в исходную модель:

xi - pi(a) f(zia)zi( - a) +i, или xi - pi(a0) +f(zia0)zia0 f(zia0)zi + i.

21.2 Оценивание модели с биномиальной зависимой переменной При данном a0 это линейная регрессия. Как несложно проверить, дисперсия ошибки i равна pi()(1 - pi()), т.е. ошибки гетероскедастичны. К этой модели можно применить взвешенную регрессию. Следует разделить левую и правую части на корень из оценки дисперсии ошибки i, т.е. на pi(a0)(1 - pi(a0)):

xi - pi(a0) +f(zia0)zia0 f(zia0)zi i +.

pi(a0)(1 - pi(a0)) pi(a0)(1 - pi(a0)) pi(a0)(1 - pi(a0)) Оценивая эту вспомогательную регрессию, мы на основе оценок a0 получим новые оценки, скажем a1. Повторяя эту процедуру, получим последовательность оценок {ak}. Если процедура сойдется, т.е. ak a при k, то a будут оценками максимального правдоподобия.

В качестве оценки ковариационной матрицы оценок a можно использовать - 2 ln L(a) -.

По диагонали этой матрицы стоят оценки дисперсий коэффициентов. На их ос нове обычным способом можно получить аналоги t-статистик для проверки гипо тезы о равенстве отдельного коэффициента нулю. Такой тест будет разновидностью теста Вальда.

Для проверки набора ограничений удобно использовать статистику отноше ния правдоподобия LR =2(ln L(a) - ln L(aR)), гд е ln L(a) — логарифмическая функция правдоподобия из 21.1, a — оценка методом максимума правдоподобия без ограничений, aR — оценка при ограничениях.

Эту же статистику можно использовать для построения показателя каче ства модели, аналогичного F -статистике для линейной регрессии. Она позволя ет проверить гипотезу о равенстве нулю коэффициентов при всех регрессорах, кроме константы. Соответствующая статистика отношения правдоподобия равна LR0 =2(ln L(a) - ln L0), гд е ln L0 — максимум логарифмической функции прав доподобия для модели с одной константой. Она распределена асимптотически как 2 с n степенями свободы, где n — количество параметров в исходной моде ли, не включая константу. Величина ln L0 получается следующим образом. Пусть N — общее количество наблюдений, N0 — количество наблюдений, для которых xi =0, N1 — количество наблюдений, для которых xi =1. Тогда предсказанная вероятность появления xi =1 в модели с одной константой будет равна для всех наблюдений N1/N. Отсюда ln L0 = N0 ln N0 + N1 ln N1 - N ln N.

630 Глава 21. Модели с качественными зависимыми переменными 21.2.1. Регрессия с упорядоченной зависимой переменной Регрессия с упорядоченной зависимой переменной имеет дело с альтернати вами, которые можно расположить в определенном порядке. Например, это могут быть оценки, полученные на экзамене, или качество товара, которое может ха рактеризоваться сортом от «высшего» до «третьего». Будем предполагать, что альтернативы пронумерованы от 0 до S. Переменная x принимает значение s, если выбрана альтернатива s. Предполагается, что в основе выбора лежит нена блюдаемая величина x = z +. При этом x =0 выбирается, если x меньше нижнего (нулевого) порогового значения, x =1, если x попадает в промежуток от нулевого до первого порогового значения и т. д.;

x = S выбирается, если x превышает верхнее пороговое значение:

0, x<0, 1, 0 < x<1, x = · · · S, x>S-1.

Если среди регрессоров z есть константа, то невозможно однозначно иден тифицировать. В связи с этим следует использовать какую-либо нормировку.

Можно, например, положить 0 =0. Это оставляет S - 1 неизвестных пороговых параметров.

Пусть F(·) — функция распределения ошибки. Тогда вероятность того, что x = s, гд е s =1,..., S - 1, равна Pr(x = s) =Pr(s-1

Аналогично для s =0 и s = S получаем Pr(x =0) =Pr( <0 - z) =F(0 - z), Pr(x = S) =Pr(S-1 - z < ) =1 - F(S-1 - z).

Пусть (xi, zi), i =1,..., N — имеющиеся наблюдения. По этим наблюдени ям можно получить оценки максимального правдоподобия. Обозначим pis(, ) =Pr(xi = s).

21.2 Оценивание модели с биномиальной зависимой переменной Соответствующая логарифмическая функция правдоподобия равна S ln L(, ) = ln pis(, ), гд еIs = {i| xi = s}.

s=0 iIs Максимизируя эту функцию по и, получим требуемые оценки.

На практике обычно используют одну из двух моделей: упорядоченный пробит, то есть модель с нормально распределенным отклонением, илиупорядоченный логит, то есть модель, основанную на логистическом распределении.

21.2.2. Мультиномиальный логит Предположим, что принимающий решение индивидуум стоит перед выбором из S альтернатив, s =0,..., S - 1. Предполагается, что выбор делается на основе функции полезности u(s). В линейной модели u(s) = zss, гд е zs — матрица факторов, s — неизвестные параметры. Обычно есть также факторы, не отра женные в zs из-за их ненаблюдаемости, которые тоже влияют на полезность. Такие характеристики представлены случайной ошибкой u(s) =zss + s. При этом x выбирается равным s, если u(s) >u(t), s = t.

В самой простой модели принимается, что ошибки s подчинены распре делению экстремального значения и независимы между собой. Распределение экстремального значения1 в стандартной форме имеет функцию распределе -y ния F (y) =e-e. Распределение экстремального значения обладает следующи ми важными для рассматриваемой модели свойствами: максимум нескольких ве личин, имеющих распределение экстремального значения, также имеет распреде ление экстремального значения, а разность двух величин, имеющих распределе ние экстремального значения, имеет логистическое распределение. Используя эти свойства, можно вывести, что в данной модели ezss Pr(x = s) =.

S- eztt t= Этамод ель называетсямультиномиальным логитом.

Относительно функций zss обычно делаются какие-либо упрощающие до пущения, например, что факторы для всех альтернатив одни и те же, то есть Это «распределение экстремального значения первого рода» (согласно теореме Гнеденко есть еще два распределения экстремального значения) или, как его еще называют, распределение Гумбе ля. Данное распределение также изредка называют распределением Вейбулла. Кроме того, именем Вейбулла называют и другие распределения (в частности, «распределение экстремального значения третьего рода»), поэтому может возникнуть путаница.

632 Глава 21. Модели с качественными зависимыми переменными u(s) =zs + s, или что функция имеет один и тот же вид, коэффициенты в за висимости от s не меняются, а меняются только факторы, определяющие выбор, то есть u(s) =zs + s. В первом случае z можно интерпретировать как харак теристики индивидуума, принимающего решение. Это собственно мультиномиаль ный логит. Во втором случае zs можно интерпретировать как характеристики s-й альтернативы. Этот второй вариант называют условным логитом.

Можно предложить модель, которая включает оба указанных варианта. Обо значим через w характеристики индивидуума, а через zs характеристики s-ой аль тернативы (в том числе те, которые специфичны для конкретных индивидуумов).

Например, при изучении выбора покупателями супермаркета альтернативами яв ляются имеющиеся супермаркеты, w мог бы включать информацию о доходах и т.п., а в zs следует включить информацию о супермаркетах (уровень цен, широта ассортимента и т.п.) и характеристики пары покупатель—супермаркет, такие как расстояние до супермаркета от места жительства потребителя.

Втакоймод ели u(s) =zs + ws + s и вероятности вычисляются по формуле ezs+ws Pr(x = s) =.

S- ezt+wt t= Заметим, что в этой модели есть неоднозначность. В частности, если прибавить к коэффициентам s один и тот же вектор — это все равно, что умножить числи тель и знаменатель на ew. Таким образом, для идентификации модели требуется какая-либо нормировка векторов s. Можно, например, положить 0 =0.

Для оценивания модели используется метод максимального правдоподобия.

Пусть (xi, zi0,..., zi,S-1, wi), i =1,..., N — имеющиеся наблюдения. Обозна чим ezis+wis pis(, ) =Pr(xi = s) =.

S- ezit+wit t= Тогда логарифмическая функция правдоподобия имеет вид S- ln L(, ) = ln pis(, ), гд еIs = {i| xi = s}.

s=0 iIs На основе xi можно ввести набор фиктивных переменных dis, таких что 1, xi = s, dis = 0, xi = s.

21.2 Оценивание модели с биномиальной зависимой переменной В этих обозначениях функция правдоподобия приобретет вид N S- ln L(, ) = dis ln pis(, ).

i=1 s= 21.2.3. Моделирование зависимости от посторонних альтернатив в мультиномиальных моделях Для мультиномиального логита отношение вероятностей двух альтернатив («со отношение шансов») равно Pr(x = s) e(zs+ws) = = e((zs-zt)+w(s-t)).

Pr(x = t) e(zt+wt) Оно зависит только от характеристик этих двух альтернатив, но не от характери стик остальных альтернатив. Это свойство называется независимостью от посто ронних альтернатив. Оно позволяет оценивать мультиномиальные модели на под множестве полного множества альтернатив и получать корректные (состоятель ные) оценки. Однако это свойство мультиномиального логита во многих ситуациях выбора не очень реалистично.

Рассмотрим, например, выбор между передвижением на поезде, на самолете авиакомпании A и на самолете авиакомпании B. Известно, что 50% пассажиров выбирает поезд, 25% — авиакомпанию A и 25% — авиакомпанию B. Допустим, авиакомпании предоставляют примерно одинаковые услуги по схожей цене, и пас сажиры предпочитают одну из двух авиакомпаний по каким-то чисто субъективным причинам. Если авиакомпании объединятся, то естественно ожидать, что соотно шение шансов для поезда и самолета будет равно один к одному. Однако с точки зрения мультиномиального логита соотношение шансов должно остаться два к од ному, поскольку характеристики передвижения поездом и передвижения самолетом остались теми же.

Предложено несколько модификаций этой модели, которые уже не демонстри руют независимость от посторонних альтернатив, и, следовательно, более реали стичны.

Вмод еливложенного логита используется иерархическая структура альтерна тив. В двухуровневой модели сначала делается выбор между группами альтернатив, а затем делается выбор внутри выбранной группы. В приведенном примере есть две группы альтернатив: «самолет» и «поезд». Внутри группы «самолет» дела ется выбор между авиакомпаниями A и B. Группа «поезд» содержит только одну альтернативу, поэтому выбор внутри нее тривиален.

Пусть имеется l групп альтернатив. Обозначим через Sk множество альтерна тив, принадлежащих k-й группе. Безусловная вероятность того, что будет выбрана 634 Глава 21. Модели с качественными зависимыми переменными альтернатива s из группы k в модели вложенного логита, определяется формулой (запишем ее только для условного логита, т.е. модели, где от альтернативы зависят факторы, но не коэффициенты) zk+zs) e( ekezs Pr(x = s) = =.

l l zm+zt) e( em ezt m=1 tSm m=1 tSm Если альтернативы s и t принадлежат одной и той же группе k, то отношение вероятностей равно Pr(x = s) ekezs ezs = =.

Pr(x = t) ekezt ezt Это отношение, как и в обычном мультиномиальном логите, зависит только от характеристик этих альтернатив. В то же время, если альтернативы s и t при надлежат разным группам, k и m соответственно, то отношение вероятностей равно Pr(x = s) ekezs ek+zs = =.

Pr(x = t) emezt em+zt Это отношение зависит, кроме характеристик самих альтернатив, также от ха рактеристик групп, к которым они принадлежат.

Другое направление модификации модели мультиномиального логита исходит из того, что независимость от посторонних альтернатив является следствием двух предположений, лежащих в основе модели: то, что ошибки s одинаково распре делены и, следовательно, имеют одинаковую дисперсию, и то, что они независимы.

Во-первых, можно предположить, что имеет место гетероскедастичность.

(Имеется в виду не гетероскедастичность по наблюдениям, а гетероскедастичность по альтернативам.) Для того чтобы ввести гетероскедастичность в модель, доста точно дополнить распределения ошибок масштабирующими коэффициентами. При этом ошибка s имеет функцию распределения -y/s Fs(y) =e-e.

Поскольку одновременно все s идентифицировать нельзя, то требуется норми ровка. Например, можно принять, что 0 =1. С помощью такой модификации мы получим гетероскедастичную модель с распределением экстремального значения.

Во-вторых, можно предположить, что ошибки s могут быть коррелирован ными друг с другом. Обычно в таком случае используют многомерное нормальное 21.3. Упражнения и задачи распределение ошибок:

.

.

= N(0, ).

.

S- Здесь — ковариационная матрица ошибок, которая обычно предполагается неизвестной. С помощью такой модификации мы получим модель мультиномиаль ного пробита.

Ковариационная матрица не полностью идентифицирована. Дело в том, что, во-первых, важны разности между ошибками, а не сами ошибки, а во-вторых, ковариационная матрица разностей между ошибками идентифицируется только с точностью до множителя. Можно предложить различные варианты нормиров ки. Как следствие нормировки, количество неизвестных параметров в матрице существенно уменьшается. Если в исходной матрице их S(S +1)/2, то после нор мировки остается S(S - 1)/2 - 1 неизвестных параметров.

К сожалению, не существует аналитических формул для расчета вероятностей альтернатив в мультиномиальном пробите. Вероятности имеют вид многомерных интегралов. Обозначим через Bs множество таких ошибок, которые приводят к выбору s-й альтернативы, т.е.

Bs = {|u(s) >u(t), s = t} = {|zss + s >ztt + t, s = t}, а через () — многомерную плотность распределения. Тогда вероятность того, что будет выбрана альтернатива s, равна Pr(x = s) = ()d.

Bs Для вычисления таких интегралов, как правило, используется метод Монте Карло.

21.3. Упражнения и задачи Упражнение В Таблице 9.3 на стр. 306 приведены данные о голосовании по поводу увеличе ния налогов на содержание школ в городе Троя штата Мичиган в 1973 г. Наблю дения относятся к 95-ти индивидуумам. Приводятся различные их характеристики:

Реально требуется вычислить не S-мерный интеграл, а (S - 1)-мерный, поскольку важны не сами ошибки, а разности между ними.

636 Глава 21. Модели с качественными зависимыми переменными Pub = 1, если хотя бы один ребенок посещает государственную школу, иначе 0;

Priv = 1, если хотя бы один ребенок посещает частную школу, иначе 0;

Years — срок проживания в данном районе;

Teach = 1, если человек работает учителем, иначе 0;

LnInc — логарифм годового дохода семьи в долл.;

PropTax — логарифм налогов на имущество в долл. за год (заменяет плату за обучение — плата зависит от имущественного положения);

Yes = 1, если человек проголосовал на референ думе «за», 0, если «против». Зависимая переменная — Yes. В модель включаются все перечисленные факторы, а также квадрат Years.

1.1. Получите приближенные оценки для логита и пробита с помощью линейной регрессии.

1.2. Оцените логит и пробит с помощью ММП и сравните с предыдущим пунктом.

1.3. Вычислите коэффициенты логита через коэффициенты пробита и сравните с предыдущими результатами.

1.4. На основе оценок МП для логита найдите маргинальные значения для Teach, LnInc и PropTax при среднем уровне факторов.

1.5. Постройте график вероятности голосования «за» в зависимости от Years при среднем уровне остальных факторов.

1.6. Постройте аналогичный график маргинального значения Years.

Упражнение Рассматривается модель мультиномиального логита. В модели имеется три аль тернативы: 0, 1 и 2. Для каждой из альтернатив s =0, 1, 2 полезность рассчиты вается по формуле us = zs + s + s, гд е =2, s = s/5, а ошибки s имеют распределение экстремального значения. Поскольку функция распределения для распределения экстремального значения имеет вид F () =e-e, тоошибкимож но генерировать по формуле = - ln (- ln ()), имеет равномерное распределе ние на отрезке [0;

1]. Зависимая переменная x принимает одно из трех возможных значений (0, 1 или 2) в зависимости от того, какая полезность выше.

2.1. Пусть z1 = 0.4, z2 = 0.3, z3 = 0.2. Проверить методом Монте-Карло формулу для вероятностей:

ezs+s Pr(x = s) =, ezt+t t= 21.3. Упражнения и задачи сгенерировав выборку из 1000 наблюдений для x и рассчитав эмпирические частоты.

2.2. Сгенерировать данные по модели, взяв zs N(0, 2) для всех s. Сгенери ровав набор из 1000 наблюдений (xi, z0i, z1i, z2i), гд е i =1,..., 1000, по лучить оценки параметров модели мультиномиального логита, предполагая, что 0 =0. Сравнить с истинными значениями параметров.

Задачи 1. Чему равны оценки максимального правдоподобия по модели логит с одной константой?

2. Запишите 7 терминов, которые имеют отношение к моделям с качественной зависимой переменной.

3. Рассмотрите модель с биномиальной зависимой переменной x, принимаю щей значения 0 или 1 и зависящей от фиктивной переменной z, принимающей значения 0 или 1. Модель включает также константу. Данные резюмируются следующей таблицей (в клетках стоят количества соответствующих наблю дений):

x =0 x = z =0 N00 N z =1 N10 N а) Пусть в основе модели лежит некоторая дифференцируемая функция распределения F (·), заданная на всей действительной прямой. Найдите Pr (x =1) при z =0 ипри z =1.

б) Запишите в компактном виде логарифмическую функцию правдоподо бия.

в) Запишите условия первого порядка для оценок максимального правдо подобия, обозначая F (y) =f (y).

г) Для N00 =15, N01 =5, N10 =5, N11 =15 получите оценки логита методом максимального правдоподобия.

д) Для тех же данных получите оценки пробита методом максимального правдоподобия, используя таблицы стандартного нормального распре деления.

е) Как можно определить, значима ли фиктивная переменная z? Запишите формулу соответствующей статистики и укажите, как она распределена.

638 Глава 21. Модели с качественными зависимыми переменными ж) Получите формулу для приближенных оценок логита методом усредне ния (используя линейность отношения шансов для логита). Сравните с формулой для оценок максимального правдоподобия.

4. Изучается зависимость курения среди студентов от пола. В следующей таб лице приведены данные по 40 студентам:

Пол Количество наблюдений Доля курящих Муж. 20 0. Жен. 20 0. Оцените по этим данным модель логит методом максимального правдоподо бия. Используйте при этом то, что ln 2 = 0.693, ln 3 = 1.099 и ln 11 = 2.398.

5. Пусть переменная x, принимающая значения 0 или 1, зависит от одного фактора z. Модель включает также константу. Данные приведены в таблице:

x 0 0 1 1 0 1 0 1 0 z 1 2 3 4 5 6 7 8 9 Запишите для этих данных логарифмическую функцию правдоподобия моде ли с биномиальной зависимой переменной.

6. Оцените упорядоченный пробит методом максимального правдоподобия по следующим данным:

x 0 1 2 3 количество на- 50 40 45 80 блюдений 7. Модель с биномиальной зависимой переменной имеет вид:

x = z + +, 1, x>0, x = 0, x<0, где z — фиктивная переменная. Связь между x и z задана таблицей (в клет ках указано количество наблюданий):

21.3. Упражнения и задачи x 0 0 24 z 1 32 а) Найдите оценки коэффициентов логита и пробита по методу усреднения сгруппированных наблюдений.

б) Найдите оценки максимального правдоподобия.

в) Проверьте значимость модели в целом по статистике отношения прав доподобия.

8. По некоторым данным был оценен ряд моделей с биномиальной зависимой переменной и факторами z1 и z2. В таблице приведены результаты оцени вания этих моделей методом максимального правдоподобия. В скобках за писаны стандартные ошибки коэффициентов. Прочерк означает, что данный фактор не был включен в модель. В последней строке приведено значение логарифмической функции правдоподобия в максимуме.

Логит Пробит I II III IV V IV VII VIII 1.87 0.28 1.88 0.28 1.14 0.17 1.16 0. Кон станта (0.38) (0.20) (0.38) (0.20) (0.21) (0.12) (0.21) (0.12) –0.08 0.0012 –0.06 0. Z1 — — — — (0.33) (0.19) (0.19) (0.12) –2.00 –1.99 –1.21 –1. Z2 — — — — (0.44) (0.44) (0.24) (0.25) ln L –44.4 –68.2 –44.5 –68.3 –44.2 –68.3 –44.4 –68. Какую из моделей следует выбрать? Обоснуйте свой ответ.

9. Рассмотрите модель дискретного выбора из двух альтернатив с линейной случайной функцией полезности вида:

u(s) =zs + + s, s =0.1, где все ошибки s имеют равномерное распределение U[-, ] и независи мы по уравнениям и по наблюдениям.

а) Найдите вероятности выбора s =0 и s =1 для такой модели.

640 Глава 21. Модели с качественными зависимыми переменными б) Объясните, идентифицируемы ли одновременно параметры, и.

Если нет, то предложите идентифицирующую нормировку.

в) Запишите функцию правдоподобия для этой модели.

10. Покажите, что логарифмическая функция правдоподобия для биномиального логита является всюду вогнутой по параметрам. Какие преимущества дает это свойство?

11. Рассмотрите модель дискретного выбора из двух альтернатив: s =1 и s =2, в основе которого лежит случайная полезность ui(s) =zis + is, предпола гая, что ошибки двух альтернатив коррелированы и распределены нормально:

1i 0 1 N,.

2i 0 12 Какие параметры идентифицируемы? Аргументируйте свой ответ. Предло жите нормировки, которые позволят оценить такую модель биномиального пробита. Каким методом можно оценить такой «коррелированный» пробит?

12. Пусть (·), (·) — функции распределения логистического и стандартного нормального распределения соответственно.

а) Покажите, что выпуклая комбинация F (y) = (1 - )(y) +(y), [0;

1], также задает функцию распределения (удовлетворяющую всем должным требованиям).

б) Постройте на основе F (y) модель, которая охватывает как логит, так ипробит.

в) Запишите логарифмическую функцию правдоподобия для такой модели.

г) Запишите условия первого порядка для оценок максимального правдо подобия.

д) Является ли параметр идентифицируемым? (Аргументируйте свой ответ формально.) 13. Рассмотрите модель дискретного выбора из двух альтернатив с линейной случайной функцией полезности вида:

u(s) =zs + s, s =0.1, где все ошибки 0 и 1 независимы и их функция распределения имеет вид -y F (y) =e-e.

21.3. Упражнения и задачи а) Покажите, что ey Pr 1 - 0

1+ey б) Найдите вероятности выбора s =0 и s =1 для такой модели. Пока жите, что данная модель совпадает с логитом.

14. Пусть в упорядоченном логите зависимая переменная x принимает три зна чения (0, 1, 2). Найдите, как вероятность того, что x =2, зависит от пара метра 1 (границы между 1 и 2), т.е. найдите соответствующее маргинальное значение.

15. Выведите формулу оценок максимального правдоподобия для регрессии с упорядоченной зависимой переменной с одной константой. Для количества наблюдений, соответствующих выбору альтернативы s, используйте обозна чение Ns. (Подсказка: удобно перейти от исходных параметров к вероятно стям ps =Pr (x = s).) 16. Рассмотрите использование упорядоченной регрессии для моделирования ре шения индивидуума о получении образования. Пусть в основе принимаемого решения имеется некоторый индекс, выражающий полезность от образо вания:

Ui = Zi + i, i N(0;

2).

Чем выше индекс, тем более вероятен выбор более высокого уровня об разования. Более конкретно, пусть имеются некоторые известные заранее пороговые значения для индекса, 1 и 2, такие что:

– при Ui >2 индивидуум i заканчивает вуз;

– при 1 < Ui 2 индивидуум i заканчивает среднюю школу, но не получает высшего образования;

– при Ui 1 индивидуум i получает только неполное среднее образо вание.

а) Какой вид может иметь зависимая переменная в такой модели?

б) Покажите, что в данной модели нельзя однозначно идентифицировать как, так и.

в) Можно ли однозначно идентифицировать /?

г) Можно ли однозначно идентифицировать, если положить =1?

642 Глава 21. Модели с качественными зависимыми переменными д) Возможно было бы идентифицировать 1 и 2, если бы они были неиз вестны?

е) Запишите функцию правдоподобия для данной модели.

17. В модели регрессии с упорядоченной зависимой переменной альтернативами были числа s =0,..., S. Как поменяются оценки максимального правдо подобия, если альтернативами будут числа 1, 2, 22,..., 2S? Аргументируйте свой ответ.

18. В выборах участвуют три кандидата: Иванов (s =1), Петров (s =2) и «про тив всех» (s = 0). Перед выборами был проведен опрос населения. Для каждого из опрошенных собраны данные о том, какого он пола (F или M) и за кого собирается голосовать. В результате получено 6 чисел: NsF, NsM (s = 0, 1, 2) — количество женщин и мужчин, собирающихся голосовать за каждого из трех кандидатов. Выведите функцию правдоподобия для соот ветствующей модели мультиномиального логита.

19. С помощью мультиномиального логита изучается выбор индивидуумами спо соба передвижения между домом и работой: пешком, на автобусе или на лич ном автомобиле. Имеются следующие данные: среднее время передвижения от дома до работы для каждого индивидуума каждым из способов и сред ний доход каждого индивидуума. Введите требуемые обозначения и запишите формулы вероятностей выбора каждого из способов передвижения. Предло жите нормировку, которая позволяет идентифицировать модель.

20. Работники кафе быстрого обслуживания «Томато-пицца» могут выбрать один из видов фирменной униформы: брюки или юбку, — причем одного из двух цветов: красного и темно-красного. Какой из моделей вы бы описали такую ситуацию? Объясните.

21. Рассмотрите модель дискретного выбора из трех альтернатив с линейной функцией полезности, соответствующую модели мультиномиального проби та. Предложите нормировки, которые позволят оценить такую модель.

22. В чем состоят преимущества и недостатки мультиномиального пробита по сравнению с мультиномиальным логитом?

Рекомендуемая литература 1. Cramer J.S. The Logit Model for Economists. — Adward Arnold, 1991.

21.3. Упражнения и задачи 2. Davidson R., MacKinnon J.G. Estimation and Inference in Econometrics. — Oxford University Press, 1993. (Ch. 15).

3. Greene W.H. Econometric Analysis. — Prentice-Hall, 2000. (Ch. 8, 19).

4. Maddala G.S. Limited-Dependent and Qualitative Variables in Econometrics, Cambridge University Press, 1983. (Ch. 2, 3, 5).

5. Wooldridge Jeffrey M. Introductory Econometrics: A Modern Approach, 2nd ed. — Thomson, 2003. (Ch. 17).

6. Baltagi, Badi H. Econometrics, 2nd edition, Springer, 1999 (Ch. 13).

7. Ruud Paul A. An Introduction to Classical Econometric Theory, Oxford University Press, 2000 (Ch. 27).

Глава Эффективные оценки параметров модели ARMA В главе 14 «Линейные стохастические модели ARIMA» были рассмотрены два метода оценки параметров моделей ARMA: линейная регрессия для оценивания авторегрессий и метод моментов для общей модели ARMA. Эти методы не обес печивают эффективность оценок параметров модели. Можно предложить способы оценивания, которые дают более точные оценки. Для этого можно использовать метод максимального правдоподобия. Рассмотрению этого метода и посвящена данная глава.

22.1. Оценки параметров модели AR(1) Рассмотрим только случай модели AR(1): xt = t + xt-1, t = 1,..., T, на примере которого хорошо видна и общая ситуация.

Чтобы воспользоваться методом максимума правдоподобия, вычислим плотно сти распределения вероятности наблюдений x1, x2,..., xT :

f(x1,..., xT ) =f(x1) · f(x2|x1) · f(x3|x2) ·... · f(xT |xT -1).

Предположим, что условное распределения xt при известном xt-1 нормально.

В соответствии с моделью AR(1) это распределение имеет среднее xt-1 и дис 22.1. Оценки параметров модели AR(1) персию. Значит, T 1 - (xt-xt-1) f(x1,..., xT ) =f(x1) (2)- · e = t= T - (xt-xt-1) T - t= = f(x1)(2 )- e.

Плотность как функция параметров и является функцией правдоподобия.

Вместо полной плотности f(x1,..., xT ) в качестве приближения рассмотрим плотность условного распределения x2,..., xT, считая x1 заданным, т.е. будем оперировать с f(x2,..., xT |x1).

Тем самым мы потеряем одну степень свободы. Приближенная функция прав доподобия равна T - T -1 - (xt-xt-1)2 - T - - s() 2 2 t= L-(, ) = 2 2 e = 2 2 e, T где s() = (xt - xt-1)2.

t= 2 Максимизируя ее по, выразим через :

s() =.

T - Подставляя это выражение в L-(, ), получим концентрированную функцию правдоподобия:

- T - T - s() Lc () = 2 e-.

T - Максимизация Lc () по эквивалентна минимизации суммы квадратов T T s() = (xt - xt-1)2 = t2. Таким образом, задача сводится к обычному t=2 t= МНК. Минимум этого выражения по равен просто T xtxt- t= =.

T - x t t= Получили условную МНК-оценку. Несложно обобщить этот метод на случай AR(p) при p >1.

646 Глава 22. Эффективные оценки параметров модели ARMA Мы знаем, что в качестве оценки можно использовать выборочную автокор реляцию r1. Но так как условная МНК-оценка несколько иная, в вырожденных случаях можно получить значения || > 1. Это можно обойти, учитывая информа цию о x1. Для этого воспользуемся тем, что частное распределение x1 является нормальным со средним 0 и дисперсией x1 =.

1 - Можно воспользоваться здесь взвешенным МНК. Сумма квадратов остатков после преобразования в пространстве наблюдений равна T h() = 1 - 2 x2 + (xt - xt-1)2.

t= Получим точную МНК-оценку =argmin h().

(1-2 )x - - Плотность частного распределения x1 равна f (x1) = 2 e.

1- - - T h() Отсюда f (x1,..., xT ) = 1 - 2 2 2 2 e2. Будем рассматривать эту плотность как функцию правдоподобия, обозначая через L(, ).

Точную ММП-оценку находим из условия L(, ) max.

, 2 h(). Концентрируя функцию правдоподобия по, Оценкой будет T получим:

- T h () T Lc() = 1 - 2 2 2 e- max!

T Это эквивалентно решению задачи - 1 - 2 T h () min!

h() Отсюда найдем ММП-оценку и =.

T - Множитель 1 - 2 T обеспечивает существование минимума в допустимом интервале -1 < < 1, хотя теперь для нахождения минимума требуются ите рационные процедуры. Для таких процедур оценка r1 может послужить хорошим начальным приближением.

Величина 1 - 2 не зависит от T, и с ростом T множитель (1 - 2)- T стре мится к единице. Поэтому этот множитель существенен при малых объемах выбо рок и || близких к 1. При больших T и || не очень близких к 1 без него можно 22.2. Оценка параметров модели MA(1) обойтись, соглашаясь с незначительными потерями точности оценки, но сильно сокращая объем вычислений. Этим обстоятельством объясняется использование МНК-оценок.

22.2. Оценка параметров модели MA(1) Продемонстрировать общий метод оценивания модели MA(p) можно, рассмат ривая простейший случай модели MA(1): xt = t - t-1.

Отталкиваясь от наблюдений x1, x2,..., xT, воспользуемся методом макси мального правдоподобия (ММП). Для этого необходимо вычислить для модели функцию плотности распределения вероятности. Это легче всего сделать, перейдя от последовательности xt к последовательности t.

x1 = 1 - 0 1 = x1 + 0, x2 = 2 - 1 x2 = 2 - x1 - 20 2 = x2 + x1 + и так далее.

Получаем систему:

1 1 0 0 · · · 0 x 2 2 1 0 · · · 0 x = 0 + 3 3 2 1 · · · 0 x3.

.......

.

........

.

.......

T T T -1 T -2 T -3 · · · 1 xT Это система уравнений относительно. В векторной форме = 0 + Qx, (22.1) где мы обозначили 1 0 0 · · · 2 1 0 · · · = и Q = 3 2 1 · · · 0.

.....

.

......

.

.....

T T -1 T -2 T -3 · · · 648 Глава 22. Эффективные оценки параметров модели ARMA Будем полагать, что t — последовательность независимых случайных величин, имеющих одинаковое нормальное распределение со средним 0 и дисперсией.

Плотность распределения вероятности записывается в виде T - T + 2 t t= f(0,..., T ) =f(0, x1,..., xT ) =(2)- e. (22.2) Метод максимального правдоподобия заключается в нахождении такого значе ния, при котором достигается максимум (22.2), или, что эквивалентно, достигает минимума сумма квадратов T S (|0) = 2 = 2 + = 1+ 2 +2x Q 0 + x Q Qx. (22.3) t 0 t= Необходимо рассмотреть теперь проблему определения величины 0. Первый подход — положить 0 = 0. Тогда требуется минимизировать x Q QX min!

Эта нелинейная задача решается разными вычислительными методами. Полу ченные таким путем решения называется условным МНК-решением, а = =arg min x Q QX — условной МНК-оценкой.

При втором подходе величина 0 вместе с входит в число подлежащих мини мизации свободных параметров. Так как величина 0 входит в выражение для t линейно, то можно частично облегчить оптимизационную процедуру, поставив вме сто 0 значение 0, минимизирующее функцию s при данном.

То есть на первом шаге решаем задачу S(|0) min!

S(|0) x Q =2(1 + )0 +2x Q =0 0 =.

1+ Далее, подставим 0 = в S(|0) (22.3) и решим задачу:

0() S (|0 ()) min!

x Q 2(x Q ) S (|0 ()) = 1+ + x Q Qx - = 1+ 1+ (x Q ) = x Q Qx - min!

0, 1+ Полученное при таком подходе значение, минимизирующее функцию S(), x Q называют точной МНК-оценкой для и 0 = -.

1+ 22.2. Оценка параметров модели MA(1) Небольшой дополнительный анализ приводит к точным ММП-оценкам.

Обозначим 1+ = K. Функцию правдоподобия можно представить в виде f (0,..., T ) =f (0, x1,..., xT ) = - 2 K - T 0)2 2 2 - (0- - S() 2 e = e K- 2 2 2, K (x Q ) где S () =x Q Qx -.

1+ Видим, что первая часть этой записи — это функция плотности распределе ния 0 N( ), т.е первая часть представляет собой условное распреде 0, K ление f (0|x1,..., xT ) неизвестного значения 0 при известных наблюдениях x1, x2,..., xT.

Вторая часть записи — это частная функция плотности распределения вероятности наблюдений x1, x2,..., xT, т.е. f (x1,..., xT ). Действительно, x = 0c + D, гд е - 1 0 · · ·.

.

..

.

0 - 1.

c =, D =.

..

..

....

..

.. 0 0 · · · - Ковариационная матрица ряда x равна =E(xx ) =E (0c + D)(0c + D) = = E 2cc + E D D = (cc + DD ).

Обратная к ней:

-1 = (cc + DD )-1 = -1 -1 -1 -1 - = DD - DD c 1+c DD c c DD.

Заметим, что D-1 = Q, (D D)-1 = Q Q и -D-1c = -Qc =. Тогд а 1 Q Q -1 = Q Q -.

1+ 650 Глава 22. Эффективные оценки параметров модели ARMA Определитель ковариационной матрицы :

-1 2T 2T || = cc + DD = 1+c DD c DD = -1 2T 2T = 1+c DD c = 1+, где мы воспользовались тем, что |D| =1 и |DD | = |D||D | =1.

По формуле плотности многомерного нормального распределения T 2 2 f (x1,..., xT ) =(2)- ||- e- x -1x = - T 1 Q Q - - x Q Q- x 2 1+ = 22 2 1+ e.

- T 1 - S() e Поэтому f (x1,..., xT ) =K- 2 2 2.

Итак, необходимо решить задачу:

f (0,..., T ) =f (0, x1,..., xT ) = = f (0|x1,..., xT ) · f (x1,..., xT ) max!

0, От 0 зависит только первая часть = а задача приобретает вид 0, - T 1 - S() e f (x1,..., xT ) max! K- 22 2 2 max!

, 2 S(). Концентрируем функцию прав Нетрудно получить оценку по : = T доподобия:

- T 1 S () T fc (x1,..., xT ) =K- 2 e- max!

T Собираем в данной функции вместе все, что зависит от, и получаем T T 1 T T. max! K S () min!

2e T K S () Значение, минимизирующее функцию K1/T S(), называют точной ММП оценкой.

Заметим, что функция K зависит лишь от, не зависит от наблюдений, и с ро стом T величина K1/T стремится к единице. Поэтому этот множитель существе нен лишь при малых объемах выборок и в этом случае не представляет труда для вычислений, а при умеренно больших T без него можно обойтись, соглашаясь с незначительным смещением оценки, но сильно сокращая объем вычислений, осо бенно в случае MA(q). Этим обстоятельством объясняется использование точных МНК-оценок.

22.3. Оценки параметров модели ARMA(P, Q) 22.3. Оценки параметров модели ARMA(p, q) Рассмотрим модели ARMA(p, q) ряда {xt}:

xt - 1xt-1 -· · · -pxt-p = t - 1t-1 -· · · -qt-q.

Будем полагать, что t — последовательность независимых случайных вели чин, имеющих одинаковое нормальное распределение со средним 0 и дисперси ей.

Через автоковариационную функцию стационарного ARMA-процесса i = E[xtxt-i] можно выразить ковариационную матрицу x =(x1,..., xT ) 0 1 · · · T - 1 0 · · · T - =.

...

.

....

.

...

T -1 T -2 · · · Она является симметричной тёплицевой матрицей и обозначается как [0,..., T -1].

Так как x NT (0, ), то логарифмическая функция правдоподобия процесса равна T 1 2 ln L(,, ) =- ln(2 ) - ln || - x -1x. (22.4) 2 2 Через ri обозначаем автоковариацию, нормированную на дисперсию ошибок, i 0 T - т.е. ri =, а через R обозначаем матрицу,...,. В терминах 2 2 нормированной R логарифмическая функция правдоподобия (22.4) записывается следующим образом:

T 1 2 ln L(,, ) =- ln(2) - ln |R| - x R-1x max!

2 2 Воспользовавшись условиями первого порядка ln L(,, ) =0, получим оценку как функцию от и :

x R-1x 2 = (, ) =.

T 652 Глава 22. Эффективные оценки параметров модели ARMA Поставив оценку в логарифмическую функцию правдоподобия, получим концентрированную функцию правдоподобия T T 1 T x R-1x ln Lc(, ) =- ln(2) - - ln |R| - ln max!

2 2 2 2 T Точные оценки параметров ARMA для процесса xt можно найти, максимизируя функцию ln Lc(, ), что делается с помощью численных методов.

22.4. Упражнения и задачи Упражнение Сгенерируйте ряд длиной 200 наблюдений по модели MA(1) с параметром 1 =0.5 и нормально распределенной неавтокоррелированной ошибкой с единич ной дисперсией. По этому ряду оцените модель MA(1) методом моментов (прирав нивая теоретические и выборочные автокорреляции), условным методом наимень ших квадратов и точным методом максимального правдоподобия. Сравните все эти оценки с истинным значением.

Упражнение Сгенерируйте ряд длиной 200 наблюдений по модели AR(1) с параметром 1 =0.5 и нормально распределенной неавтокоррелированной ошибкой с еди ничной дисперсией. По этому ряду оцените модель AR(1) методом моментов (при равнивая теоретические и выборочные автокорреляции), условным методом наи меньших квадратов и точным методом максимального правдоподобия. Сравните все эти оценки с истинным значением.

Упражнение Сгенерируйте ряд длиной 200 наблюдений по модели ARMA(1, 1) с парамет рами 1 =0.5 и 1 = 0.5 и нормально распределенной неавтокоррелирован ной ошибкой с единичной дисперсией. По этому ряду оцените модель ARMA(1, 1) методом моментов (приравнивая теоретические и выборочные автокорреляции), условным методом наименьших квадратов и точным методом максимального прав доподобия. Сравните все эти оценки с истинными значениями.

Задачи 1. Какие предположения должны выполняться, чтобы можно было оценить мо дель MA(1) с помощью метода максимального правдоподобия?

22.4. Упражнения и задачи 2. Сформулируйте кратко отличие между условной и точной оценкой МНК для модели MA(1) и связь между ними (с пояснением обозначений).

3. Как можно найти оценку параметра для модели AR(1), исходя из предпо ложения, что первое наблюдение не является случайной величиной? Как называется такая оценка?

4. Запишите функцию правдоподобия для модели авторегрессии первого поряд ка, выделив множитель, который является причиной отличия точной ММП оценки от условной оценки. Плотности распределения какой величины соот ветствует этот множитель?

5. Запишите функцию правдоподобия для модели скользящего среднего первого порядка.

Рекомендуемая литература 1. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление.

(Вып. 1, 2). — М.: «Мир», 1972.

2. Песаран М., Слейтер Л. Динамическая регрессия: теория и алгоритмы. — М: «Финансы и статистика», 1984. (Гл. 2–4).

3. Engle Robert F. Autoregressive Conditional Heteroskedasticity with Estimates of the Variance of U.K. Inflation // Econometrica, 50, 1982, 987–1008.

4. Hamilton James D. Time Series Analysis. — Princeton University Press, 1994.

(Ch. 5).

5. Judge G.G., Griffiths W.E., Hill R.C., Luthepohl H., Lee T. Theory and Practice of Econometrics. — New York: John Wiley & Sons, 1985. (Ch. 8).

6. (*) Справочник по прикладной статистике: В 2-х т. Т. 2. / Под ред.

Э. Ллойда, У. Ледермана. — М.: «Финансы и статистика», 1990. (Гл. 18).

Глава Векторные авторегрессии 23.1. Векторная авторегрессия:

формулировка и идентификация Модели векторной авторегрессии (VAR) представляют собой удобный инстру мент для одновременного моделирования нескольких рядов. Векторная авторегрес сия — это такая модель, в которой несколько зависимых переменных, и зависят они от собственных лагов и от лагов других переменных. Если в обычной авторегрессии коэффициенты являются скалярами, то здесь следует рассматривать уже матрицы коэффициентов.

В отличие от модели регрессии, в VAR-модели нет нужды делить переменные на изучаемые переменные и независимые факторы. Любая экономическая пере менная модели VAR по умолчанию включается в состав изучаемых величин (хотя есть возможность часть переменных рассматривать как внешние к модели, экзо генные).

Отметим, что естественным расширением модели VAR является модель VARMA, включающая ошибку в виде скользящего среднего. Однако модель VARMA не получила очень широкого распространения из-за сложности оценивания. Ав торегрессию легче оценивать, так как выполнено предположение об отсутствии автокорреляции ошибок. В то же время, члены скользящего среднего приходит ся оценивать методом максимального правдоподобия. Так как каждый обратимый процесс скользящего среднего может быть представлен в виде AR(), чистые ав торегрессии могут приближать векторные процессы скользящего среднего, если 23.1. Векторная авторегрессия: формулировка и идентификация добавить достаточное число лагов. Предполагается, что при этом ошибка не бу дет автокоррелированной, что позволяет с приемлемой точностью моделировать временные ряды, описываемые моделью VARMA, при помощи авторегрессии до статочно высокого порядка.

Пусть xt — вектор-строка k изучаемых переменных, zt — вектор-строка независимых факторов (в него может входить константа, тренд, сезонные пере менные и т.п.).

Как и традиционные системы одновременных уравнений, модели векторной авторегрессии имеют две формы записи: структурную и приведенную. Структурная векторная авторегрессия (SVAR) p-го порядка — это модель следующего вида:

p xt = xt-jj + ztA + t, где (0)ll =0.

j= Здесь j — матрица k k коэффициентов авторегрессии для j-го лага xt, A — матрица коэффициентов при независимых факторах. Коэффициенты, относящие ся к отдельному уравнению, стоят по столбцам этих матриц. Относительно матри цы j предполагается, что ее диагональные элементы1 равны нулю, (0)ll =0, l =1,..., k. Это означает, что отдельная переменная xlt не влияет сама на себя в тот же момент времени.

При этом предполагается, что ковариационная матрица одновременных ошибок диагональна:

2 var(t) =diag(1,..., k) =. (23.1) Некоторые из коэффициентов здесь известны, поэтому такая модель называется структурной.

Обозначим B = I - 0, Bll =1.

Тогда SVAR можно переписать как p xtB = xt-jj + ztA + t. (23.2) j= Если матрица имеет индекс, то для обозначения ее элемента мы будем заключать матрицу в скоб ки. Например, (A1)ij.

656 Глава 23. Векторные авторегрессии Структурная векторная регрессия фактически является «гибридом» моделей авторегрессии и систем одновременных уравнений. Соответственно, анализ таких моделей должен учитывать и динамические свойства, характерные для моделей авторегрессии, и черты, присущие системам одновременных уравнений.

Уравнение структурной векторной авторегрессии представляет собой систе му одновременных регрессионных уравнений, в которой среди факторов имеются лаги изучаемых переменных. Для того чтобы показать это в явном виде, введем следующие обозначения:

.

.

.

zt =(xt-1,..., xt-p, zt) и A =.

p A В таких обозначениях xtB = + t, ztA или в матричной записи XB = ZA +.

Как и в случае систем одновременных уравнений, нельзя оценить параметры структурной формы методом непосредственно наименьших квадратов, поскольку, если матрица B недиагональна, найдутся уравнения, в которых будет более чем одна эндогенная переменная. В i-м уравнении системы будет столько же эндоген ных переменных, сколько ненулевых элементов в i-м столбце матрицы B. Таким образом, в общем случае уравнения системы будут взаимозависимы, и, следова тельно, оценки их по отдельности методом наименьших квадратов будут несостоя тельными.

Классический частный случай, в котором все-таки можно применять МНК — это случай рекурсивной системы. Рекурсивной является система одновременных уравнений, в которой матрица B является верхней треугольной, а матрица ко вариаций ошибок (23.1) является диагональной. Последнее условие в случае SVAR выполнено по определению. При этом первая переменная зависит только от экзогенных переменных, вторая переменная зависит только от первой и от экзо генных переменных и т.д. Поскольку ошибки в разных уравнениях некоррелирова ны, то каждая эндогенная переменная коррелирована только с ошибками из своего 23.1. Векторная авторегрессия: формулировка и идентификация и предыдущих уравнений и не коррелирована с ошибками тех уравнений, в кото рые она входит в качестве регрессора. Таким образом, ни в одном из уравнений не нарушаются предположения МНК о некоррелированности ошибки и регрессоров, т.е. оценки МНК состоятельны.

В общем случае, когда модель SVAR не обязательно рекурсивная, чтобы изба виться от одновременных зависимостей, можно умножить2 23.2 справа на B-1:

p xt = xt-jjB-1 + ztAB-1 + tB-1.

j= Далее, обозначим D = AB-1, j =jB-1, vt = tB-1.

Это дает приведенную форму векторной авторегрессии:

p xt = xt-jj + ztD + vt.

j= Ковариационная матрица одновременных ошибок приведенной формы равна var(vt) =. Она связана с ковариационной матрицей одновременных ошибок структурной формы (см. 23.1) соотношением B B =.

Как и в случае обычных одновременных уравнений, при оценивании структур ных векторных авторегрессий возникает проблема идентификации. Существует несколько типов идентифицирующих ограничений, которые можно использовать для решения этой проблемы.

1) Нормирующие ограничения, которые только закрепляют единицы измерения коэффициентов. В данном случае в качестве нормирующих ограничений использу ются ограничения Bll =1 (диагональные элементы матрицы B равны 1).

2) Ограничения на коэффициенты структурных уравнений. Ограничения на ко эффициенты бывают двух видов: ограничение на коэффициенты в пределах одного и того же уравнения (важный частный случай такого ограничения — исключение переменной из уравнения) и ограничение на коэффициенты нескольких уравнений.

3) Ограничения на ковариационную матрицу ошибок. В структурной вектор ной авторегрессии используется крайний случай таких ограничений: матрица ко вариаций ошибок в этой модели диагональна (см. 23.1), т.е. так называемое ограничение ортогональности ошибок.

4) Долгосрочные ограничения. Это ограничения на долгосрочные взаимодей ствия переменных, резюмируемые долгосрочным мультипликатором M, о котором речь пойдет ниже (см. 23.5).

Мы исходим из предположения, что B — неособенная матрица.

658 Глава 23. Векторные авторегрессии В отличие от векторной авторегрессии, в классических системах одновремен ных уравнений редко используют ограничения на ковариационную матрицу, а здесь они входят в определение модели, причем в виде жесткого ограничения ортого нальности ошибок.

Стандартные идентифицирующие ограничения, которые неявно подразумева лись в ранних статьях по векторной авторегрессии, состоят в том, что матри ца B является верхней треугольной. Это дает рекурсивную векторную авторе грессию.

Рекурсивную векторную авторегрессию можно оценить методом наименьших квадратов по причинам, о которых упоминалось выше. Другой способ состоит в том, чтобы оценить приведенную форму модели и восстановить из нее коэффициен ты структурной формы. Для этого надо использовать так называемое разложение Холецкого (триангуляризацию) для ковариационной матрицы приведенной фор мы: =U U, гд е — диагональная матрица с положительными элементами, U — верхняя треугольная матрица с единицами на диагонали. Естественно, вместо истинной матрицы используют ее оценку. Тогда полученная матрица будет оценкой ковариационной матрицы ошибок структурной формы, а U-1 — оценкой матрицы B.

Однако использование рекурсивной векторной авторегрессии нежелательно, если только нет каких-либо оснований считать, что одновременные взаимодей ствия между переменными действительно являются рекурсивными. Дело в том, что эти идентифицирующие ограничения совершенно произвольны и зависят от того, в каком порядке расположены переменные в векторе xt.

В общем случае оценивание структурной VAR производят примерно теми же методами, что и оценивание одновременных уравнений. В частности, можно использовать метод максимального правдоподобия. Специфичность методов оце нивания состоит в том, что они должны учитывать ограничение ортогональности ошибок.

23.2. Стационарность векторной авторегрессии Чтобы анализировать условия и следствия стационарности векторной авто регрессии, удобно отвлечься от структурной формы этой модели и пользоваться приведенной формой. Для упрощения анализа мы без потери общности будем рас сматривать векторную авторегрессию без детерминированных членов:

p xt = xt-jj + vt, j= 23.2. Стационарность векторной авторегрессии или в операторном виде3:

p xt I - jLj = vt.

j= Многие свойства процесса VAR(p) можно получить из свойств процесса VAR(1), если воспользоваться соответствующим представлением:

xt = xt-1+ t, где вводятся следующие обозначения:

xt =(xt, xt-1,..., xt-p+1), t = vt, 0,..., k k и 1 Ik 0kk · · · 0kk 2 0kk Ik · · · 0kk.

.

.....

=....

.

....

p-1 0kk 0kk · · · Ik p 0kk 0kk · · · 0kk Используя рекуррентные подстановки xt =(xt-2+ t)+ t = + t+ t, xt- xt =(xt-3+ t)2 + t+ t = + t2 + t+ t xt- и т.д., несложно получить для VAR(1) представление в виде бесконечного скользя щего среднего:

xt = t + t+ t2 + t3 +... = t-ii.

i= Для того чтобы этот ряд сходился, необходимо, чтобы его члены затухали, т.е. чтобы в пределе при i последовательность матриц i стремилась к ну лю. Для этого требуется, чтобы собственные значения матрицы лежали внутри Здесь оператор стоит после переменной, на которую действует, чтобы не нарушать правила умножения матриц.

660 Глава 23. Векторные авторегрессии единичного круга. Собственные значения матрицы, по определению, удовлетво ряют уравнению:

- ITp =0.

Определитель в этой формуле можно выразить через матрицы j (доказательство этого требует довольно громоздких вычислений):

- ITp =(-1)Tp IT p - 1p-1 -... - p-1 - p.

Таким образом, уравнение для собственных значений эквивалентно следую щему:

IT p - 1p-1 -... - p-1 - p =0.

Процесс VAR(p) слабо стационарен тогда и только тогда, когда корни этого уравнения меньше единицы по абсолютной величине.

Эти условия стационарности можно переформулировать в терминах матричного характеристического многочлена процесса VAR(p), который равен p (z) =I - jzj.

j= Если возьмем определитель этого многочлена, то получится скалярный харак теристический многочлен p |(z)| = I - jzj.

j= Он будет многочленом, поскольку определитель — это многочлен от своих эле ментов. Соответствующее характеристическое уравнение имеет вид:

|(z)| =0.

Условия стационарности состоят в том, что корни этого характеристического урав нения лежат за пределами единичного круга.

23.3. Анализ реакции на импульсы Для содержательной интерпретации стационарной векторной авторегрессии следует выразить изучаемую переменную xt через ошибки t структурной формы, которые, по определению модели, взаимно некоррелированы.

23.3. Анализ реакции на импульсы Запишем приведенную форму модели (без детерминированных членов) с ис пользованием лагового оператора L:

p xt I - jLj = vt = tB-1.

j= В предположении стационарности процесса xt можно обратить лаговый поли ном и получить p - xt = tB-1 I - jLj. (23.3) j= Это дает представление в виде бесконечного скользящего среднего (представ ление Вольда) для VAR:

xt = t-ii. (23.4) i= Матрицы i представляют так называемую функцию реакции на импуль сы (IRF — impulse response function) для структурной векторной авторегрессии и могут быть символически записаны в виде dxt i =.

dt-i Более точно, функция реакции на импульсы — это последовательность (i)lr, i = 0, 1, 2, где l и r — индексы пары изучаемых переменных. Величина (i)lr показывает, как влияет ошибка tl (которая соответствует уравнению для пере менной xtl) на переменную xtr при запаздывании на i периодов.

Эти матрицы можно рассчитать рекуррентно:

p i = i-jj, i =1, 2,..., j= начиная с 0 = B-1 и i =0kk, i < 0.

Накопленная реакция на импульсы определяется следующим образом:

s s = i.

i= 662 Глава 23. Векторные авторегрессии Она показывает суммарное запаздывающее влияние ошибок на изучаемую пе ременную для всех лагов от 0 до некоторого s.

Долгосрочное влияние резюмируется матрицей M, определяемой как M = lim s = i. (23.5) s i= Эту матрицу называют долгосрочным мультипликатором. Ее также можно записать в виде p - M = B-1 I - j.

j= Последняя формула следует из того, что p - B-1 I - j = iLi (см. 23.3 и 23.3).

j=1 i= Для того чтобы это показать, надо подставить 1 вместо L.

23.4. Прогнозирование с помощью векторной авторегрессии и разложение дисперсии Поскольку лаги исследуемых переменных полагаются величинами известны ми, то построение прогнозов по ним в гораздо меньшей степени, чем в системах одновременных уравнений, осложняется проблемой получения точных значений факторов.

Для упрощения формул мы будем исходить из того, что нам известны истин ные параметры процесса. Пусть известны значения xt временного ряда VAR для t =1,..., T. Сделаем прогноз на ( T +1)-й период. Это математическое ожидание xT +1, условное относительно имеющейся на момент T информации x1,..., xT.

При расчетах удобно действовать так, как если бы была известна вся предыстория процесса:

T =(xT,..., x1, x0,... ).

Выводы от этого не изменятся. Таким образом, будем использовать ожидания, условные относительно T.

Искомый прогноз равен p p xp (1) = E(xT +1|T ) = E(xT +1-j|T )j + E(vT +1|T ) = xT +1-jj, T j=1 j= 23.4. Прогнозирование с помощью векторной авторегрессии где мы воспользовались тем, что E(vT +1|T ) = 0 и что все xt в правой части уравнения регрессии входят в предысторию T.

Чтобы получить формулу прогноза на s периодов, возьмем от обеих частей уравнения для процесса VAR математическое ожидание, условное относительно T. Получим p xp (s) =E(xT +s|T ) = E(xT +s-j|T )j.

T j= По этой формуле прогнозы вычисляются рекуррентно, причем E (xt|T ) =xt при t T, и E (xt|T ) =xp (t - T ) при t >T.

T Заметим, что построение прогнозов не требует знания структурной формы мо дели. Таким образом, чтобы построить прогноз, достаточно оценить приведенную форму без наложения ограничений обычным МНК. Это делает VAR очень удобным инструментом прогнозирования: не требуется анализировать, как взаимосвязаны переменные, какая переменная на какую влияет.

Ошибка прогноза — это ds = xT +s - xp = xT +s - E(xT +s|T ).

T +s Чтобы найти эту ошибку, воспользуемся разложением Вольда для xT +k:

xT +s = T +s-ii.

i= Очевидно, что ошибки T +1,..., T +s непредсказуемы и их ожидаемые зна чения относительно T равны нулю, поэтому xp (s) =E(xT +s|T ) = T +s-ii.

T i=s Таким образом, ошибка прогноза равна:

s- ds = T +s-ii.

i= Прогноз является несмещенным, поскольку E(d) =0.

Ковариационная матрица ошибки прогноза находится по формуле:

s- s- ds = E(d ds|T ) =E T +s-ii T +s-ii |T = s i=0 i= s-1 s- = E T +s-i|T i = i.

T +s-i i i i=0 i= 664 Глава 23. Векторные авторегрессии При выводе формулы мы воспользовались тем, что ошибки структурной фор мы t не автокоррелированы и их ковариационная матрица равна var(t) =.

Можно выразить ковариационную матрицу ошибки прогноза также и через кова риационную матрицу ошибок приведенной формы:

s- ds = B Bi.

i i= Поскольку в структурной форме ошибки разных уравнений некоррелированы, 2 т.е. =diag(1,..., k), то можно разложить ковариационную матрицу ошибки прогноза на составляющие, соответствующие отдельным ошибкам tl. Обозначим l-ю строку матрицы i через il. Вектор il представляет собой функцию реакции на импульсы влияния t-i,l на все переменные xt. Тогд а s-1 s-1 k k s- 2 ds = i = ill il = ill il.

i i=0 i=0 l=1 l=1 i= Таким образом, ошибке l-го уравнения соответствует вкладв ковариационную матрицу ошибки прогноза равный s- ill il.

i= Можно интерпретировать j-й диагональный элемент этой матрицы как вклад ошибки l-го уравнения t,l в дисперсию ошибки прогноза j-й изучаемой пере менной xt,j при прогнозе на s периодов. Обозначим этот вклад через jl,s:

s- 2 jl,s = l il.

il i= jj Можем вычислить также долю каждой из ошибок в общей дисперсии ошибки прогноза j-й изучаемой переменной:

jl,s Rjl,s =.

k jr,s r= Набор этих долей Rjl,s, гд е l = 1,..., k, представляет собой так называе мое разложение дисперсии ошибки прогноза для структурной векторной авторе грессии.

23.5. Причинность по Грейнджеру 23.5. Причинность по Грейнджеру В эконометрике наиболее популярной концепцией причинности является при чинность по Грейнджеру. Это связано, прежде всего, с ее относительной просто той, а также с относительной легкостью определения ее на практике.

Причинность по Грейнджеру применяется к компонентам стационарного век торного случайного процесса: может ли одна из этих переменных быть причиной другой переменной. В основе определения лежит хорошо известный постулат, что будущее не может повлиять на прошлое.

Этот постулат Грейнджер рассматривал в информационном аспекте. Для того чтобы определить, является ли переменная x причиной переменной y, следует выяснить, какую часть дисперсии текущего значения переменной y можно объяс нить прошлыми значениями самой переменной y и может ли добавление прошлых значений переменной x улучшить это объяснение. Переменную x называют при чиной y, если x помогает в предсказании y с точки зрения уменьшения дисперсии.

В контексте векторной авторегрессии переменная x будет причиной y, если ко эффициенты при лагах x статистически значимы. Заметим, что часто наблюдается двухсторонняя причинная связь: x является причиной y,и y является причиной x.

Рассмотрим причинность по Грейнджеру для двух переменных. Приведенная форма модели имеет вид:

p p xt = ajxt-j + bjyt-j + vt, j=1 j= p p yt = cjxt-j + djyt-j + wt.

j=1 j= Отсутствие причинной связи от x к y означает, что cj =0 при j =1,..., p, т.е. что прошлые значения x не влияют на y. Отсутствие причинной связи от y к x означает, что bj =0 при j =1,..., p.

Когда процесс стационарен, тогда гипотезы о причинной связи можно прове рять с помощью F -статистики. Нулевая гипотеза заключается в том, что одна переменная не является причиной по Грейнджеру для другой переменной. Дли ну лага p следует выбрать по самому дальнему лагу, который еще может помочь в прогнозировании.

Следует понимать, что причинность по Грейнджеру — это не всегда то, что при нято называть причинностью в общем смысле. Причинность по Грейнджеру связана скорее с определением того, что предшествует чему, а также с информативностью переменной с точки зрения прогнозирования другой переменной.

666 Глава 23. Векторные авторегрессии 23.6. Коинтеграция в векторной авторегрессии Векторная авторегрессия представляет собой также удобный инструмент для моделирования нестационарных процессов и коинтеграции между ними (о ко интеграции см. в гл. 17).

Предположим, что в векторной авторегрессии xt, задаваемой уравнением p xt = xt-jj + vt, (23.6) j= отдельные составляющие процессы xtj либо стационарны, I(0), либо интегриро ваны первого порядка, I(1). Рассмотрим в этой ситуации коинтеграцию CI(1, 0).

Для упрощения забудем о том, что согласно точному определению коинтегриро ванные вектора сами по себе должны быть нестационарными. Линейную комби нацию стационарных процессов по этому упрощающему определению тоже будем называть коинтегрирующей комбинацией. Таким образом, будем называть коин тегрирующим вектором рассматриваемого процесса векторной авторегрессии xt такой вектор c =0, что xtc является I(0).

Если векторный процесс состоит из более чем двух процессов, то может суще ствовать несколько коинтегрирующих векторов.

Поскольку коинтегрирующая комбинация — это линейная комбинация, то как следствие, любая линейная комбинация коинтегрирующих векторов, не равная нулю, есть опять коинтегрирующий вектор. В частности, если c1 и c2 —д ва ко интегрирующих вектора и c = 1c1 + 2c2 =0, то c — тоже коинтегрирующий вектор. Таким образом, коинтегрирующие вектора фактически образуют линейное подпространство с выколотым нулем, которое принято называть коинтегрирую щим подпространством.

Обозначим через матрицу, соответствующую произвольному базису коинте грирующего подпространства процесса xt. Это k r матрица, где r —размер ность коинтегрирующего подпространства. Размерность r называют рангом ко интеграции. Столбцы — это линейно независимые коинтегрирующие вектора.

Для удобства анализа преобразуем исходную модель (23.6) векторной авторе грессии. Всегда можно переписать векторную авторегрессию в форме векторной модели исправления ошибок (vector error-correction model, VECM):

p- xt = xt-1+ xt-jj + vt, j= p p где j = - i, =-(I - i) =-(1).

i=j+1 i= 23.6. Коинтеграция в векторной авторегрессии При сделанных нами предположениях первые разности xt должны быть ста p- ционарными. Отсюда следует, что процесс xt-1=xt - xt-jj - vt ста j= ционарен как линейная комбинация стационарных процессов. Это означает, что столбцы матрицы — это коинтегрирующие вектора (либо нулевые вектора).

Любой такой вектор можно разложить по базису коинтегрирующего подпростран ства,. Составим из коэффициентов таких разложений k r матрицу, такчто =. Ранг матрицы не может превышать r. Укажем без доказательства, что при сделанных предположениях ранг матрицы в точности равен r.

Таким образом, мы получили следующую запись для векторной модели исправ ления ошибок:

p- xt = xt-1 + xt-jj + vt, j= где отвечает за скорость исправления отклонений от равновесия (матрица кор ректирующих коэффициентов), — матрица коинтеграционных векторов.

Можно рассмотреть два крайних случая: r =0 и r = k. Если r =0, то = и не существует стационарных линейных комбинаций процесса xt. Если r = k, то имеет полный ранг и любая комбинация xt стационарна, т.е. все составляющие процессы являются I(0). О собственно коинтеграции можно говорить лишь при 0

До сих пор мы не вводили в модель детерминированные компоненты. Одна ко, вообще говоря, можно ожидать, что в модель входят константы и линейные тренды, причем они могут содержаться как в самих рядах, так и в коинтеграцион ных уравнениях. Рассмотрим векторную модель исправления ошибок с константой и трендом:

p- xt = µ0 + µ1t + xt-1 + xt-jj + vt, j= где µ0 и µ1 — вектора-строки длиной k. Вектор µ0 соответствует константам, а вектор µ1 — коэффициентам линейных трендов. Можно выделить пять основных случаев, касающихся статуса векторов µ0 и µ1 в модели. В таблице 23.1 они перечислены в порядке перехода от частного к более общему.

Здесь 0 и 1 — вектора-строки длины r.

Случай 0 легко понять — константы и тренды в модели полностью отсутствуют.

В случае 1 константа входит в коинтеграционное пространство и тем самым в корректирующие механизмы, но не входит в сам процесс xt в виде дрейфа. Это 668 Глава 23. Векторные авторегрессии Таблица 23. Случай 0 µ0 =0 µ1 = Случай 1 µ0 = 0 µ1 = Случай 1 µ0 произвольный µ1 = Случай 2 µ0 произвольный µ1 = Случай 2 µ0 произвольный µ1 произвольный несложно увидеть, если переписать модель следующим образом:

p- xt =(0 + xt-1) + xt-jj + vt.

j= В случае 1 µ0 можно записать как µ0 = µ + 0, гд е µ0 входит в коинтегра ционное пространство, а µ соответствует дрейфу в векторной модели исправления ошибок:

p- xt = µ +(0 + xt-1) + xt-jj + vt.

j= Дрейф в модели исправления ошибок означает, что процесс xt содержит ли нейный тренд4.

Аналогичные рассуждения верны по отношению к временному тренду в случаях 2 и 2. В случае 2 тренд входит в коинтеграционное пространство, но не входит в xt в виде квадратичного тренда. В случае 2 тренд входит и в коинтеграционное пространство, и в xt в виде квадратичного тренда.

23.7. Метод Йохансена Наряду с методом Энгла—Грейнджера (см. п. 17.6), еще одним популярным ме тодом нахождения стационарных комбинаций нестационарных переменных явля ется метод Йо хансена. Этот метод, по сути дела, распространяет методику Дики— Фуллера (см. 17.4) на случай векторной авторегрессии. Помимо оценивания ко интегрирующих векторов, метод Йохансена также позволяет проверить гипотезы о ранге коинтеграции (количестве коинтегрирующих векторов) и гипотезы о виде коинтегрирующих векторов.

Это аналог ситуации для скалярного авторегрессионного процесса с дрейфом.

23.7. Метод Йохансена Перечислим преимущества, которые дает метод Йохансена по сравнению с ме тодом Энгла—Грейнджера:

1) Метод Энгла—Грейнджера применим, только когда между нестационарными переменными есть всего одно коинтегрирующее соотношение. Если ранг коинте грации больше 1, то метод дает бессмысленные результаты.

2) Метод Энгла—Грейнджера статичен, в нем не учитывается краткосрочная динамика.

3) Результаты метода Йохансена не зависят от нормировки, использованной при оценивании, в то время как метод Энгла—Грейнджера может дать существенно отличающиеся результаты в зависимости от того, какая переменная стоит в левой части оцениваемой коинтеграционной регрессии.

Пусть векторный процесс xt =(x1t,..., xkt) описывается векторной авторе грессией p-го порядка, причем каждая из компонент является I(1) или I(0). Пред полагается, что ошибки, относящиеся к разным моментам времени, независимы и распределены нормально с нулевым математическим ожиданием и ковариацион ной матрицей. Как указывалось выше, можно записать векторную авторегрессию в форме векторной модели исправления ошибок:

p- xt = xt-1+ xt-jj + vt.

j= В методе Йохансена оцениваемыми параметрами являются k k матрицы коэффициентов j и, а также ковариационная матрица. Имеяоценки j и, можно получить оценки коэффициентов приведенной формы модели по следующим формулам:

1 = I +1 +, j =j - j-1, j =2,..., p- 1, p = -p-1.

Ранг коинтеграции r считается известным. Ограничения на ранг коинтеграции задаются как ограничения на матрицу. Как сказано выше, в предположении, что ранг коинтеграции равен r, ранг матрицы тоже равен r, и эту матрицу можно представить в виде произведения двух матриц:

=, где и имеют размерность k r. Таким образом, в дальнейших выкладках используется представление:

p- xt = xt-1 + xt-jj + vt.

j= 670 Глава 23. Векторные авторегрессии Матрица состоит из коинтегрирующих векторов. Заметим, что если бы мат рица была известна (естественно, с точностью до нормировки), то отклонения от равновесия xt тоже были бы известны, и мы имели бы дело с линейными уравнениями регрессии, которые можно оценить посредством МНК. В методе Йо хансена исходят из того, что матрицу требуется оценить.

Для оценивания модели используется метод максимального правдоподобия.

Плотность распределения ошибок vt по формуле для многомерного нормаль ного распределения равна (2)-k/2 ||-1/2 e(- vt-1vt).

Обозначим через вектор, состоящий из параметров, и j. Для данного остатки модели равны p- vt() =xt - xt-1 - xt-jj.

j= Используя это обозначение, можем записать функцию правдоподобия:

T 2 t=p L(, ) = (2)-kT/2 ||-T/2 e(- vt()-1vt()).

Заметим, что это функция правдоподобия, в которой за неимением данных в сумме пропущены первые p наблюдений.

Логарифмическая функция правдоподобия равна T kT T ln L(, ) = - ln(2) + ln |-1| - vt()-1vt().

2 2 t=p При данном максимум функции правдоподобия по достигается при T =() = vt()vt().

T t=p Это можно доказать, дифференцируя логарифмическую функцию правдоподобия по -1 (см. Приложение A.2.2).

Можно показать, что для этой матрицы выполнено T vt()-1()vt() =Tk.

t=p 23.7. Метод Йохансена С учетом этого максимизация функции правдоподобия эквивалентна миними зации определителя матрицы () по или T vt()vt() min!

t=p Тем самым мы получили, что метод максимального правдоподобия сводится к максимизации некоторой обобщенной суммы квадратов. По аналогии со сказан ным выше ясно, что при данной матрице можно получить оценки максимального правдоподобия для остальных неизвестных параметров обычным методом наимень ших квадратов. Кроме того, при данных, можно получить оценки j методом наименьших квадратов из регрессий:

p- xt - xt-p = xt-jj + vt.

j= Оценим отдельно регрессии xt и xt-p по переменным, стоящим в правой части данного уравнения:

p- xt = xt-jSj + r0t, j= p- xt-p = xt-jTj + rpt, j= где Sj, Tj — коэффициенты регрессий.

Получим из них остатки r0t и rpt. Отсюда при данных и получим остатки исходной модели:

vt = vt(, ) =r0t - rpt.

В этих обозначениях задача нахождения оценок приобретает вид:

T (r0t - rpt ) (r0t - rpt ) min!

, t=p Для нахождения матриц и Йохансен использовал процедуру, известную как регрессия с пониженным рангом. Она состоит в следующем. На основе остатков r0t и rpt формируются выборочные ковариационные матрицы остатков:

T Mij = ritrjt, i, j =0, p, T t= 672 Глава 23. Векторные авторегрессии и задача переписывается в виде M00 - Mp0 - M0p + Mpp min!

, Минимизация по при данном дает () =M0p( Mpp)-1, откуда следует задача минимизации уже только по :

M00 - M0p( Mpp)-1 Mp0 min!

Очевидно, что отсюда нельзя однозначно найти. Для нахождения удобно ввести следующую нормировку: Mpp = Ir. Оказывается, что с учетом данного нормирующего ограничения последняя задача минимизации эквивалентна следую щей обобщенной задаче поиска собственных значений5:

- Mp0M00 M0p - Mpp c =0, где c — собственный вектор, а собственные значения находятся как решения уравнения:

- Mp0M00 M0p - Mpp =0.

Матрица находится в виде собственных векторов, соответствующих r наи большим собственным значениям, где r — ранг коинтеграции. Пусть собственные числа упорядочены по убыванию, т.е.

1 2... k.

Тогда следует выбрать первые r этих чисел, 1,..., r. Столбцами матрицы будут соответствующие вектора c1,..., cr.

Обобщенную задачу поиска собственных значений можно свести к стандартной 1/ задаче, если найти какую-либо матрицу Mpp, являющуюся квадратным корнем 1/ 1/ матрицы Mpp, т.е. Mpp = Mpp Mpp :

-1/2 -1 -1/ Mpp Mp0M00 M0pMpp - I c =0, Она напоминает метод наименьшего дисперсионного отношения для оценивания систем одно временных уравнений (см. п. 10.3). Также это напрямую связано с так называемой теорией кано нических корреляций. (См. Бриллинджер Д. Временные ряды. Обработка данных и теория. — М.:

«Мир», 1980.) 23.7. Метод Йохансена 1/ где c = Mpp c.

Напомним еще раз, что определяется только с точностью до некоторой нор мировки. Мы уже использовали нормировку Mpp = Ir, которая выбрана из соображений удобства вычислений. Однако нормировку предпочтительнее выби рать, исходя из экономической теории рассматриваемых процессов. Поэтому сле дует умножить полученную оценку справа на квадратную неособенную r r матрицу, которая бы привела коинтеграционные вектора к более удобному для экономической интерпретации виду.

После того как найдена оценка максимального правдоподобия для, вычисля ются оценки других параметров. Для этого можно использовать в обратном поряд ке все те подстановки, которые мы сделали при упрощении задачи максимизации функции правдоподобия. Можно также использовать эквивалентную процедуру:

сразу получить оценки и j, применив метод наименьших квадратов к исходной регрессии.

Для проверки гипотез о ранге коинтеграции r используется статистика отноше ния правдоподобия. Пусть нулевая гипотеза состоит в том, что ранг коинтеграции равен r0, а альтернативная гипотеза — что ранг коинтеграции равен ra ( ra >r0).

Обозначим максимальное значение функции правдоподобия, полученное в предпо ложении, что ранг равен r, через Lr. Тогда статистика отношения правдоподобия равна (см. раздел 18.3.3):

LR(r0, ra) =2(ln Lra - ln Lr0).

Подставив в функцию правдоподобия полученные оценки, можно вывести сле дующее выражение для максимального значения логарифма функции правдоподо бия (с точностью до константы):

r T ln Lr = - ln(1 - i) +const.

i= Поэтому ra LR(r0, ra) =-T ln(1 - i).

i=r0+ Особенно полезны с точки зрения поиска коинтеграционного ранга два частных случая статистики отношения правдоподобия.

Статистика следа используется для проверки нулевой гипотезы о том, что ранг коинтеграции равен r, против альтернативной гипотезы о том, что ранг равен k (количеству переменных). Статистика имеет вид:

k LRtrace = LR(r, k) =-T ln(1 - i).

i=r+ 674 Глава 23. Векторные авторегрессии Проверка гипотез проводится последовательно для r = k - 1,..., 0 и за канчивается, когда в первый раз не удается отклонить нулевую гипотезу. Можно проводить проверку гипотез и в обратном порядке r =0,..., k- 1. В этом случае она заканчивается, когда нулевая гипотеза будет отвергнута в первый раз.

Можно также использовать статистику максимального собственного значе ния, которая используется для проверки нулевой гипотезы о том, что ранг равен r, против альтернативной гипотезы о том, что ранг равен r +1. Эта статистика равна:

LR-max = LR(r, r +1) =- ln(1 - r+1).

Обе статистики имеют нестандартные асимптотические распределения. Эти асимптотические распределения не зависят от мешающих параметров, а зависят только от k-r, и от того, как входят в модель константа и тренд (см. перечисленные на стр. 668 пять основных случаев).

Методом Монте-Карло получены таблицы LRtrace и LR-max для всех пяти случаев и нескольких значений k - r (на данный момент имеются таблицы для k - r = 1,..., 12). Также в последние годы разрабатываются различного рода аппроксимации для этих нестандартных распределений.

Как и в случае критерия ADF (см. п. 17.4), очень важным вопросом является выбор длины лага p (порядка авторегрессии). Способы, по сути дела, являются теми же самыми. Для проверки гипотез о длине лага можно использовать критерий отношения правдоподобия, который в данном случае имеет обычное распределе ние 2. Если процесс состоит из k компонент, и проверяется гипотеза о том, что следует увеличить p на единицу, то количество степеней свободы соответствую щей статистики равно k. Важно также, чтобы в выбранной модели отсутствовала автокорреляция остатков, поскольку это одно из предположений модели.

Метод Йохансена можно использовать также для оценивания моделей с ли нейными ограничениями на матрицу коинтегрирующих векторов или на матрицу корректирующих коэффициентов. Для проверки таких ограничений удобно ис пользовать все тот же тест отношения правдоподобия, который здесь имеет обыч ное асимптотическое распределение 2.

23.8. Коинтеграция и общие тренды Рассмотрим модель VAR(1) с интегрированными переменными и ее представ ление в виде модели исправления ошибок:

xt = xt-1 + vt. (23.7) Поскольку матрица состоит из коинтегрирующих векторов, то отклонения от равновесия xt являются I(0), и для них существует разложение Вольда. Выведем 23.8. Коинтеграция и общие тренды его. Для этого сначала умножим уравнение модели на :

xt = xt-1 + vt, откуда:

xt = xt-1( + I) +vt.

Имеем для стационарного вектора xt авторегрессию, из которой можем пред ставить xt в виде бесконечного скользящего среднего (разложение Вольда):

xt = vt-i( + I)i.

i= Подставив это выражение в исходную модель (23.7), получим также разложение Вольда для приростов xt:

xt = vt-i( + I)i-1 + vt, i= или xt = vt-iCi = vtC(L), i= где мы ввели обозначения Ci для матричных коэффициентов скользящего средне го. Несложно подсчитать, пользуясь формулой бесконечной геометрической про грессии, что соответствующий долгосрочный мультипликатор равен C(1) = I - ( )-1. (23.8) Обозначим Ci = - Ci и C(L) = Ci Li. При этом выполнено следующее j=i+1 i= разложение для C(L):

C(L) =C(L) +C(1).

Кроме того, можно показать, что C(L) соответствует стационарному процессу.

Все это позволяет разделить процесс xt на сумму двух составляющих:

xt =vtC(L) +vtC(1).

Следовательно, xt можно представить следующим образом:

xt = vtC(L) +vt C(1), (23.9) 676 Глава 23. Векторные авторегрессии где vt — это векторный процесс случайного блуждания, построенный на основе vt (проинтегрированный vt): vt =vt.

Первое слагаемое в разложении xt (23.9) стационарно, а второе представляет собой линейную комбинацию процессов I(1).

Если воспользоваться тождеством I = ( )-1 + ( )-1, где и —это (k - r) k матрицы полного ранга, такие что = и =0, то матрицу C(1), опираясь на (23.8), можно представить как C(1) = ( )-1.

Таким образом, процесс xt можно представить в виде6:

xt = vtC(L) +vt ( )-1.

Элементы вектора vt являются общими стохастическими трендами. Отсюда видно, что k-мерный VAR-процесс с рангом коинтеграции r можно выразить через k - r линейно независимых общих трендов. Матрица ( )-1 содержит коэффициенты («нагрузки») этих общих трендов.

Представление через общие тренды служит основой для еще одного метода оценивания коинтеграционных регрессий — метода Стока—Уотсона.

23.9. Упражнения и задачи Упражнение В таблице 23.2 приведены данные о потребительских расходах C и доходах Y в США в млрд. долл., очищенные от сезонности.

1.1. Нарисуйте график потребления и доходов. Что можно сказать об этих рядах по графикам?

1.2. Создайте первые разности логарифмов для обоих рядов. Нарисуйте график и сделайте выводы.

1.3. Предположим, что существует структурная зависимость между потреблени ем и доходами. А именно, потребление C зависит от текущих доходов и, вследствие привычек, от лагов потребления:

Ct = 1 + 2Yt + 3Ct-1 + C.

t Это так называемое разбиение на цикл и тренд Бевериджа—Нельсона (см. п. 17.2).

23.9. Упражнения и задачи Таблица 23.2. (Источник: Temple University Department of Economics Econometrics II Multivariate Time Series;

) Квартал C Y Квартал C Y Квартал C 1947.1 192.5 202.3 1952.1 220 231.1 1957.1 268.9 291. 1947.2 196.1 197.1 1952.2 227.7 240.9 1957.2 270.4 294. 1947.3 196.9 202.9 1952.3 223.8 245.8 1957.3 273.4 296. 1947.4 197 202.2 1952.4 230.2 248.8 1957.4 272.1 293. 1948.1 198.1 203.5 1953.1 234 253.3 1958.1 268.9 291. 1948.2 199 211.7 1953.2 236.2 256.1 1958.2 270.9 292. 1948.3 199.4 215.3 1953.3 236 255.9 1958.3 274.4 299. 1948.4 200.6 215.1 1953.4 234.1 255.9 1958.4 278.7 302. 1949.1 199.9 212.9 1954.1 233.4 254.4 1959.1 283.8 305. 1949.2 203.6 213.9 1954.2 236.4 254.8 1959.2 289.7 312. 1949.3 204.8 214 1954.3 239 257 1959.3 290.8 311. 1949.4 209 214.9 1954.4 243.2 260.9 1959.4 292.8 313. 1950.1 210.7 228 1955.1 248.7 263 1960.1 295.4 315. 1950.2 214.2 227.3 1955.2 253.7 271.5 1960.2 299.5 320. 1950.3 225.6 232 1955.3 259.9 276.5 1960.3 298.6 1950.4 217 236.1 1955.4 261.8 281.4 1960.4 299.6 320. 1951.1 223.3 230.9 1956.1 263.2 1951.2 214.5 236.3 1956.2 263.7 286. 1951.3 217.5 239.1 1956.3 263.4 287. 1951.4 219.8 240.8 1956.4 266.9 В свою очередь, текущие доходы зависят от лагов доходов (из-за инерции) и от лагов потребления (по принципу мультипликатора):

Yt = 1 + 2Yt-1 + 3Ct-1 + Y.

t Оцените параметры структурной формы модели при помощи МНК по ис ходным данным. Затем проделайте то же самое, используя преобразованные данные из пункта 1.2 (разности логарифмов). Объясните, имеют ли два по лученных набора оценок одинаковый смысл. Какие оценки предпочтительнее ипочему?

1.4. Перепишите модель в приведенной форме. Укажите взаимосвязь между ко эффициентами структурной и приведенной форм. Оцените приведенную фор му модели по исходным данным и по преобразованным данным. Какие оценки предпочтительнее и почему?

678 Глава 23. Векторные авторегрессии 1.5. Добавьте еще по одному лагу в оба уравнения приведенной формы. Оцените коэффициенты по исходным данным и по преобразованным данным и про ведите тесты причинности по Грейнджеру. Что можно сказать о направлении причинности по полученным результатам?

1.6. Проверьте ряды на наличие единичных корней, используя тест Дики— Фуллера.

1.7. Примените к исходным данным и к логарифмам исходных данных метод Йо хансена, используя в модели 4 лага разностей.

Упражнение В таблице 23.3 даны макроэкономические показатели по США (поквартальные данные получены на основе помесячных данных): Infl — темп инфляции, рассчи танный по формуле: 400(ln(CPIt) - ln(CPIt-1)), где CPI — индекс потребитель ских цен, т.е. логарифмический темп прироста цен в процентах из расчета за год;

UnRate — уровень безработицы (процент населения);

FedFunds — эффективная процентная ставка по межбанковским краткосрочным кредитам овернайт (в про центах годовых).

2.1. Оцените параметры векторной авторегрессии 4-го порядка, предполагая, что текущая инфляция влияет на текущую безработицу и процентную ставку, а текущая безработица влияет на текущую процентную ставку (рекурсивная система).

2.2. Оцените модель в приведенной форме, пропуская последнее наблюдение, и получите точечный прогноз на один период. Сравните прогнозы с фактиче скими значениями.

Упражнение В таблице 23.4 приведены данные из статьи Турмана и Фишера, посвящен ной вопросу о том, что первично — куры или яйца. Это годовые данные по США за 1930–1983 гг. о производстве яиц в миллионах дюжин и о поголовье кур (ис ключая бройлерные).

3.1. Проведите тест причинности по Грейнджеру между двумя рядами. Сделайте выводы относительно направления причинности.

3.2. Для каждого ряда проведите тест Дики—Фуллера на наличие единичных корней, используя лаги от 0 до 12. Выберите нужную длину лага, используя 23.9. Упражнения и задачи Таблица 23.3. (Источник: The Federal Reserve Bank of St. Louis, database FRED II, ) Квартал Infl UnRate FedFunds Квартал Infl UnRate FedFunds 1954–3 –1.490 5.967 1.027 1962–4 0.000 5.533 2. 1954–4 0.000 5.333 0.987 1963–1 1.314 5.767 2. 1955–1 0.000 4.733 1.343 1963–2 1.309 5.733 2. 1955–2 –1.495 4.400 1.500 1963–3 1.305 5.500 3. 1955–3 2.985 4.100 1.940 1963–4 2.597 5.567 3. 1955–4 0.000 4.233 2.357 1964–1 0.000 5.467 3. 1956–1 0.000 4.033 2.483 1964–2 1.292 5.200 3. 1956–2 4.436 4.200 2.693 1964–3 1.288 5.000 3. 1956–3 2.930 4.133 2.810 1964–4 2.564 4.967 3. 1956–4 2.909 4.133 2.927 1965–1 0.000 4.900 3. 1957–1 4.324 3.933 2.933 1965–2 3.816 4.667 4. 1957–2 2.857 4.100 3.000 1965–3 0.000 4.367 4. 1957–3 2.837 4.233 3.233 1965–4 3.780 4.100 4. 1957–4 2.817 4.933 3.253 1966–1 3.744 3.867 4. 1958–1 5.575 6.300 1.863 1966–2 2.477 3.833 4. 1958–2 0.000 7.367 0.940 1966–3 4.908 3.767 5. 1958–3 0.000 7.333 1.323 1966–4 1.218 3.700 5. 1958–4 1.382 6.367 2.163 1967–1 1.214 3.833 4. 1959–1 0.000 5.833 2.570 1967–2 3.620 3.833 3. 1959–2 1.377 5.100 3.083 1967–3 3.587 3.800 3. 1959–3 2.740 5.267 3.577 1967–4 4.734 3.900 4. 1959–4 1.363 5.600 3.990 1968–1 3.514 3.733 4. 1960–1 0.000 5.133 3.933 1968–2 4.638 3.567 5. 1960–2 2.712 5.233 3.697 1968–3 4.585 3.533 5. 1960–3 0.000 5.533 2.937 1968–4 5.658 3.400 5. 1960–4 2.694 6.267 2.297 1969–1 5.579 3.400 6. 1961–1 0.000 6.800 2.003 1969–2 5.502 3.433 8. 1961–2 0.000 7.000 1.733 1969–3 5.427 3.567 8. 1961–3 2.676 6.767 1.683 1969–4 6.417 3.567 8. 1961–4 0.000 6.200 2.400 1970–1 6.316 4.167 8. 1962–1 2.658 5.633 2.457 1970–2 5.188 4.767 7. 1962–2 0.000 5.533 2.607 1970–3 4.103 5.167 6. 1962–3 2.640 5.567 2.847 1970–4 6.076 5.833 5. 680 Глава 23. Векторные авторегрессии Таблица 23.3. (продолжение) Квартал Infl UnRate FedFunds Квартал Infl UnRate FedFunds 1971–1 2.005 5.933 3.857 1979–2 12.950 5.700 10. 1971–2 4.969 5.900 4.563 1979–3 12.006 5.867 10. 1971–3 2.952 6.033 5.473 1979–4 13.220 5.967 13. 1971–4 2.930 5.933 4.750 1980–1 16.308 6.300 15. 1972–1 2.909 5.767 3.540 1980–2 11.809 7.333 12. 1972–2 2.888 5.700 4.300 1980–3 6.731 7.667 9. 1972–3 3.819 5.567 4.740 1980–4 11.745 7.400 15. 1972–4 3.783 5.367 5.143 1981–1 10.058 7.433 16. 1973–1 8.382 4.933 6.537 1981–2 8.487 7.400 17. 1973–2 7.306 4.933 7.817 1981–3 11.330 7.400 17. 1973–3 8.949 4.800 10.560 1981–4 4.274 8.233 13. 1973–4 9.618 4.767 9.997 1982–1 2.542 8.833 14. 1974–1 12.753 5.133 9.323 1982–2 9.599 9.433 14. 1974–2 9.918 5.200 11.250 1982–3 2.876 9.900 11. 1974–3 12.853 5.633 12.090 1982–4 0.000 10.667 9. 1974–4 10.147 6.600 9.347 1983–1 1.634 10.367 8. 1975–1 6.877 8.267 6.303 1983–2 5.266 10.133 8. 1975–2 5.268 8.867 5.420 1983–3 4.004 9.367 9. 1975–3 8.141 8.467 6.160 1983–4 3.964 8.533 9. 1975–4 7.260 8.300 5.413 1984–1 5.874 7.867 9. 1976–1 2.867 7.733 4.827 1984–2 3.098 7.433 10. 1976–2 4.969 7.567 5.197 1984–3 3.839 7.433 11. 1976–3 6.299 7.733 5.283 1984–4 3.045 7.300 9. 1976–4 5.517 7.767 4.873 1985–1 4.899 7.233 8. 1977–1 8.136 7.500 4.660 1985–2 2.613 7.300 7. 1977–2 5.995 7.133 5.157 1985–3 2.226 7.200 7. 1977–3 5.255 6.900 5.820 1985–4 5.147 7.033 8. 1977–4 6.473 6.667 6.513 1986–1 –1.464 7.033 7. 1978–1 7.001 6.333 6.757 1986–2 1.098 7.167 6. 1978–2 9.969 6.000 7.283 1986–3 2.188 6.967 6. 1978–3 9.126 6.033 8.100 1986–4 2.899 6.833 6. 1978–4 8.334 5.900 9.583 1987–1 5.022 6.600 6. 1979–1 11.612 5.867 10.073 1987–2 4.608 6.267 6. 23.9. Упражнения и задачи Таблица 23.3. (продолжение) Квартал Infl UnRate FedFunds Квартал Infl UnRate FedFunds 1987–3 4.207 6.000 6.843 1995–4 2.085 5.567 5. 1987–4 3.126 5.833 6.917 1996–1 4.137 5.533 5. 1988–1 3.102 5.700 6.663 1996–2 3.075 5.500 5. 1988–2 5.117 5.467 7.157 1996–3 2.545 5.267 5. 1988–3 5.053 5.467 7.983 1996–4 3.535 5.333 5. 1988–4 3.997 5.333 8.470 1997–1 1.756 5.233 5. 1989–1 4.940 5.200 9.443 1997–2 1.000 5.000 5. 1989–2 6.171 5.233 9.727 1997–3 2.489 4.867 5. 1989–3 2.250 5.233 9.083 1997–4 1.486 4.667 5. 1989–4 4.779 5.367 8.613 1998–1 0.494 4.633 5. 1990–1 7.219 5.300 8.250 1998–2 1.970 4.400 5. 1990–2 4.023 5.333 8.243 1998–3 1.716 4.533 5. 1990–3 7.927 5.700 8.160 1998–4 2.196 4.433 4. 1990–4 5.099 6.133 7.743 1999–1 0.972 4.300 4. 1991–1 1.784 6.600 6.427 1999–2 3.143 4.267 4. 1991–2 3.545 6.833 5.863 1999–3 4.073 4.233 5. 1991–3 2.930 6.867 5.643 1999–4 2.377 4.067 5. 1991–4 3.488 7.100 4.817 2000–1 5.180 4.033 5. 1992–1 2.596 7.367 4.023 2000–2 3.029 3.967 6. 1992–2 2.865 7.600 3.770 2000–3 3.007 4.067 6. 1992–3 2.845 7.633 3.257 2000–4 2.298 3.933 6. 1992–4 3.387 7.367 3.037 2001–1 3.195 4.167 5. 1993–1 2.801 7.133 3.040 2001–2 4.295 4.467 4. 1993–2 2.782 7.067 3.000 2001–3 0.449 4.833 3. 1993–3 1.936 6.800 3.060 2001–4 –1.801 5.600 2. 1993–4 3.570 6.633 2.990 2002–1 2.698 5.633 1. 1994–1 2.181 6.567 3.213 2002–2 2.903 5.833 1. 1994–2 2.169 6.200 3.940 2002–3 2.440 5.767 1. 1994–3 3.769 6.000 4.487 2002–4 1.545 5.900 1. 1994–4 2.138 5.633 5.167 2003–1 5.034 5.767 1. 1995–1 2.921 5.467 5.810 2003–2 –0.653 6.167 1. 1995–2 3.162 5.667 6.020 2003–3 3.039 6.133 1. 1995–3 1.833 5.667 5. 682 Глава 23. Векторные авторегрессии Таблица 23.4. (Источник: Thurman, Walter N. and Mark E. Fisher, “Chickens, Eggs, and Causality”, American Journal of Agricultural Economics 70 (1988), p. 237–238.) куры яйца куры яйца 1930 468491 3581 1957 391363 1931 449743 3532 1958 374281 1932 436815 3327 1959 387002 1933 444523 3255 1960 369484 1934 433937 3156 1961 366082 1935 389958 3081 1962 377392 1936 403446 3166 1963 375575 1937 423921 3443 1964 382262 1938 389624 3424 1965 394118 1939 418591 3561 1966 393019 1940 438288 3640 1967 428746 1941 422841 3840 1968 425158 1942 476935 4456 1969 422096 1943 542047 5000 1970 433280 1944 582197 5366 1971 421763 1945 516497 5154 1972 404191 1946 523227 5130 1973 408769 1947 467217 5077 1974 394101 1948 499644 5032 1975 379754 1949 430876 5148 1976 378361 1950 456549 5404 1977 386518 1951 430988 5322 1978 396933 1952 426555 5323 1979 400585 1953 398156 5307 1980 392110 1954 396776 5402 1981 384838 1955 390708 5407 1982 378609 1956 383690 5500 1983 364584 23.9. Упражнения и задачи информационные критерии Акаике и Шварца. Сделайте вывод о том, явля ются ли ряды стационарными. Как полученный результат может повлиять на интерпретацию результатов упражнения 3.1?

3.3. Проверьте с помощью методов Энгла—Грейнджера и Йохансена, коинтегри рованы ли ряды. Как полученный результат может повлиять на интерпрета цию результатов упражнения 3.1?

Упражнение В таблице 23.5 приведены поквартальные макропоказатели по Великобритании из обзорной статьи Мускателли и Хурна: M — величина денежной массы (агрегат M1);

Y — общие конечные расходы на товары и услуги (TFE) в постоянных ценах (переменная, моделирующая реальные доходы);

P — дефлятор TFE (индекс цен);

R — ставка по краткосрочным казначейским векселям (переменная, соответству ющая альтернативной стоимости хранения денег). Изучается связь между тремя переменными: ln M - ln P — реальная денежная масса (в логарифмах);

ln Y — реальный доход (в логарифмах);

R — процентная ставка.

4.1. Найдите ранг коинтеграции и коинтегрирующие вектора методом Йохансе на, используя векторную модель исправления ошибок (VECM) с четырьмя разностями в правой части и с сезонными фиктивными переменными. Сде лайте это при разных возможных предположениях о том, как входят в модель константа и тренд:

а) константа входит в коинтеграционное пространство, но не входит в мо дель исправления ошибок в виде дрейфа;

б) константа входит в коинтеграционное пространство, а также в модель исправления ошибок в виде дрейфа, так что данные содержат тренд;

в) тренд входит в коинтеграционное пространство, но данные не содержат квадратичный тренд.

4.2. С помощью тестов отношения правдоподобия определить, как должны вхо дить в модель константа и тренд. Убедитесь в том, что случай 4.1а, который рассматривался в статье Мускателли и Хурна, отвергается тестами.

4.3. На основе найденного коинтегрирующего вектора оцените остальные коэф фициенты VECM. Рассмотрите полученные коэффициенты модели и сде лайте вывод о том, насколько они соответствуют экономической теории.

(Подсказка: интерпретируйте коинтегрирующую комбинацию как уравнение спроса на деньги и обратите внимания на знак при ln Y ).

684 Глава 23. Векторные авторегрессии Таблица 23.5. (Источник: Muscatelli, V.A., Hurn, S. Cointegration and Dynamic Time Series Models. Journal of Economic Surveys 6 (1992, No. 1), 1–43.) Квартал lnM R lnY lnP Квартал lnM R lnY lnP 1963–1 8.8881 0.0351 10.678 –1.635 1974–1 9.5017 0.1199 11.068 –0. 1963–2 8.9156 0.0369 10.746 –1.6189 1974–2 9.5325 0.1136 11.103 –0. 1963–3 8.9305 0.0372 10.752 –1.6205 1974–3 9.5584 0.1118 11.125 –0. 1963–4 8.9846 0.0372 10.789 –1.6028 1974–4 9.6458 0.1096 11.139 –0. 1964–1 8.9584 0.0398 10.756 –1.6045 1975–1 9.6438 0.1001 11.066 –0. 1964–2 8.9693 0.0436 10.8 –1.5843 1975–2 9.6742 0.0938 11.074 –0. 1964–3 8.9911 0.0462 10.802 –1.5813 1975–3 9.7275 0.1017 11.088 –0. 1964–4 9.0142 0.0547 10.838 –1.5677 1975–4 9.7689 0.1112 11.124 –0. 1965–1 8.9872 0.0651 10.779 –1.5557 1976–1 9.787 0.0904 11.092 –0. 1965–2 9.0005 0.0612 10.818 –1.5438 1976–2 9.8141 0.1019 11.105 –0. 1965–3 9.0116 0.0556 10.832 –1.5408 1976–3 9.8641 0.1126 11.134 –0. 1965–4 9.0506 0.0545 10.851 –1.5272 1976–4 9.8765 0.1399 11.172 –0. 1966–1 9.0394 0.0556 10.814 –1.519 1977–1 9.8815 0.112 11.112 –0. 1966–2 9.0336 0.0565 10.838 –1.5037 1977–2 9.9238 0.0772 11.122 –0. 1966–3 9.0438 0.0658 10.849 –1.4964 1977–3 10.001 0.0655 11.14 –0. 1966–4 9.0491 0.0662 10.86 –1.4845 1977–4 10.071 0.0544 11.177 –0. 1967–1 9.0388 0.06 10.841 –1.4842 1978–1 10.097 0.0597 11.143 –0. 1967–2 9.055 0.053 10.874 –1.4769 1978–2 10.117 0.0949 11.165 –0. 1967–3 9.0975 0.0544 10.881 –1.4726 1978–3 10.168 0.0938 11.182 –0. 1967–4 9.1326 0.0657 10.9 –1.4661 1978–4 10.223 0.1191 11.203 –0. 1968–1 9.1029 0.074 10.89 –1.4459 1979–1 10.222 0.1178 11.159 –0. 1968–2 9.1204 0.0714 10.901 –1.4285 1979–2 10.236 0.1379 11.215 –0. 1968–3 9.1351 0.0695 10.929 –1.4141 1979–3 10.274 0.1382 11.221 –0. 1968–4 9.1733 0.0666 10.961 –1.4044 1979–4 10.304 0.1649 11.242 –0. 1969–1 9.1182 0.0718 10.891 –1.3898 1980–1 10.274 0.1697 11.199 –0. 1969–2 9.0992 0.0783 10.932 –1.3825 1980–2 10.293 0.1632 11.171 –0. 1969–3 9.1157 0.0782 10.943 –1.3697 1980–3 10.294 0.1486 11.187 0. 1969–4 9.1744 0.0771 10.979 –1.3573 1980–4 10.343 0.1358 11.188 0. 1970–1 9.1371 0.0754 10.905 –1.3368 1981–1 10.356 0.1187 11.144 0. 1970–2 9.178 0.0689 10.962 –1.3168 1981–2 10.39 0.1224 11.144 0. 1970–3 9.1981 0.0683 10.971 –1.2939 1981–3 10.407 0.1572 11.191 0. 1970–4 9.2643 0.0682 11.017 –1.2791 1981–4 10.506 0.1539 11.206 0. 1971–1 9.2693 0.0674 10.938 –1.2585 1982–1 10.501 0.1292 11.175 0. 1971–2 9.2836 0.0567 10.99 –1.2345 1982–2 10.526 0.1266 11.172 0. 1971–3 9.3221 0.0539 11.01 –1.2132 1982–3 10.551 0.1012 11.193 0. 1971–4 9.3679 0.0452 11.044 –1.1992 1982–4 10.613 0.0996 11.22 0. 1972–1 9.3742 0.0436 10.98 –1.1853 1983–1 10.639 0.1049 11.209 0. 1972–2 9.4185 0.0459 11.025 –1.1707 1983–2 10.664 0.0951 11.195 0. 1972–3 9.4356 0.0597 11.02 –1.1439 1983–3 10.675 0.0917 11.244 0. 1972–4 9.4951 0.0715 11.1 –1.1282 1983–4 10.719 0.0904 11.268 0. 1973–1 9.4681 0.0813 11.093 –1.1044 1984–1 10.754 0.0856 11.241 0. 1973–2 9.5347 0.0754 11.102 –1.0913 1984–2 10.798 0.0906 11.233 0. 1973–3 9.5119 0.1025 11.117 –1.0493 1984–3 10.827 0.1024 11.268 0. 1973–4 9.5445 0.1162 11.141 –1.0048 1984–4 10.862 0.0933 11.317 0. 23.9. Упражнения и задачи Задачи 1. Рассмотрите приведенную форму процесса VAR(1):

0.2 0. (xt, yt) =(xt-1, yt-1) +(vxt, vyt), 0.2 где ошибки vxt, vyt не автокоррелированы и их ковариационная матрица равна 1 -0..

-0.5 4. а) Является ли процесс стационарным?

б) Найдите структурную форму модели (матрицу коэффициентов и кова риационную матрицу), если известно, что она является рекурсивной (yt входит в уравнение для xt, но xt не входит в уравнение для yt).

в) Найдите (матричный) долгосрочный мультипликатор.

2. Векторная регрессия с двумя переменными xt, yt задается следующими урав нениями:

xt = xt-1 + yt-1 + vt, yt = xt-1 + yt-1 + wt.

Ковариационная матрица ошибок vt, wt имеет вид:

=, где || < 1.

а) Запишите модель в матричном виде.

б) Представьте матрицу ввид е =U U, гд е U — верхняя треуголь ная матрица, — диагональная матрица с положительными диаго нальными элементами.

в) Умножьте уравнение модели справа на матрицу U. Что можно сказать о получившемся представлении модели?

г) Повторите задание, поменяв порядок переменных yt, xt. Сравните и сделайте выводы.

686 Глава 23. Векторные авторегрессии 3. Предположим, что темпы прироста объемов производства, yt, и денежной массы, mt, связаны следующими структурными уравнениями:

mt = mt-1 + mt, yt = mt + mt-1 + yt-1 + yt, где ошибки mt, yt не автокоррелированы, не коррелированы друг с другом, 2 а их дисперсии равны m и y, соответственно.

а) Запишите структурные уравнения в стандартном матричном виде модели SVAR.

б) Запишите модель в приведенной форме.

в) Какой вид имеет функция реакции на импульсы для монетарных шо ков mt и шоков производительности yt? Как эта функция связана с представлением модели в виде бесконечного скользящего среднего (разложением Вольда)?

г) Найдите (матричный) долгосрочный мультипликатор.

4. Рассмотрите двумерную векторную авторегрессию первого порядка:

11 (x1t, x2t) =(x1, t-1, x2, t-1) +(v1t, v2t), 21 где ошибки v1t, v2t являются белым шумом и независимы между собой.

а) При каких параметрах модель является рекурсивной? Объясните.

б) При каких параметрах x1t и x2t представляют собой два независимых случайных блуждания? Объясните.

в) Известно, что x1t не является причиной x2t в смысле Грейнджера.

Какие ограничения этот факт накладывает на параметры?

5. Рассмотрите авторегрессию второго порядка: xt = 1xt-1 + 2xt-2 + t, гд е ошибка t представляет собой белый шум.

а) Обозначьте xt-1 = yt и запишите данную модель в виде векторной авторегрессии первого порядка для переменных xt и yt.

б) Чему равна ковариационная матрица одновременных ошибок в полу чившейся векторной авторегрессии?

в) Сопоставьте условия стационарности исходной модели AR(2) и полу ченной модели VAR(1).

23.9. Упражнения и задачи 6. Представьте векторную авторегрессию второго порядка в виде векторной авторегрессии первого порядка (с расшифровкой обозначений).

7. Рассмотрите двумерную модель VAR(1):

(x1t, x2t) =(x1, t-1, x2, t-1) + vt, где = 2.

а) Найдите корни характеристического многочлена, соответствующего этой модели. Является ли процесс стационарным?

б) Найдите собственные числа матрицы. Как они связаны с корнями характеристического многочлена, найденными в пункте (a)?

8. Рассмотрите векторную авторегрессию первого порядка:

11 (x1t, x2t) =(x1, t-1, x2, t-1) +(v1t, v2t).

21 При каких параметрах процесс является стационарным:

а) 11 =1, 12 =0.5, 21 =0, 22 =1;

б) 11 =0.3, 12 =0.1, 21 = -0.1, 22 =0.5;

в) 11 =2, 12 =0, 21 =1, 22 =0.5;

г) 11 =0.5, 12 = -1, 21 =1, 22 =0.5;

д) 11 =0.5, 12 = -1, 21 =1, 22 =0.5;

е) 11 =0.3, 12 = -0.2, 21 =0.2, 22 =0.3?

Аргументируйте свой ответ.

9. В стране чудес динамика темпа прироста ВВП, yt, темпа прироста денежной массы M2, mt, и ставки процента, rt, описывается следующей моделью 688 Глава 23. Векторные авторегрессии VAR(2):

0.7 0 0. (yt, mt, rt) =(2, 1, 0) + (yt-1, mt-1, rt-1) + 0.1 0.4 0 0.1 0. -0.2 0 +(yt-2, mt-2, rt-2) +(vyt, vmt, vrt), 0 0.1 0 0.1 где ошибки vyt, vmt, vrt представляют собой белый шум.

а) Покажите, что все три переменные являются стационарными.

б) Найдите безусловные математические ожидания этих переменных.

в) Запишите модель в виде векторной модели исправления ошибок.

10. Опишите поэтапно возможную процедуру построения прогнозов для вектор ной авторегрессии. Необходимо ли для построения прогноза знать ограни чения, накладываемые структурной формой? (Объясните.) На каком этапе построения прогноза можно было бы учесть структурные ограничения?

11. Объясните различие между структурной и приведенной формой векторной авторегрессии. В чем причина того, что разложение дисперсии ошибки про гноза основывают на структурной форме, а не на приведенной форме?

12. Рассмотрите векторный процесс (xt, yt):

xt = xt-1 + t, yt = xt + yt-1 + t ( =0, || < 1).

а) Покажите, что xt и yt являются коинтегрированными CI(1, 0). Укажи те ранг коинтеграции и общий вид коинтегрирующих векторов.

б) Запишите процесс в виде векторной модели исправления ошибок. Ука жите соответствующую матрицу корректирующих коэффициентов и матрицу коинтегрирующих векторов.

13. Пусть в векторной модели исправления ошибок константа входит в коин теграционное пространство. Какие ограничения это налагает на параметры модели?

23.9. Упражнения и задачи 14. На примере векторной авторегрессии первого порядка с двумя переменными, коинтегрированными как CI(1, 0), покажите, что наличие константы (дрей фа) в коинтеграционном пространстве означает, что переменные содержат линейный тренд.

15. Пусть в векторной модели исправления ошибок p- xt = xt-1+ xt-jj + vt j= 1 6 матрица =.

2 4 3 2 Найдите ранг коинтеграции, матрицу коинтегрирующих векторов и мат рицу корректирующих коэффициентов.

16. Объясните, почему процедура Йохансена позволяет не проверять перемен ные на наличие единичных корней.

17. Пусть в векторной модели исправления ошибок p- xt = xt-1+ xt-jj + vt j= коинтегрирующие векторы равны (1;

-1;

0) и (1;

1;

1), а матрица коррек тирующих коэффициентов равна 1 =.

0 0 - Найдите матрицу.

Рекомендуемая литература 1. Amisano Gianni, Carlo Giannini. Topics in Structural VAR Econometrics, 2nd ed. — Springer, 1997.

690 Глава 23. Векторные авторегрессии 2. Banerjee A., J.J. Dolado, J.W. Galbraith and D.F. Hendry, Co-integration, Error Correction and the Econometric Analysis of Non-stationary Data. — Oxford University Press, 1993. (Ch. 5, 8.) 3. Canova F. «VAR Models: Specification, Estimation, Inference and Forecasting» in H. Pesaran and M. Wickens (eds.) Handbook of Applied Econometrics. — Basil Blackwell, 1994.

4. Granger C. W. J. Investigating Causal Relations by Econometric Models and Cross-Spectral Methods. // Econometrica, 37 (1969), 424–438.

5. Greene W.H. Econometric Analysis. — Prentice-Hall, 2000. (Ch. 17, 18).

6. Hamilton, J. D. Time Series Analysis. — Princeton University Press, 1994. (Ch.

10, 11).

7. Johansen S. Estimation and Hypothesis Testing of Cointegration Vectors in Gaussian Vector Autoregressive Models. // Econometrica, 59 (1991), 1551–1580.

8. Lutkepohl Helmut. Introduction to Multiple Time Series Analysis, second edition. — Berlin: Springer, 1993. (Ch. 2, 10, 11).

9. Muscatelli V.A. and Hurn S. Cointegration and dynamic time series models. // Journal of Economic Surveys, 6 (1992), 1–43.

10. Sims C. A. Macroeconomics and Reality. // Econometrica, 48 (1980), 1–48.

11. Stock J.H. and Watson M.W. Testing for Common Trends. // Journal of the American Statistical Association, 83 (1988), 1097–1107.

12. Watson Mark W. Vector Autoregressions and Cointegration. // Handbook of Econometrics, Vol. IV. Robert Engle and Daniel McFadden, eds. Elsevier, 1994, 2844–2915.

13. Mills Terence C. Time Series Techniques for Economists. — Cambridge Univer sity Press, 1990. (Ch. 14).

14. Mills Terence C. The Econometric Financial Modelling Time Series. — Cam bridge University Press, 1999. (Ch. 7, 8).

Приложение A Вспомогательные сведения из высшей математики A.1. Матричная алгебра A.1.1. Определения x.

.

x = {xi}i=1,..., n = называется вектор-столбцом размерности n.

.

xn x =(x1,,..., xn) называется вектор-строкой размерности n.

a11 a12... a1n a21 a22... a2n A = {aij} = i=1,..., m...

j=1,..., n...

...

am1 am2... amn называется матрицей размерности m n.

692 Приложение A. Вспомогательные сведения из высшей математики Сумма матриц A и B (m n): C = A + B = {aij + bij}, C (m n).

n Произведение матриц A (m n) и B (n k): C = AB = aitbtj, t= C (m k).

Скалярное произведение вектор-столбцов a (m 1) и b (m 1):

m a b = aibi.

i= Квадратичная форма вектор-столбца x (m 1) иматрицы A (m m):

m m x Ax = aijxixj.

i=1 j= Произведение матрицы A (m n) на скаляр : B = A = {aij}, B (m n).

Транспонирование матрицы A (m n): B = A = {aji}, B (n m).

m Следматрицы A (m m): tr (A) = aii.

i= Рангом (rank(A)) матрицы A называется количество линейно независи мых столбцов (равное количеству линейно независимых строк). Матри ца A (m n) имеет полный ранг по столбцам, если rank(A) = n. Мат рица A (m n) имеет полный ранг по строкам, если rank(A) =m.

Матрица A (m m) называется невырожденной (неособенной), если rank(A) =m. В противном случае она называется вырожденной.

Матрица A (m m) называется диагональной, если aij = 0 при i = j. Для диагональной матрицы используется обозначение A = =diag(a11,..., amm).

1 0 · · · 0 1 · · · Матрица Im = diag(1,..., 1) = (m m) называется...

.

....

.

...

0 0 · · · единичной.

Матрица A (m m) называется симметричной (симметрической), если A = A.

A.1. Матричная алгебра Матрица A (m m) называется верхней треугольной, если aij = при i >j. Матрица A (mm) называется нижней треугольной, если aij = при i

Матрица A-1 (mm) называется обратной матрицей к матрице A (mm), если AA-1 = A-1A = Im.

Матрица A (m m) называется идемпотентной, если AA = A2 = A.

Векторы-столбцы a (m 1) и b (m 1) называются ортогональными, если их скалярное произведение равно нулю: a b =0.

Матрица A (mn), где m n, называется ортогональной, если ее столбцы ортогональны, т.е. A A = In.

Матрица A (m m) называется положительно определенной, если для любого вектор-столбца x =0 (m 1) выполняется x Ax > 0. Матрица A (m m) называется отрицательно определенной, если для любого вектор столбца x =0 (m 1) выполняется x Ax < 0.

Матрица A (m m) называется положительно полуопределенной (неот рицательно определенной), если для любого вектора-столбца x (m 1) выполняется x Ax 0. Матрица A (m m) называется отрицательно по луопределенной (неположительно определенной), если для любого вектора столбца x (m 1) выполняется x Ax 0.

Определителем матрицы A (m m) называется m |A| =det(A) = aij(-1)i+j |Aij|, j= где i — номер любой строки, а матрицы Aij ((m - 1) (m - 1)) получены из матрицы A путем вычеркивания i-й строки и j-го столбца.

Для матрицы A (m m) уравнение |A - Im| =0 называется характери стическим уравнением. Решение этого уравнения называется собственным числом (собственным значением) матрицы A. Вектор x =0 (m 1) назы вается собственным вектором матрицы A, соответствующим собственному числу, если (A - Im) x =0.

694 Приложение A. Вспомогательные сведения из высшей математики Прямое произведение (произведение Кронекера) матриц A (m n) и B (p q) это матрица C (mp nq):

a11B a12B · · · a1nB a21B a22B · · · a2nB C = A B =.

...

.

....

.

...

am1B am2B · · · amnB A.1.2. Свойства матриц Сложение матриц • A + B = B + A (коммутативность).

• (A + B) +C = A +(B + C) (ассоциативность).

Произведение матриц • В общем случае AB = BA (свойство коммутативности не выполнено).

• (AB) C = A (BC) (ассоциативность).

• A (B + C) =AB + AC (A + B) C = AC + BC (дистрибутивность).

• AIm = ImA = A для матрицы A (m m).

A B E F AE + BG AF + BH • =.

C D G H CE + DG CF + DH Ранг • Для матрицы A (m n) выполнено rank(A) min{m, n}.

• rank(AB) min {rank(A), rank(B)}.

• Если матрица B (m m) является невырожденной, то для матрицы A (m n) выполнено rank(A) = rank(BA). Если матрица B (n n) яв ляется невырожденной, то для матрицы A (m n) выполнено rank(A) = =rank(AB).

• rank(A A) =rank(AA ) =rank(A).

A.1. Матричная алгебра Cлед • tr (A + B) =tr (A) +tr (B).

• tr (A) = · tr (A).

• tr (A) =tr (A ).

• tr (AB) =tr (BA).

• tr (ABC) =tr (CAB) =tr (BCA).

m n • tr (A A) =tr (AA ) = a2.

ij i=1 j= • tr (Im) =m.

• tr A(A A)-1A = n, где матрица A (m n) имеет полный ранг по столб цам, т.е. rank(A) =n.

A B • tr =tr (A) +tr (D), гд е A и D — квадратные матрицы.

C D Транспонирование • (A + B) = A + B.

• (AB) = B A.

Определитель • Для матрицы A (2 2): |A| = a11a22 - a12a21.

• |A| |B| = |AB|.

• |I| =1.

• |A| = m |A| для матрицы A (m m).

• |A | = |A|.

• A-1 =.

|A| 696 Приложение A. Вспомогательные сведения из высшей математики • Если матрица A (m m) является треугольной (например, диагональной), m то |A| = aii.

i= • |I + AB| = |I + BA|.

• A + BD-1C |D| = D + CA-1B |A|.

• |A + xy | = |A| (1 + y Ax) для матрицы A (m m) и вектор-столбцов x, y (m 1).

A • = |A| |B|, гд е A и B — квадратные матрицы.

0 B A B • = A - BD-1C |D| = D - CA-1B |A|, гд е A и D — квад C D ратные невырожденные матрицы.

• Матрица A (mm) является невырожденной (rank(A) =m) тогда и только тогда, когда |A| =0.

Обращение • Если обратная матрица существует, то она единственна (в частности, левая и правая обратные матрицы совпадают).

• Матрица A (m m) имеет обратную A-1 тогда и только тогда, когда она является невырожденной, т.е. rank(A) =m.

• Матрица A (m m) имеет обратную A-1 тогда и только тогда, когда |A| = =0.

• Обозначим через aij элементы обратной матрицы A-1. Тогд а (-1)i+j|Aji| aij =, гд е Aji ((m-1)(m-1)) получены из матрицы A путем |A| вычеркивания j-й строки и i-го столбца.

Во всех приводимых ниже формулах предполагается, что существуют обратные матрицы там, где это требуется.

A.1. Матричная алгебра • Для матрицы A (2 2):

a22 -a21 a22 -a 1 A-1 = =.

|A| a11a22 - a12a -a12 a11 -a12 a • Ax = y, x = A-1y.

• (AB)-1 = B-1A-1.

- • A-1 = A.

• (A )-1 = A-1.

• Если A (m m) — ортогональная матрица, то A = A-1.

• Для диагональной матрицы A =diag(a11,..., amm) выполнено:

A-1 =diag(1/a11,..., 1/amm).

- • (A + B)-1 = A-1 A-1 + B-1 B-1.

- • A + BD-1C = A-1 - A-1B(D + CA-1B)-1CA-1.

• (I + AB)-1 = I - A(I + BA)-1B.

- A 0 A-1 • =, гд е A и B — квадратные матрицы.

0 B 0 B- - A B (A - BD-1C)-1 -A-1B(D - CA-1B)- • =, C D -D-1C(A - BD-1C)-1 (D - CA-1B)- где A и D — квадратные матрицы.

Положительно определенные матрицы • Если матрица A положительно определенная, то |A| > 0. Если матрица A положительно полуопределенная, то |A| 0.

• Если матрица A положительно (полу-)определенная, то матрица -A от рицательно (полу-)определенная.

698 Приложение A. Вспомогательные сведения из высшей математики • Если матрица A положительно определенная, то обратная матрица A- также положительно определенная.

• Если матрицы A и B положительно (полу-)определенные, то матрицы A + B и AB также положительно (полу-)определенные.

• Если матрица A положительно определенная, а B положительно полу определенная, то |A + B| |A|. Если B положительно определенная, то |A + B| > |A|.

• Матрицы A A и A BA (n n) являются симметричными положительно полуопределенными для любой матрицы A (m n) и симметричной поло жительно полуопределенной матрицы B (m m).

• Если матрица A (m n) имеет полный ранг по столбцам, то матри ца A A (n n) симметричная положительно определенная. Если мат рица B (m m) симметричная положительно определенная, то матрица A BA (n n) симметричная положительно определенная.

• Если матрица A (m m) положительно полуопределенная, то существует верхняя треугольная матрица U (m m), такая что A = U U. Также суще ствует нижняя треугольная матрица L (m m), такая что A = L L. Такое представление матрицы называется разложением Холецкого (триангуляри зацией).

Идемпотентные матрицы • Если матрица A идемпотентная, то матрица I - A тоже идемпотентная, причем A(I - A) =0.

• Если матрица A симметричная и идемпотентная, то rank(A) =tr (A).

• Матрицы A (A A)-1 A и Im - A (A A)-1 A являются симметричными и идемпотентными для любой матрицы A (m n), имеющей полный ранг по столбцам. При этом tr A (A A)-1 A = n и tr Im - A (A A)-1 A = = m - n.

Собственные числа и векторы • Для матрицы A (m m) |A - Im| является многочленом m-й степени (характеристическим многочленом) и имеет m корней, 1,..., m, в общем случае комплексных, среди которых могут быть кратные. По определению, 1,..., m являются собственными числами матрицы A.

A.1. Матричная алгебра • У матрицы A (m m) существует не больше m различных собственных чисел.

• Если x — собственный вектор матрицы A, соответствующий собственному числу, то для любого скаляра = 0, x — тоже собственный вектор, соответствующий собственному числу.

m • Если 1,..., m — собственные числа матрицы A, то tr(A) = i, i= m |A| = i.

i= • Если матрица A идемпотентная, то все ее собственные числа равны 0 или 1.

• Все собственные числа вещественной симметричной матрицы вещественны.

• Если x и y — собственные векторы вещественной симметричной матрицы, соответствующие двум различным собственным числам, то они ортогональ ны: x y =0.

• Если матрица A (m m) является вещественной и симметричной, то существуют матрицы H и, где H (m m) — ортогональная матри ца (H = H-1), столбцы которой — собственные векторы матрицы A, а (m m) — диагональная матрица, состоящая из соответствующих соб ственных чисел матрицы A, такие что выполнено A = HH.

• Если матрица A (m m) является вещественной, симметричной, невырож денной, то A-1 = H-1H.

• Вещественная симметричная матрица является положительно полуопреде ленной (определенной) тогда и только тогда, когда все ее собственные числа неотрицательны (положительны). Вещественная симметричная матрица яв ляется отрицательно полуопределенной (определенной) тогда и только тогда, когда все ее собственные числа неположительны (отрицательны).

• Если матрица A (m m) является вещественной, симметричной и положи тельно полуопределенной, то A = B B = B2,где B = H1/2 H (m m) — вещественная, симметричная и положительно полуопределенная матрица;

/ 1/2 =diag{g }.

• Пусть 1 · · · m — собственные числа вещественной симметрич ной матрицы A (m m). Тогда собственый вектор x1, соответствующий 700 Приложение A. Вспомогательные сведения из высшей математики наименьшему собственому числу 1, является решением задачи x Ax min!

x x x =1.

• Пусть 1 · · · m — собственные числа вещественной симметричной x Ax x Ax матрицы A (m m). Тогда m =max и 1 =min.

x x x x x x Произведение Кронекера • A (B + C) =A B + A C и (A + B) C = A C + B C.

• A (B C) =(A B) C.

• A = · A = A.

• (A B) = A B.

• (A B)(C D) =(AC) (BD).

• (A B)-1 = A-1 B-1.

• |A B| = |A|n |B|m для матриц A (m m) и B (n n).

• tr (A B) =tr (A) · tr (B).

• rank(A B) =rank(A) · rank(B).

A.2. Матричное дифференцирование A.2.1. Определения Производной скалярной функции s(x) по вектор-столбцу x (n 1) или, другими словами, градиентом является вектор-столбец (n 1) s x s.

.

=.

.

x s xn A.2. Матричное дифференцирование Производной скалярной функции s(x) по вектор-строке x (1 n) является вектор-строка (1 n) s s s =,...,.

x x1 xn Производной векторной функции y(x) (n 1) по вектору x (1 m) или, другими словами, матрицей Якоби является матрица (n m) y yi =.

i=1, x xj j=1,..., n..., m • Производной векторной функции y(x) (1n) по вектору x (m1)является матрица (m n) y yj =.

i=1,..., m x xi j=1,..., n Производной скалярной функции s(A) по матрице A (m n) является матрица (m n) s s =.

i=1,..., m A aij j=1,..., n Производной матричной функции A(s) по скаляру s является матрица (m n) A aij =.

i=1,..., m s s j=1,..., n Второй производной скалярной функции s(x) по вектору-столбцу x (n 1) или, другими словами, матрицей Гессе является матрица (n n) 2s 2s =.

i=1,..., m xx xixj j=1,..., n A.2.2. Свойства x x • = I и = I.

x x Ax x A • = A и = A.

x x 702 Приложение A. Вспомогательные сведения из высшей математики x y y x • = = y.

x x x x • =2x.

x x Ay x Ay • = Ay и = x A.

x y x Ax • =(A + A )x.

x x Ax Для симметричной матрицы A: =2Ax =2A x.

x x Ay • = xy.

A x A-1y • =(A )-1 xy (A )-1.

A tr (A) • = I.

A tr (AB) tr (AB) • = B и = A.

A B tr (A A) • =2A.

A tr (A BA) • =(B + B ) A.

A tr (A BA) • = AA.

B |A| • = |A| (A )-1.

A ln |A| • =(A )-1.

A ln |A BA| • = BA (A BA)-1 + B A (A B A)-1.

A (AB) B A • = A + B.

s s s A-1 A • = -A-1 A-1.

s s A.3. Сведения из теории вероятностей и математической статистики ds (A) s dA s dA • =tr =tr.

dt A dt A dt tr (A) A • =tr.

s s ln |A| A • =tr A-1.

s s dy (x) y dx • =.

ds x ds A.3. Сведения из теории вероятностей и математической статистики A.3.1. Характеристики случайных величин Определения • Функцией распределения случайной величины x называется функция Fx(z) =Pr(x z), сопоставляющая числу z вероятность того, что x не пре вышает z. Функция распределения полностью характеризует отдельную слу чайную величину.

• Если случайная величина x непрерывна, то она имеет плотность fx(·), ко торая связана с функцией распределения соотношениями fx(z) =Fx(z).

• Квантилью уровня F, гд е F [0;

1], (F -квантилью) непрерывной случайной величины x называется число xF, такоечто xF Fx(xF ) = fx(t)dt = F.

• Медианой x0,5 называется 0, 5-квантиль.

• Модой непрерывной случайной величины называется величина, при которой x плотность распределения достигает максимума, т.е. =arg max fx(z).

z • Если распределение непрерывной случайной величины x симметрично от носительно нуля, т.е. fx(z) =fx(-z) и Fx(-xF ) =1 - Fx(xF ), то двусто ронней F -квантилью называется число xF, такоечто xF Fx(xF ) - Fx(-xF ) = fx(t)dt = F.

-xF 704 Приложение A. Вспомогательные сведения из высшей математики • Математическим ожиданием непрерывной случайной величины x называ + ется E(x) = tfx(t)dt.

• Математическое ожидание является начальным моментом первого по рядка. Начальным (нецентральным) моментом q-го порядка называется + E(xq) = tqfx(t)dt.

• По случайной величине x может быть построена соответствующая ей цен трированная величина x : x = x - E(x), имеющая аналогичные законы распределения и нулевое математическое ожидание.

• Центральным моментом q-го порядка случайной величины x называется на чальный момент q-го порядка для соответствующей центрированной вели чины x, т.е. E(q) =E [(x - E(x))q]. Для непрерывной случайной величины x центральный момент q-го порядка равен + µq = (t - E(x))qfx(t)dt.

• Дисперсией случайной величины называется центральный момент второго порядка. Для непрерывной случайной величины дисперсия равна + var(x) =x = E(2) =E (x - E(x))2 = (t - E(x))2fx(t)dt.

x • Среднеквадратическим отклонением называется квадратный корень из дис персии x = x. Нормированной (стандартизованной) случайной величи x - E(x) ной называется.

x • Коэффициентом асимметрии называется начальный момент третьего порядка нормированной случайной величины, т.е.

x - E(x) µ 3 = E =.

x x • Куртозисом называется начальный момент четвертого порядка нормирован ной случайной величины, т.е.

x - E(x) µ 4 = E =.

x x Коэффициентом эксцесса называется 4 - 3.

A.3 Сведения из теории вероятностей и матем. статистики • Для n-мерного случайного вектора x = (x1,..., xn) (многомерной слу чайной величины) функцией распределения называется Fx1,..., xn(z1,..., zn) =Pr(x1 z1,..., xn zn).

• Если распределение случайного вектора x непрерывно, то он имеет плотность fx(·) (называемую совместной плотностью случайных величин x1,..., xn), которая связана с функцией распределения соотношениями nFx1,..., xn(z) fx1,..., xn(z) =.

x1 · · · xn Случайные величины x1,..., xn называются независимыми (в совокупно сти), если Fx1,..., xn(z1,..., zn) =Fx1(z1) · · · Fxn(zn).

• Ковариацией случайных величин x и y называется cov(x, y) =E [(x - E(x)) (y - E(y))].

cov(x, y) • Корреляцией случайных величин x и y называется x,y =.

var(x)var(x) • Ковариационной матрицей n-мерной случайной величины x =(x1,..., xn) называется cov(x1, x1) · · · cov(x1, xn)..

.

...

x = var(x) = =.

..

cov(x1, xn) · · · cov(xn, xn) = E (x - E(x)) (x - E(x)).

• Корреляционной матрицей n-мерной случайной величины x =(x1,..., xn) называется 1 x1,x2 · · · x1,xn x1,x2 1 · · · x2,xn Px =.

...

.

....

.

...

x1,xn x2,xn · · · 706 Приложение A. Вспомогательные сведения из высшей математики Функция распределения и плотность • Функция распределения имеет следующие свойства: это неубывающая, непрерывная справа функция, 0 Fx(z) 1, причем lim Fx(z) = z и lim Fx(z) =1.

z z • Fx(z) = fx(t)dt.

• fx(z) 0.

+ • fx(t)dt =1.

b • Вероятность того, что x [a, b], равна Pr(a x b) = fx(t)dt.

a • Для многомерной случайной величины z1 zn Fx1,..., xn(z1,..., zn) = · · · fx1,..., xn(t1,..., tn)dtn... dt1.

- • Если случайные величины x1,..., xn независимы, то fx1,..., xn(z1,..., zn) =fx1(z1) ·... · fxn(zn).

Математическое ожидание • Если c — константа, то E(c) =c.

• Если x и y — любые две случайные величины, то E(x + y) =E(x) +E(y).

• Если c — константа, то E(cx) =cE(x).

• В общем случае E(xy) = E(x)E(y).

• Если функция f(·) вогнута, то выполнено неравенство Йенсена:

E (f(x)) f (E(x)).

• Для симметричного распределения выполено E(x) =x0,5.

A.3 Сведения из теории вероятностей и матем. статистики Дисперсия • var(x) =E(x2) - E(x)2.

• Для любой случайной величины x выполнено var(x) 0.

• Если c — константа, то выполнено: var(c) = 0;

var(c + x) = var(x);

var(cx) =c2var(x).

• Если x и y — любые две случайные величины, то в общем случае:

var(x + y) = var(x) +var(y).

Pages:     | 1 |   ...   | 7 | 8 || 10 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.