WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 | 2 || 4 |

«ИНСТИТУТ ЭКОНОМИКИ ПЕРЕХОДНОГО ПЕРИОДА В.П. Носко Эконометрика для начинающих Дополнительные главы Москва 2005 УДК 330.45:519.862.6 ББК 65в6 Н84 Носко В.П. Эконометрика для начинающих ...»

-- [ Страница 3 ] --

z 7.70 5.46 -2. P>z 0.00 0.00 0. через посредство Если использовать второй вариант оценивания коэффициента, описанный выше, то это приводит к следующим результатам.. xtpcse invest mvalue kstock, correlation(ar1) hetonly rhotype(tscorr) casewise Prais-Winsten regression, heteroskedastic panels corrected standard errors Autocorrelation: common AR(1) Estimated covariances = 10 R-squared = 0.6904 Estimated autocorrelations = 1 Estimated coefficients = 3 Wald chi2(2) = 192.41, Prob > chi2 = 0.0000 Het-corrected invest Coef. Std. Err. z P>z mvalue.1032102.0112252 9.19 0.000 kstock.2947986.0459298 6.42 0.000 cons -45.78767 13.97367 -3.28 0.001 rho.7563511 Оцененное значение существенно изменилось. Если допускается перекрестная коррелированность ошибок между уравнениями и ошибки в уравнениях для разных субъектов следуют одинаковым AR(1)-моделям (с общим ), то оценивание такой модели (по DW-варианту) дает следующие результаты.

Глава. xtpcse invest mvalue kstock, correlation(ar1) rhotype(dw) (note: estimates of rho outside [-1,1] bounded to be in the range [-1,1]) Prais-Winsten regression, heteroskedastic panels corrected standard errors Panels: heteroskedastic (balanced) Estimated covariances = 55, R-squared = 0.5468 Estimated autocorrelations = 1 Estimated coefficients = 3 Wald chi2(2) = 120.05, Prob > chi2 = 0.0000 Panel-corrected Coef. Std. Err. z P>z mvalue.0972395.0124362 7.82 0.000 kstock.306441.054533 5.62 0.000 cons -42.07116 24.09387 -1.75 0.081 rho.8678619 И опять использование второго варианта оценивания коэффициента приводит к несколько отличным результатам:. xtpcse invest mvalue kstock, correlation(ar1) rhotype(tscorr) casewise Prais-Winsten regression, correlated panels corrected standard errors (PCSEs) Panels: correlated (balanced Estimated covariances = 55, R-squared = 0.6904 Estimated autocorrelations = 1 Estimated coefficients = 3 Wald chi2(2)= 215.52, Prob > chi2 = 0.0000 Panel-corrected Coef. Std. Err. z P>z mvalue.1032102.0108656 9.50 0.000 kstock.2947986.0432809 6.81 0.000 cons -45.78767 15.24513 -3.00 0.003 rho. Панельные данные Посмотрим, что дает оценивание модели с перекрестной коррелированностью ошибок между уравнениями, когда ошибки в уравнениях для разных субъектов могут следовать разным AR(1)моделям (с разными i ). При оценивании такой модели (по DWварианту) получаем:. xtpcse invest mvalue kstock, correlation(psar1) rhotype(dw) casewise Prais-Winsten regression, correlated panels corrected standard errors (PCSEs) Panels: correlated (balanced) Autocorrelation: panel-specific AR(1) Estimated covariances = 55, R-squared = 0.7570 Estimated autocorrelations = 10, Estimated coefficients = 3, Wald chi2(2) = 211.38, Prob > chi2 = 0.0000 Panel-corrected Coef. Std. Err. z P>z mvalue.1013946.0108632 9.33 0.000 kstock.3449446.0478113 7.21 0.000 cons -41.18685 19.33078 -2.13 0.033 rhos =.7427231.8831453.9741851.7277056.9564705....9343119 А при оценивании по второму варианту –.xtpcse invest mvalue kstock, correlation(psar1) rhotype(tscorr) casewise Prais-Winsten regression, correlated panels corrected standard errors (PCSEs) Panels: correlated (balanced) Autocorrelation: panel-specific AR(1) Estimated covariances = 55, R-squared = 0.8670 Estimated autocorrelations =10 Estimated coefficients = 3 Wald chi2(2) = 444.53, Prob > chi2 = 0.0000 Panel-corrected Глава Coef. Std. Err. z P>z mvalue.1052613.0086018 12.24 0.000 kstock.3386743.0367568 9.21 0.000 cons -58.18714 12.63687 -4.60 0.000 rhos =.5135627.87017.9023497.63368.8571502....8752707 Заметим, что и здесь приходится оценивать значительное количество дисперсий, ковариаций и автокорреляций, используя всего 20 наблюдений, растянутых во времени. Для удобства объединим полученные результаты в одну таблицу, дополнительно указав в последнем столбце 95% доверительные интервалы для коэффициентов.

invest Coef. Std.Err. z P>z 95% Conf. Int. Независимые одинаково распределенные ошибки mvalue.116.0058 19.95 0.00.104.127 kstock.231.0253 9.12 0.00.181.280 Гетероскедастичность – WLS mvalue.112.0050 22.41 0.00.102.122 kstock.154.0126 12.23 0.00.129.178 SUR – GLS mvalue.113.0022 50.42 0.00.108.117 kstock.223.0057 38.90 0.00.212.234 AR(1) – common rho (Durbin – Watson) : est rho =.8678619 mvalue.097.0126 7.70 0.00.072.122 kstock.306.0561 5.46 0.00.196.416 AR(1) – common rho (OLS) : est rho =.7563511 mvalue.103.0112 9.19 0.00.081.125 kstock.295.0460 6.42 0.00.205.385 SUR&AR(1) – common rho (D–W) : est rho =.8678619 mvalue.097.0124 7.82 0.00.073.122 kstock.306.0545 5.62 0.00.200.413 SUR&AR(1) – common rho (OLS) : est rho =.7563511 mvalue.103.0109 9.50 0.00.082. Панельные данные kstock.295.0433 6.81 0.00.210.388 SUR&AR(1) – different rho (D–W) mvalue.101.0109 9.33 0.00 kstock.345.0478 7.21 0.00 rhos =.7427231.8831453.9741851.7277056....9343119 SUR&AR(1) – different rho (TSCORR) mvalue.105.0086 12.24 0.00 kstock.339.0368 9.21 0.00 rhos =.5135627.87017.9023497.63368....8752707 Здесь SUR&AR(1) означает наличие корреляции между ошибками в разных уравнениях в совпадающие моменты времени и AR(1)-модель для ошибок в пределах каждого предприятия. Обратимся теперь к модели ковариационного анализа M0 : yit = i + i xit + uit, i = 1,K, N, t = 1,K, T ;

i и i – неизвестные постоянные, uit – случайные ошибки. (Для простоты переменную x будем рассматривать пока как скалярную переменную.) Если предполагать, что 2 uit ~ i.i.d. N 0, u, i = 1,K, N, t = 1,K, T, и что E (xit u js ) = 0 для любых i, j = 1,K, N, t, s = 1,K, T, ( ) так что x является экзогенной переменной, то мы имеем дело с N не связанными между собой линейными регрессиями, удовлетворяющими предположениям классической нормальной линейной регрессии. Для получения оценок параметров i и i эти регрессии можно оценивать в этом случае порознь, так что оценки наименьших квадратов для i и i имеют вид:

Глава i = (x t = T it x i )( y it y i ) (x t = T, it xi ) i = y i i xi, где yi = i = 1,K, N, 1T 1T yit, xi = xit. T t =1 T t =1 Эти оценки имеют при фиксированных значениях yit и xit нормальное распределение и являются наилучшими линейными несмещенными оценками (BLUE). Если ошибки uit независимы между собой и имеют нормальные распределения с нулевыми средними, но дисперсии их различны для разных субъектов, так что 2 uit ~ i.i.d. N 0, ui, i = 1,K, N, t = 1,K, T, то тогда следует использовать взвешенный метод наименьших квадратов, приписывая каждому наблюдению для i -го субъекта вес 2 wi = 1 ui. Поскольку же дисперсии ui в реальных исследованиях не известны, приходится использовать доступную версию этого метода, в которой вместо весов wi = 1 ui берутся их оценки ( ) 2 wi = 1 ui, где ui – подходящие оценки неизвестных дисперсий. В качестве таковых можно брать, например, несмещенные оценки 2 дисперсий ui : 2 ui = RSS (i ) / ( N p ). RSS (i ) – сумма квадратов остатков, получаемых при Здесь оценивании модели регрессии для i -го субъекта, а p – количество объясняющих переменных в уравнениях регрессии (для парной регрессии с константой p = 2 ).

Панельные данные Несколько более сложная модель возникает, если предположить коррелированность ошибок для разных субъектов в совпадающие моменты времени. Это модель кажущихся несвязанными регрессий1 (SUR, SURE – seemingly unrelated regressions). При наличии такой коррелированности следует использовать уже не взвешенный, а обобщенный метод наименьших квадратов. Если представить уравнение для i -го субъекта в векторно-матричной форме y (i ) = X (i ) (i ) + u (i ), где yi1 1 xi1 ui1 (i ) (i ) (i ) (i ) y = M, X = M M, =, u = M, y 1 x u iT iT iT то модель SUR можно записать в следующем виде: X (1) 0L 0 (1) u (1) y (1) (2 ) 0 X 0 L M + M, M = M O M (N ) (N ) (N ) M u y 0 0 L X (N ) или (в очевидных обозначениях) y = X + u. При сделанных предположениях ковариационная матрица NT 1 -вектора u равна 11 12 L 1N 12 22 L 2 N = Cov(u ) =, M M O M 1N 2 N L NN В некоторых руководствах по эконометрике такую модель называют системой внешне не связанных между собой уравнений.

Глава где (T T ) -матрица ij имеет вид 0 ij 0, ij = Cov (uit, u jt ). M O M 0 L ij Обобщенная оценка наименьших квадратов (GLS-оценка) вектора находится по формуле 1 = = X T 1 X X T 1 y. 0 L L SUR GLS ij 0 ij = M Заметим, что подлежащая обращению матрица имеет размер NT NT. Однако такого обращения можно избежать вследствие наличия следующего соотношения: ( ( ( 11 1) 12 1) L 11) N (1) 1 (221) L (2N ) 12 1 =, M O M M ( 1) ( 1) L ( 1) NN 2N 1N где ( ij1) L 0 0 ( 1) L ij 0 0 ( 1) ij =, M O M M ( 0 0 L ij1) (1) 1 а ij – элементы матрицы, обратной к матрице 11 L 1N M. = M O 1N L NN Благодаря этому достаточно произвести обращение матрицы размера N N.

( ) Панельные данные Учет коррелированности ошибок в различных уравнениях позволяет ожидать определенного выигрыша в точности оценивания каждого из (i ) за счет информации, идущей от других уравнений через указанную коррелированность. Однако реальный выигрыш зависит от целого ряда факторов. Например, если ij = 2 для i j, то предпочтительность SUR-оценки возрастает с ростом 1, когда T велико. С другой стороны, если = 0, то SUR- и OLS-оценки совпадают. Кроме того, непосредственная реализация SUR-оценивания на практике невозможна из-за того, что значения ij не известны исследователю. Доступный (feasible) вариант SUR оценивания предусматривает использование адаптивной оценки FGLS вектора, при вычислении которой неизвестные значения ij заменяются их состоятельными оценками ij. Пусть e (i ) = y (i ) X (i ) (i ) – вектор остатков, получаемый при OLS-оценивании уравнения для i -го субъекта. Тогда естественной оценкой для ij является ij (e ) = (i ) T e( j) T.

При j = i это есть просто RSS (i ) T, и, как известно, такая оценка для дисперсии ошибки в i -м уравнении имеет смещение, а несмещенной оценкой для этой дисперсии является RSS (i ) (T p ), где p – количество объясняющих переменных в уравнении регрессии. (Конечно, при этом должно выполняться условие T > p.) При соответствующих условиях на матрицу X, требующихся и в классической модели линейной регрессии, обе оценки GLS и FGLS при T состоятельны.

Глава Пример Рассмотрим для иллюстрации приведенные в [Greene (1993), стр. 481] ежегодные данные об объемах инвестиций y и прибыли x трех предприятий ( N = 3 ) за десятилетний период ( T = 10 ).

t 1 2 3 4 5 6 7 8 9 10 Y1 13.32 26.30 2.62 14.94 15.80 12.20 14.93 29.82 20.32 4.77 X1 12.85 25.69 5.48 13.79 15.41 12.59 16.64 26.45 19.64 5.43 Y2 20.30 17.47 9.31 18.01 7.63 19.84 13.76 10.00 19.51 18.32 X2 22.93 17.96 9.160 18.73 11.31 21.15 16.13 11.61 19.55 17.06 Y3 8.85 19.60 3.87 24.19 3.99 5.73 26.68 11.49 18.49 20.84 X3 8.65 16.55 1.47 24.91 5.01 8.34 22.70 8.36 15.44 17. Здесь столбцы Yi, Xi содержат данные по i -му предприятию, i = 1, 2, 3. Ниже приведены графики изменения объемов инвестиций и прибыли по каждому из трех предприятий.

35 30 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 Y1 X Панельные данные 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 Y2 X 30 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 Y3 X Глава Раздельное оценивание уравнений регрессии (в пакете Eviews) дает следующие результаты. Первое предприятие:

Variable C X1 R-squared Variable C X2 R-squared Variable C X3 R-squared Coefficient Std. Error -2.468913 1.167170 0.9805 Coefficient Std. Error -1.384797 1.014542 0.9063 Coefficient Std. Error 0.455479 1.076374 0.9350 1.491604 0.100360 t-Statistic 0.305362 10.72516 Prob. 0.7679 0.0000 1.972680 0.115314 t-Statistic -0.701988 8.798102 Prob. 0.5026 0.0000 0.980426 0.058250 t-Statistic -2.518205 20.03737 Prob. 0.0359 0. Второе предприятие:

Третье предприятие:

Матрица = ( ij ) оценивается как 1.2549 0.0099 0.9101 1.0351 ;

= 0.0099 1.9628 0.9101 1.0351 4.3279 соответствующая корреляционная матрица имеет вид 1 0.0063 0.3905 1 0.3552. 0.0063 0.3905 0.3552 Использование результатам.

доступного GLS приводит к следующим Панельные данные Первое предприятие:

Variable C X1 R-squared Variable C X2 R-squared Variable C X3 R-squared Coefficient Std. Error -2.857213 1.192389 0.9800 Coefficient Std. Error -2.11701 1.05876 0.9046 Coefficient Std. Error 0.721196 1.055824 0.9346 1.199687 0.077589 t-Statistic 0.60 13.61 Prob. 0.553 0.000 1.66034 0.09663 t-Statistic -1.28 10.96 Prob. 0.214 0.000 0.812548 0047494 t-Statistic -3.52 25.11 Prob. 0.002 0. Второе предприятие:

Третье предприятие:

Оцененные коэффициенты несколько отличаются от результатов раздельного оценивания уравнений, и вопрос в том, сколь значимым является это различие. В связи с этим представляет интерес проверка гипотезы H 0 : ij = 0 для i j. В предположении нормальности ошибок эта гипотеза соответствует статистической независимости ошибок в разных уравнениях. Для проверки этой гипотезы можно использовать критерий Бройша–Пагана. Статистика этого критерия равна = T rij2, i =2 j = N i где rij = ij ii jj – оцененная корреляция между ошибками в i -м эта статистика имеет и j -м уравнениях. При гипотезе H Глава асимптотическое распределение хи-квадрат с числом степеней N ( N 1) 2 (заметим, что гипотеза свободы, равным H 0 накладывает именно столько ограничений, поскольку ij = ji ). В нашем примере накладывается 3 ограничения, статистика критерия принимает значение 2.787. Соответствующее ему Pзначение, вычисленное на основании распределения 2 (3), равно 0.4256, так что если ориентироваться на это P-значение, то гипотеза независимости не отвергается. Следует также обратить внимание на то, что различие между x1, x2, x3 довольно оценками коэффициентов при переменных невелико, так что возникает вопрос о проверке гипотезы совпадения этих коэффициентов: H 0 : 1 = 2 = 3. В рамках модели SUR для проверки этой гипотезы используются две формы критерия Вальда: одна основана на F статистике и P-значении, рассчитанном исходя из соответствующего F -распределения, а другая основана на статистике qF ( q – количество линейных ограничений) и P-значении, рассчитанном исходя из асимптотического распределения 2 (q ) этой статистики. Использование этих двух форм дает следующие результаты: Wald Test: F-statistic 1.342317 Probability 0.278120 Chi-square 2.684634 Probability 0.261240 Разница в двух P-значениях весьма мала и не приводит к различию в статистических выводах: гипотеза H 0 : 1 = 2 = 3 не отвергается. Поскольку ранее на основании применения критерия Бройша– Пагана мы не отвергли гипотезу независимости ошибок в разных уравнениях, естественно попытаться проверить гипотезу H 0 : 1 = 2 = 3 в условиях такой независимости. Заметим, что модель SUR в нашем примере записывается как Панельные данные y11 1 x11 0 0 0 0 u11 M M M M M M M M y 1 x 0 0 0 0 1 u 1T 1T 1 1T y21 0 0 1 x21 0 0 u21 2 M = M M M M M M + M y2T 0 0 1 x2T 0 0 2 u2T 3 y31 0 0 0 0 1 x31 u31 M M M M M M M 3 M y 0 0 0 0 1 x u 3T 3T 3T Это означает, что ее можно рассматривать как модель линейной регрессии переменной y, принимающей значения y11, y12,K, y1T, y21, y22,K, y2T, y31, y32,K, y3T, на следующие 6 переменных: три дамми-переменных (dummy variables) d1 со значениями 1,K,1, 0,K,0, 0,K,0 ;

13 1 3 1 3 2 2 T T T T T T d 2 со значениями 0, 2,0, 1, 2,1, 0, 2,0 ;

K K K 1 3 13 1 3 d 3 со значениями 0, 2,0, 0, 2,0, 1, 2,1 ;

K K K 1 3 1 3 T T T и три комбинированных переменных d1 x, d 2 x и d 3 x, построенных на основании указанных дамми-переменных и переменной x, принимающей значения x11, x12,K, x1T, x21, x22, K, x2T, x31, x32,K, x3T, так что d1 x, d 2 x и d 3 x принимают значения d1 x : x11, x12, K, x1T, 0,0, K, 0, 04, K,0,0 3 14 244 1 24 1 24 4 T T T d 2 x : 04, K,0, x 21, x 22, K, x 2T, 04, K,0,0 3,0 3 1 24 14 244 1 24 4 T T T d 3 x : 04, K,0, 04, K,0, x 31, x 32, K, x3T.,0 3,0 3 1 24 1 24 14 244 4 T T T Глава Если случайные ошибки в разных уравнениях статистически независимы, то мы можем получить эффективные оценки коэффициентов, применяя OLS-оценивание, и проверить интересующую нас гипотезу H 0 : 1 = 2 = 3 с использованием обычного F-критерия. При этом получаются следующие результаты:

Variable D1 D2 D3 D1*X D2*X D3*X Coefficient Std. Error t-Statistic Prob. -2.468913 -1.384797 0.455479 1.167170 1.014542 1.076374 1.388033 2.233064 1.137109 0.082467 0.130535 0.076508 -1.778714 -0.620133 0.400559 14.15324 7.772208 14.06874 0.0880 0.5410 0.6923 0.0000 0.0000 0. R-squared 0.950532 Wald Test: F-statistic 0.592788 Probability 0. Таким образом, гипотеза H 0 : 1 = 2 = 3 не отвергается и в предположении независимости ошибок. Мы будем говорить о модели M0 : yit = i + i xit + uit, i = 1,K, N, t = 1,K, T, как о “модели без ограничений”. Обозначим остаточную сумму квадратов (RSS) в этой модели как S0, S0 = (y N T i =1 t = it i i x it ).

В рамках модели без ограничений рассмотрим две гипотезы: H 1 : i одинаковы для всех i, H 2 : i и i одинаковы для всех i. Гипотеза H 1 : i соответствует модель одинаковы для всех i. Этой гипотезе Панельные данные M1 : yit = i + xit + uit, i = 1,K, N, t = 1,K, T. Остаточную сумму квадратов (RSS) в модели М1 обозначим через S1, S1 = (y N T i =1 t = N j = it i x it ).

Модель M1 можно записать в виде yit = i d ij + xit + uit, где d ij = 1, если j = i, и d ij = 0 в противном случае, так что мы имеем здесь в правой части N дамми-переменных. Обозначим: T y = ( y11, y12, K, y1T, y 21, y 22, K, y 2T, K, y N 1, y N 2, K, y NT ), u = (u11, u12, K, u1T, u 21, u 22, K, u 2T, K, u N 1, u N 2, K, u NT ), T x = ( x11, x12, K, x1T, x 21, x 22, K, x 2T, K, x N 1, x N 2, K, x NT ), T d1 = 1,1, K,1, 0, 0, K, 0, 44 4 3 123 1 24 NT T T d 2 = 0, 0, K, 0, 1,1, K,1, 0, 0, K, 0, 4 3 44 4 3 1 24 123 1 24 T T NT 2T d N = 0, 0, K, 0,1,1, K,1, 4 3 44 1 24 123 T NT T и пусть X = [d1 d 2 K d N x ] – матрица размера NT ( N + 1), столбцами которых являются векторы d1, d 2, K, d N, x. В этих обозначениях модель M1 принимает вид y = X + u, где T T K T Глава Соответственно, = 1, 2, K, N, = (1, 2, K, N, )T.

XT y. Будем предполагать далее, что 2 uit ~ i.i.d. N 0, u, i = 1,K, N, t = 1,K, T, и что E (xit u js ) = 0 для любых i, j = 1,K, N, t, s = 1,K, T, = X T X ( ( ) ) ) оценка наименьших квадратов T для вектора вычисляется по формуле ( так что x является экзогенной переменной. При этих предположениях и при фиксированной матрице X оценка имеет (N + 1) -мерное нормальное распределение, причем E =, т.е. является несмещенной оценкой для, а ковариационная матрица случайного вектора имеет вид 1 Cov = 2 X T X. Интересно, что численно те же самые значения оценок параметров 1, 2, K, N, можно получить иным способом. Именно, пусть 1T 1T 1T yi = yit, xi = xit, ui = uit T t =1 T t =1 T t =1 – средние по времени значения переменных y, x и ошибки для i -го субъекта исследования. Усредняя по времени обе части уравнений yit = i + xit + uit, получаем yi = i + xi + ui, i = 1,K, N. Из двух последних уравнений находим: yit yi = ( xit xi ) + (uit ui ), i = 1, K, N, t = 1, K, T () () u ( ) Панельные данные (“модель, скорректированная на индивидуальные средние”). В правой части полученной модели оказались исключенными параметры 1, 2, K, N. Это приводит к меньшей стандартной ошибке оценки для параметра, который обычно представляет первоочередной интерес. В рамках последней модели эта оценка вычисляется по формуле = (x i =1 t =1 N N T it x i )( y it y i ) (x i =1 t = T, it xi ) и о ней говорят как о “внутригрупповой” оценке (“within-group” estimate), имея в виду, что она строится только на основании отклонений значений переменных от их средних по времени и тем самым принимает во внимание только изменчивость в пределах каждого субъекта, не обращая внимание на изменчивость между субъектами. Точнее, конечно, следовало бы говорить о “внутрисубъектной” оценке, но используемая здесь терминология исторически вышла из теории дисперсионного анализа, где субъекты исследования часто объединяются в некоторое количество групп, так что индекс i относится не к отдельному субъекту, а к группе субъектов. Впрочем, в последнее время в эконометрической литературе чаще стали говорить об указанной оценке просто как о “within”-оценке. Соответственно, мы часто будем использовать термин “внутри” -оценка. Получив в последней модели оценку наименьших квадратов, оценки для параметров 1, 2, K, N можно вычислить следующим образом: i = y i x i, i = 1,K, N. Полученные в итоге этих двух шагов оценки,, K,, 1 N численно совпадают с оценками наименьших квадратов, N Глава получаемыми в модели yit = i d ij + xit + uit. Следует только j = учитывать, что стандартные ошибки оценок отличаются в этих двух моделях, а стандартные ошибки оценок i, получаемые в результате двухшаговой процедуры, нельзя вычислять по формулам для стандартных ошибок оценок наименьших квадратов.

Гипотеза H 2 : i и i одинаковы для всех i. Ей соответствует модель M2 : yit = + xit + uit, i = 1,K, N, t = 1,K, T (пул – pool). Оценки наименьших квадратов для параметров и вычисляются по формулам = (x i =1 t =1 NT N T it x )( y it y ) (x i =1 t =, it x) =y x, где 1NT 1NT yit, x = NT xit. NT i=1 t =1 i =1 t =1 Обозначим остаточную сумму квадратов в модели М2 через S 2, y= S2 = (y N T i =1 t = it x it ).

Рассмотрим задачу проверки гипотез H 1 и H 2 в рамках модели M0 при сделанных ранее предположениях.

Панельные данные Проверка гипотезы H 2. Используем F-статистику (S S0 ) 2(N 1) ;

F2 = 2 S 0 ( NT 2 N ) если гипотеза H 2 верна, то F2 ~ F2 ( N 1), NT 2 N. Если значение F2 статистически незначимо, то следует объединить данные в пул. Если же значение F2 статистически значимо, то следует искать источник гетерогенности параметров. Проверка гипотезы H1. Используем F-статистику (S S 0 ) (N 1) ;

F1 = 1 S 0 (NT 2 N ) если гипотеза H1 верна, F1 ~ FN 1, NT 2 N. Если значение F1 статистически значимо, то проверка прекращается. Если же значение F1 статистически незначимо, то гипотеза H1 (о совпадении всех i ) не отвергается. Можно также применить условный критерий гетерогенности i, а именно, проверить гипотезу H 3 : 1 = K = N при условии 1 = K = N, т.е. в рамках модели M1 : yit = i + xit + uit. Для этой цели используем статистику (S S ) (N 1), F3 = 2 1 S1 ( NT N 1) которая при гипотезе H 3 имеет распределение FN 1, NT N 1. Пример Продолжим расмотрение данных об инвестициях и прибыли трех предприятий.

Глава Выше мы уже проверили гипотезу H 1 : “ i одинаковы для всех i ” в рамках модели M0 и не отвергли эту гипотезу. Проверим в рамках той же модели M0 гипотезу H 2 : “ i и i одинаковы для всех i ”: Wald Test: F-statistic 3.595209 Probability 0.019644 Эта гипотеза отвергается. Проверим теперь гипотезу H 3 : 1 = K = N в рамках модели M1 : yit = i + xit + uit : Wald Test: F-statistic 6.810977 Probability 0.004183 Эта гипотеза также отвергается. с Полученные результаты говорят в пользу модели M1 одинаковыми i, но различными i.

3.2. Фиксированные эффекты Начиная с этого раздела, мы обращаемся к методам анализа панельных данных, предназначенным в основном для анализа данных {y it, xit ;

i = 1, K, N, t = 1, K, T }, в которых количество субъектов исследования N велико, а количество наблюдений T над каждым субъектом мало. Вследствие малости T в таких ситуациях затруднительно использовать технику, интерпретирующую y1t, y2t,K, y Nt как N временных рядов длины T (например, технику векторных авторегрессий и моделей коррекции ошибок для нестационарных временных рядов). Основная направленность методов, предполагающих малость T, – получение по возможности наиболее эффективных оценок коэффициентов. Сначала мы сфокусируем внимание на модели, соответствующей гипотезе H 1 со скалярной объясняющей переменной x :

Панельные данные т.е.

yit = i + xit + uit, i = 1,K, N, t = 1,K, T, y it = i d ij + x it + u it, j =1 N где d ij = 1, если i = j и d ij = 0 в противном случае, так что мы имеем здесь в правой части N дамми-переменных. Здесь i трактуются как неизвестные фиксированные параметры (фиксированные эффекты, fixed effects). Как и ранее, будем предполагать, что в этой модели 2 uit ~ i.i.d. N 0, u, i = 1,K, N, t = 1,K, T, и что E (xit u js ) = 0 для любых i, j = 1,K, N, t, s = 1,K, T, ( ) так что x является экзогенной переменной. Альтернативные названия этой модели: 1. OLS – дамми модель (LSDV – least squares dummy variables);

2. модель с фиксированными эффектами (FE – fixed effects model);

3. модель ковариационного анализа (CV – covariance analysis). В этой модели оценка наименьших квадратов, как мы уже отмечали выше, имеет вид:

= (x i =1 t =1 N N T it x i )( y it y i ) CV (x i =1 t = T ;

it xi ) при этом Глава D CV = () 2 u (x i =1 t = N T.

xi ) it Альтернативные названия для этой оценки 1. “внутригрупповая” оценка (“внутри”-оценка, withinestimator), 2. оценка фиксированных эффектов, 3. ковариационная оценка. Часто для этой оценки используют также обозначения W (индекс W – от within) и. Как мы уже отмечали выше, эта оценка FE теоретически имеет одно и то же значение при двух альтернативных методах ее получения: в рамках статистической модели yit = i d ij + xit + uit с дамми-переменными и в рамках модели в N j = отклонениях от групповых средних yit yi = ( xit xi ) + (uit ui ), i = 1, K, N, t = 1, K, T. Однако если количество субъектов анализа N велико, то в первой модели приходится обращать матрицу весьма большого размера ( N +1), тогда как во второй модели такой проблемы не возникает. Оценки для фиксированных эффектов вычисляются по формуле: i = y i x i, i = 1,K, N. При сделанных предположениях является наилучшей линейной несмещенной оценкой (BLUE) для коэффициента, p lim CV =, p lim CV =, p lim i = i, T N CV T но p lim i i, хотя E ( i ) = i.

N Таким образом, CV является состоятельной оценкой и когда N и когда T, в то время как i состоятельна только, Панельные данные когда T. Последнее есть следствие того, что оценивание каждого i производится фактически лишь по T наблюдениям, так что при фиксированном T с ростом N происходит лишь увеличение количества параметров i, но это не приводит к возрастанию точности оценивания каждого конкретного i. Заметим, что если нас интересует только состоятельность оценки CV, но не ее эффективность (т.е. свойство BLUE), то для этого не требуется строгая экзогенность x (т.е. не требуется, чтобы E (xit u js ) = 0 для любых i, j = 1,K, N, t, s = 1,K, T ). В этом случае достаточно выполнения соотношений E ( xit uis ) = 0 для любых t, s = 1, K, T и i = 1, K, N (т.е. требуется лишь экзогенность x в рамках каждого отдельного субъекта исследования).

В модели с фиксированными эффектами получаемые выводы – условные по отношению к значениям эффектов i в выборке. Такая интерпретация наиболее подходит для случаев, когда субъектами исследования являются страны, крупные компании или предприятия, т.е. каждый субъект ”имеет свое лицо”. Сами эффекты i по-существу отражают наличие у субъектов исследования некоторых индивидуальных характеристик, не изменяющихся со временем в процессе наблюдений, которые трудно или даже невозможно наблюдать или измерить. Если значения таких характеристик не наблюдаются, то эти характеристики невозможно непосредственно включить в правые части уравнений регрессии в качестве объясняющих переменных. Но тогда мы имеем дело с “пропущенными переменными” – с ситуацией, которая может приводить к смещению оценок наименьших квадратов. Чтобы исключить такое смещение, в правые части уравнений вместо значений ненаблюдаемых индивидуальных характеристик как раз и i. Проиллюстрируем вводятся ненаблюдаемые эффекты возникновение указанного смещения следующим примером.

Глава Пример На следующем графике представлено облако рассеяния точек (xit, yit ), порожденных моделью yit = i + xit + uit, i = 1, 2, t = 1,K,100, в которой 1 = 150, 2 = 250, = 0.6, uit ~ i.i.d. N 0,10 2. Значения xit заданы (неслучайны);

при i = 1 значения x1t меньше 150, а при i = 2 значения x2t больше 150.

450 Y y = 250 + 0.6 x y = 150 + 0.6 x Группа 1 Группа ( ) y = 8.00 + 1.88 x 50 0 50 100 X 150 200 Облако точек распадается на две группы точек: в группе 1 объединяются точки, соответствующие i = 1, а в группе 2 – точки, соответствующие i = 2. Точки первой группы располагаются вдоль (теоретической) прямой y = 150 + 0.6 x (нижняя пунктирная линия Панельные данные на графике), точки второй группы – вдоль (теоретической) прямой y = 250 + 0.6 x. Если по имеющимся 100 наблюдениям оценивать статистическую модель yit = + xit + uit, i = 1, 2, t = 1,K,100, (пул), не принимающую во внимание возможное наличие индивидуальных эффектов, то оцененная модель принимает вид y it = 8.00 + 1.88 x it, так что оценка коэффициента оказывается завышенной втрое по сравнению со значением, использованным при моделировании. В то же время, если перейти от переменных xit, yit к отклонениям от средних значений в группах xit xi и yit yi, то для новых переменных облако рассеяния концентрируется вокруг начала координат (на следующем графике соответствующие точки изображены черными квадратами) и вытянуто в правильном направлении:

y = 0.52 x -50 150 0 Глава Оцененная модель в отклонениях от средних в группах имеет вид: y it = 0.517 x it, и на этот раз оценка коэффициента оказывается близкой к значению = 0.6, использованному при моделировании. Если оценивать модель с дамми-переменными y it = 1 d i1 + 2 d i 2 + x it + u it, где d ij = 1, если j = i, и d ij = 0 в противном случае, то результаты оценивания таковы: Dependent Variable: Y Variable Coefficient D1 D2 X 161.4615 264.8593 0.517319 Std. Error 7.260153 10.46430 0.058229 t-Statistic 22.23940 25.31074 8.884227 Prob. 0.0000 0.0000 0. Полученные оценки 1 = 161.46, 2 = 264.86, = 0.517 близки к значениям параметров, использованным при моделировании.

3.3. Случайные эффекты Запишем модель yit = i + xit + uit, i = 1,K, N, t = 1,K, T, соответствующую гипотезе H 1, в равносильном виде: yit = µ + i + xit + uit, где i = 0 i = N (при таком условии i называют дифференциальными эффектами). В ряде ситуаций N субъектов, для которых имеются статистические данные, рассматриваются как случайная выборка из некоторой более широкой совокупности (популяции), и исследователя интересуют не конкретные субъекты, попавшие в выборку, а обезличенные субъекты, имеющие заданные Панельные данные характеристики. Соответственно, в таких ситуациях предполагается, что i являются случайными величинами, и мы говорим тогда о модели y it = µ + i + x it + u it как о модели со случайными эффектами (random effects). В такой модели i уже не интерпретируются как значения некоторых фиксированных параметров и не подлежат оцениванию. Вместо этого оцениваются параметры распределения случайных величин i. Обозначая it = i + uit, получаем другую запись такой модели: yit = µ + xit + ( i + uit ) = µ + xit + it. В такой форме модели ошибка it состоит из двух компонент i и uit. Как и в модели с фиксированными эффектами, случайные эффекты i также отражают наличие у субъектов исследования некоторых индивидуальных характеристик, не изменяющихся со временем в процессе наблюдений, которые трудно или даже невозможно наблюдать или измерить. Однако теперь значения этих характеристик встраиваются в состав случайной ошибки, как это делается в классической модели регрессии, в которой наличие случайных ошибок интерпретируется как недостаточность включенных в модель объясняющих переменных для полного объяснения изменений объясняемой переменной. К прежним предположениям о том, что 2 uit ~ i.i.d. N 0, u, i = 1,K, N, t = 1,K, T, и E (xit u js ) = 0 для любых i, j = 1,K, N, t, s = 1,K, T, ( ) добавим также следующие предположения: E ( i ) = 0 (так что и E ( it ) = 0 ), 2, если i = j, E ( i j ) = 0, если i j Глава (это означает, что последовательность значений 2 представляет случайную выборку из распределения N 0, u ), E (xit j ) = 0, i, j = 1, K, N, t = 1, K, T, ( 1, K, N ) (так что E (xit js ) = 0, и в модели со случайными ошибками it переменная x является экзогенной переменной). Если предположить еще, что E (uit i ) = 0, то тогда условная относительно xit дисперсия случайной величины yit равна 2 2 D( yit xit ) = D( it xit ) = D( it ) = D( i + uit ) = + u.

Таким образом, дисперсия yit складывается из двух называют компонентами некоррелированных компонент;

их дисперсии, а саму модель называют 1. моделью компонент дисперсии;

2. однофакторной моделью компонент дисперсии;

3. стандартной моделью со случайными эффектами (RE модель – random effects model). В векторной форме эта модель имеет вид yi = [e xi ] + i, где xi1 i1 yi1 1 µ xi 2 i 2 yi 2 1 yi =, e =, xi =, =, i =. M M M M 1 x y iT iT iT Заметим, что 2 + 2, если t = s, E ( it is ) = E ( i + uit, i + uis ) = 2 u, если t s, Панельные данные так что случайные величины it и is коррелированы даже если ковариационная матрица некоррелированы ошибки uit, и случайного вектора i имеет вид 2 2 V = E i iT = u I T + eeT. Например, при T = 3 2 2 2 2 u + 2 2 2 u2 +. V = 2 2 2 2 u + При этом ( ) Corr ( it, is ) = 2 = 2 2 + u для всех t s (предположение равной коррелированности в модели компонент дисперсии). Оценивание В RE-модели оценка = (x i =1 t =1 N N T it x i )( y it y i ) it CV (x i =1 t = T xi ) остается несмещенной и состоятельной оценкой для. Однако она перестает быть эффективной оценкой (BLUE), как это было в модели с фиксированными эффектами, поскольку не учитывает коррелированность it во времени для субъекта i. Мы можем ожидать, что обобщенная оценка наименьших квадратов (GLS-оценка), учитывающая такую коррелированность, будет вид более эффективной. Заметим, что GLS-оценка для имеет Глава и что GLS N = i = N e T 1 V [e x i ] T i =1 xi e T 1 T V y i xi V 1 = eeT eeT 1 IT +, u2 T T где = u 2 u2 + T. Чтобы не возникало путаницы с другими GLS оценками, для GLS-оценки в стандартной модели со случайными эффектами используется также обозначение RE. Заметим, что 1 2 диагональные элементы матрицы V 1 равны 1 u, а T 1. недиагональные элементы равны 2 T u Практически получить можно следующим образом.

RE Усредняя по t обе части уравнения yit = µ + xit + it, получаем соотношение yi = µ + xi + i. Обозначив = 1, произведем преобразование yit = yit yi, xit = xit xi, it = it i, µ = (1 )µ. В результате получаем преобразованную модель yit = µ + xit + it с экзогенной переменной xit, в которой ковариационная матрица вектора ошибок it имеет вид: 2 Cov it = u I T. Поэтому применение OLS к преобразованной модели дает BLUEоценку () Панельные данные GLS = (x N T i =1 t =1 N * it * x y it y x it )( ), ( T i =1 t = T x ) где y = 1 NT y it, i =1 t = N x = 1 NT xit. i =1 t = N T Это выражение можно представить в виде GLS = w b + (1 w) CV, где b = (x i =1 T T i x )( y i y ) (x i = – “межгрупповая” оценка (междуi x) оценка, between-group estimate), соответствующая регрессии средних значений yi на константу и средние значения xi, т.е. yi = µ + xi + i (“модель для групповых средних”), и игнорирующая внутригрупповую изменчивость, w= (xi x ) i =1 N (x i =1 t = N T it xi ) + ( xi x ) 2 i = N.

Таким образом, обобщенная оценка наименьших квадратов GLS в RE-модели учитывает и внутригрупповую и межгрупповую изменчивость. Она является взвешенным средним “межгрупповой” оценки b (учитывающей только межгрупповую изменчивость) и Глава “внутригрупповой” оценки CV (учитывающей только внутригрупповую изменчивость), а w измеряет вес, придаваемый межгрупповой изменчивости. При сделанных предположениях обе оценки b и CV состоятельны, так что состоятельна и сама GLS. Если T, то 0, w 0 и GLS CV, так что при больших T оценки для, получаемые в рамках моделей фиксированных и случайных эффектов, эквивалентны. 2 2 2 2 Если 0, то 1 и V = E i iT = u I T + ee T u I T. Соответственно, при этом GLS-оценка переходит в OLS-оценку, т.е.

( ) GLS (x i =1 t =1 NT N T it x )( y it y ) it (x i =1 t = x) = OLS (в пределе нет никаких эффектов). Заметим далее, что D GLS = ( ) 2 u (x i =1 t = 2 u N T N T it xi ) + (x i = N.

i x) В то же время D CV = () (x i =1 t = it xi ).

Поскольку > 0, то из двух последних соотношений следует, что D GLS < D CV, т.е. GLS-оценка эффективнее. Она эффективнее оценки именно ( )() CV потому, что использует как информацию о внутригрупповой изменчивости, так и информацию о межгрупповой изменчивости.

Панельные данные Чтобы реализовать эту GLS, т.е. получить доступную GLSоценку (FGLS – feasible GLS, или EGLS – estimated GLS), надо 2 подставить в выражения для (и ) подходящие оценки для u и 2 u2 + T. Оценить u2 можно, используя внутригрупповые остатки ( y it y i ) CV ( xit xi ), полученные при оценивании индивидуальные средние:

модели, скорректированной на 2 u = [( y N T i =1 t = it yi ) CV ( xit xi ) N (T 1) ] (в знаменателе число степеней свободы равно количеству наблюдений NT минус количество оцениваемых параметров N + 1 ). 2 2 Оценить дисперсию случайных эффектов = D ( i ) можно, заметив, что при оценивании модели yi = µ + xi + i, приводящей к межгрупповой оценке b = (x i =1 T T i x )( y i y ) x) (x i =, i дисперсия остатка для i -й группы равна 2 2 D y i µ b b xi = u T +.

2 2 Состоятельной оценкой для u T + является ( ) Глава (y N i = i µ b b xi ). N 2 2 Поэтому состоятельной оценкой для служит 2 = (y N i = i µ b b xi N ) 2 u T ;

N 2 2 2 является состоятельной оценкой для u + T. Эти две оценки используют межгрупповые остатки. Они являются также оценками максимального правдоподобия соответствующих дисперсий. Следует только отметить, что, особенно при небольших значениях N и T, значение вычисленной указанным образом 2 оценки дисперсии может оказаться отрицательным.

2 2 u + T = T (y N i = i µ b b xi ) Замечание Внутригруповую и GLS-оценки можно получить в пакете STATA, используя команду xtreg (с опциями fe или re).

Как мы уже отмечали выше, GLS можно представить в виде = w + (1 w), GLS b CV так что GLS является линейной комбинацией “внутри” и “между” оценок. Эта линейная комбинация оптимальна. Поэтому, например, оценка OLS, также являющаяся линейной комбинацией этих двух оценок (при = 1 ), хотя и состоятельна, но менее эффективна.

Панельные данные Критерий Бройша–Пагана для индивидуальных эффектов. Это критерий для проверки в рамках RE-модели (со стандартными предположениями) гипотезы 2 H 0 : = 0 (сведение к модели пула). Идея критерия основана на тождестве NT N T 2 uit = uit + uisuit, t =1 i =1 t =1 i =1 s t i =1 из которого следует, что N T uit i =1 t =1 1 = NT uit N i =1 t = u u i =1 s t NT N is it uit i =1 t =.

При отсутствии автокоррелированности случайных ошибок u it правая часть последнего равенства мала. Поэтому статистику критерия можно основывать на выражении, стоящем в левой части, в которое вместо ненаблюдаемых значений uit подставляются остатки u it, полученные при OLS-оценивании модели пула. Против гипотезы H 0 говорят “слишком большие” значения 2 NT u it i =1 t =1 1. NT 2 u it i =1 t =1 Статистика критерия Бройша–Пагана 2 2 N NT u it T 2 u i2 NT NT i =1 t =1 i =1 1 = BP = NT 1 N T 2(T 1) 2(T 1) 2 2 u it u it i =1 t =1 i =1 t =1 Глава при гипотезе H 0 имеет асимптотическое распределение 2 (1). Соответственно, гипотеза H 0 отвергается, если наблюдаемое значение статистики BP превышает критическое значение, рассчитанное по распределению 2 (1).

3.4. Коэффициенты детерминации, полной суммы квадратов разложение При анализе панельных данных возникают некоторые проблемы с определением коэффициента детерминации R 2, так что во многих руководствах по эконометрике и монографиях, специально посвященных анализу панельных данных, вообще не упоминается о коэффициенте детерминации. В то же время в некоторых пакетах статистического анализа предусмотрено вычисление коэффициентов детерминации и для панельных данных. Проблема с определением коэффициента детерминации в случае панельных данных связана с неопределенностью в отношении того, что считать полной суммой квадратов, подлежащей разложению на объясненную регрессией и остаточную суммы квадратов. Здесь мы имеем соотношение N T N 1NT ( y it y )2 = 1 ( y it y i )2 + 1 ( y i y )2, NT i = 1 t = 1 NT i = 1 t = 1 N i =1 и в качестве полной суммы квадратов может использоваться каждая из входящих в это выражение трех сумм квадратов. Соответствующие этим полным суммам регрессионные модели объясняют:

Панельные данные • • • отклонения наблюдаемых значений y it от их среднего по всем NT наблюдениям;

отклонения наблюдаемых значений y it в группах от их средних по группе;

отклонения средних по группам от среднего по всем NT наблюдениям.

Если мы используем оценку “пул”, то она получается в результате применения метода наименьших квадратов к уравнению yit = + xit + uit, i = 1,K, N, t = 1,K, T. При этом коэффициент детерминации равен квадрату (выборочного) коэффициента корреляции между переменными yit и y = + x, it OLS it где OLS – OLS-оценка коэффициента в модели пула. Об этом коэффициенте детерминации говорят как о “ R 2 -полном” ( R 2 overall), 2 Roverall = corr 2 y it, + OLS x it = corr 2 y it, OLS x it. Если мы используем оценку “между”, то она получается в результате применения метода наименьших квадратов к уравнению yi = µ + xi + i, i = 1,K, N. При этом коэффициент детерминации равен квадрату (выборочного) коэффициента корреляции между переменными yit и y =µ+ x, ( ) ( ) i b i где b – “между”-оценка для коэффициента коэффициенте детерминации говорят как о between), 2 Rbetween = corr 2 µ + b x i, y i = corr 2 b x i, y i. Если мы используем оценку “внутри”, то она получается в результате применения метода наименьших квадратов к уравнению. Об этом “ R -между” ( R 2 ( ) ( ) Глава yit yi = (xit xi ) + (uit ui ), i = 1,K, N, t = 1,K, T. В правой части последнего уравнению отсутствует константа. А при OLS-оценивании уравнений вида zi = wi + vi коэффициент детерминации в общем случае не равен квадрату выборочного коэффициента корреляции между переменными z i = wi и zi. Однако если переменные zi и wi центрированы, так что z = w = 0, то такое равенство обеспечивается. В нашем случае переменные yit yi и xit xi центрированы, так что коэффициент детерминации, получаемый при оценивании уравнения в отклонениях от средних по группам равен квадрату (выборочного) y коэффициента корреляции между переменными ~it = yit yi и ~ = ( x x ), i = 1,K, N, t = 1,K, T, y it CV it i где CV – “внутри”-оценка для коэффициента. Об этом “ R 2 -внутри” ( R 2 коэффициенте детерминации говорят как о within), 2 R within = corr 2 CV (x it x i ), y it y i.

Каждый из этих трех вариантов R 2 является обычным коэффициентом детерминации в соответствующей модели моделей регрессии. В то же время при анализе различных панельных данных часто сообщаются вычисленные значения всех трех вариантов R 2, несмотря на то, что в модели с фиксированными эффектами используется оценка CV, в модели со случайными, а в модели пула – оценка. эффектами – оценка GLS OLS ( ) Более точно, при анализе панельных данных принято сообщать 2 2 2 под названиями Rwithin, Rbetween, Roverall значения R2 = corr 2 y y, (x x ), within it 2 Rbetween = corr 2 y i, 2 Roverall = corr 2 y it, ( ( ( ) x ), xi, it i it i ) Панельные данные вне зависимости от того, каким образом была получена оценка. Если является p -мерным вектором, то, соответственно, T R2 = corr 2 y y, (x x ), within it 2 2 Rbetween = corr y i, 2 Roverall = corr 2 y it, ( 2 При этом приводимое значение Rwithin является коэффициентом детерминации в обычном смысле, если = within ;

приводимое 2 значение Rbetween является коэффициентом детерминации в обычном 2 смысле, если = between ;

приводимое значение Roverall является коэффициентом детерминации в обычном смысле, если =.

( ( i x iT T x it ) ).

it i, ) OLS П р и м е р (продолжение) Приведем результаты оценивания в пакете Stata8 моделей с фиксированными и случайными эффектами для данных о трех предприятиях. При этом заметим, что в рамках этого пакета приняты обозначения, отличающиеся от используемых нами: индивидуальные эффекты обозначаются как u i, а случайные ошибки – как eit. Чтобы избежать путаницы, в приводимые далее протоколы оценивания внесены соответствующие изменения. Fixed-effects (within) regression R-sq: within = 0.9478 between = 0.8567 overall = 0.9209 Проверка значимости регрессии в целом: F(1,26) = 472.26, Prob > F = 0.0000 Оцененное значение коэффициента индивидуальным эффектом и переменной x корреляции между Глава corr(_i, X) = -0.2311 VARIABLE Coef. x 1.102192 cons -1.394325 sigma_lfa sigma_u rho Std. Err..0507186. t 21.73 -1. P>t 0.000 0. 1.480319 1.745136.4184474 (fraction of variance due to _i) F test that all alfa_i=0: F(2, 26) = 6.81, Prob > F = 0.0042 Последний критерий соответствует гипотезе с двумя линейными ограничениями: поскольку в модель включена постоянная составляющая, то одно линейное ограничение накладывается заранее как идентифицирующее и не подлежащее проверке. Random-effects GLS regression R-sq: within=0.9478 between=0.8567 overall= 0.9209 Random effects: u_i ~ Gaussian corr(_i, X) = 0 (предполагается) Критерий значимости регрессии в целом: Wald chi2(1) = 325.94, Prob>chi2 = 0.0000 sigma_alfa 0 sigma_u 1.7451362 rho 0 (fraction of variance due to _i) 2 Здесь полученная оценка для оказывается отрицательной;

поэтому ее значение полагается равным нулю. Однако тогда модель со случайными эффектами редуцируется к модели “пула”:

Панельные данные y Coef. Std. Err. z P>z x 1.058959.0586557 18.05 0.000 cons -.7474755.955953 -0.78 0.434 В то же время, если в рамках модели со случайными эффектами применить критерий Бройша–Пагана для проверки гипотезы об 2 H 0 : = 0, то отсутствии таковых эффектов, т.е. гипотезы полученное значение статистики критерия равно 8.47. Этому значению соответствует рассчитанное по асимптотическому распределению хи-квадрат с 1 степенью свободы P-значение 0.0036. Но это говорит против гипотезы H 0. И опять это можно объяснить малым количеством наблюдений – ведь распределение хи-квадрат здесь только асимптотическое. В пакете Stata8 есть возможность оценить модель со случайными эффектами, не прибегая к GLS-оцениванию, а используя метод максимального правдоподобия. Это дает следующие результаты: Random-effects ML regression Random effects: _i ~ Gaussian Log likelihood = -61.09837 Критерий значимости регрессии в целом: LR chi2(1) = 121.60, Prob > chi2 = 0.0000 y Coef. Std. Err. x 1.092893.0501518 cons -1.255205 1.019264 sigma_ 1.064836.5552752 sigma_u 1.713621.2334960 rho.2785682.2205921 Likelihood-ratio test of sigma_alfa=0: chibar2(01) = 4.70, Prob>=chibar2 = 0. 2 По этому критерию гипотеза H 0 : = 0 отвергается.

z 21.79 -1.23 1.92 7. P>z 0.000 0.218 0.055 0. Глава Between regression (regression on group means) R-sq: within = 0.9478 between = 0.8567 overall = 0.9209 Проверка значимости регрессии в целом: F(1,1) = 5.98, Prob > F = 0.2471 y Coef. Std. Err. t P>t x.3137715.1283133 2.45 0.247 cons 10.40202 1.929616 5.39 0.117 Здесь регрессия оказывается статистически незначимой, а близкое к 2 1 значение коэффициента детерминации Rbetween не должно вводить в заблуждение: для оценивания двух коэффициентов имеется всего 3 наблюдения.

3.5. Выбор между моделями с фиксированными или случайными эффектами.

Прежде всего напомним уже отмеченные ранее особенности моделей с фиксированными или случайными эффектами. • FE: получаемые выводы – условные по отношению к значениям эффектов i в выборке;

это соответствует ситуациям, в которых эти значения нельзя рассматривать как случайную выборку из некоторой более широкой совокупности (популяции). Такая интерпретация наиболее подходит для случаев, когда субъектами исследования являются страны, крупные компании или предприятия, т.е. каждый субъект ”имеет свое лицо”. • RE: получаемые выводы – безусловные относительно популяции всех эффектов i. Исследователя интересуют не Панельные данные конкретные субъекты, а обезличенные субъекты, имеющие заданные характеристики. Заметим в этой связи, что • в FE-модели E ( yit xit ) = E ( i + xit + uit xit ) = i + xit. • в RE-модели E ( yit xit ) = E (µ + i + xit + uit xit ) = µ + xit Напомним, теперь, что RE модель предполагает, в частности, E ( i xit ) = 0. Чтобы избавиться от этого условия что ортогональности, предположим, что i = a xi + i, i ~ N 0, 2, E ( i xit ) = 0. Это приводит к “модели Мундлака”: yit = µ + xit + a xi + i + uit, которая также является моделью компонент ошибки. Она отличается от предыдущей модели тем, что в правую часть добавляется переменная xi, изменяющаяся только от субъекта к субъекту и отражающая неоднородность субъектов. Эта переменная, в отличие от i, наблюдаема. Заметим, что в модели Мундлака E ( i xit ) = E ((a xi + i )xit ) = aE ( xi xit ) = ( ) = так что если a 0, то условие E ( i xit ) = 0 в общем случае не выполняется ни для одного i = 1, K, N. Применение GLS к этой модели дает BLUE оценки для и a, имеющие вид:

GLS = CV, a GLS = b CV, T aT a 2 E ( xis xit ) = E xit + E ( xis xit ), T s =1 T s =1, s t () и Глава µ GLS = y x b. Иначе говоря, BLUE оценкой для в этой модели является E a GLS = a, ковариационная (внутригрупповая) оценка, и из E a GLS = E b E CV и E CV =, получаем: E = a+.

( Как было показано выше, в RE-модели (предполагающей выполнение условия E ( i xit ) = 0 ) = w + (1 w).

RE b CV () b ) () ( ) () ( ) Если использовать эту же оценку в модели Мундлака, то для нее получим: E RE = wE b + (1 w)E CV = w( + a ) + (1 w) = + wa, так что если a 0, то – смещенная оценка.

() () () RE форме: выполняется ли соотношение E ( i xi ) = 0 – тогда и E ( i xi ) = 0 ). Если нет, то наилучшей оценкой является CV (FE). Если да, то наилучшей оценкой является (RE).

GLS Критерии спецификации Речь здесь идет о том, совпадает ли условное распределение i при заданном xi с безусловным распределением i (в более слабой Критерий 1 Используя формулировку Мундлака, H 0 : a = 0 против альтернативы H1 : a 0.

проверяем гипотезу H1 : E ( i xi ) 0. Идея этого критерия основывается на следующих фактах:

Критерий 2 – критерий Хауcмана (Hausman) Проверяемая гипотеза: H 0 : E ( i xi ) = 0, альтернативная гипотеза:

Панельные данные • При гипотезе H 0 и оценка GLS, соответствующая RE модели, и оценка, соответствующая FE-модели, – CV состоятельны. • При гипотезе H1 оценка GLS несостоятельна, а оценка CV состоятельна. Соответственно, если гипотеза H 0 верна, то между оценками GLS не должно наблюдаться систематического расхождения, и эта и CV гипотеза должна отвергаться при “слишком больших” по абсолютной величине значениях разности CV GLS (больших в сравнении со стандартной ошибкой этой разности). Пусть q = CV GLS ;

тогда из общей формулы для дисперсии суммы двух случайных величин следует, что D(q ) = D CV GLS = =D +D 2Cov,.

( Если выполняются предположения стандартной RE-модели, то как было указано выше, GLS является эффективной оценкой, а CV – неэффективной оценкой. Хаусман показал, что эффективная оценка не коррелирована с разностью ее и неэффективной оценки, так что если гипотеза H 0 верна, то Cov, =D Cov, = 0, и ()( CV ) GLS ) ( CV GLS ) ( Cov ( ( GLS GLS GLS, CV )( ) = D( ), CV GLS GLS ) ( GLS CV ) D (q ) = D CV D GLS. Как уже говорилось выше, 2 u D GLS = N T (xit xi )2 + ()( i =1 t = ) ) (x x ) i i = N, Глава D CV = () 2 u (x i =1 t = N T.

xi ) it Заменяя в этих выражениях неизвестные параметры их состоятельными оценками, указанными ранее, получаем (q ) для D(q ). состоятельную оценку D Статистика критерия Хаусмана q2 m= (q ) D имеет при гипотезе H 0 асимптотическое (N ) распределение 2 (1).

Для K регрессоров при гипотезе H 0 статистика имеет асимптотическое распределение 2 (K ). Численно идентичный критерий для проверки гипотезы H 0 получается с использованием расширенной модели регрессии yit = xit + ( xit xi ) + it, где yit = yit yi, xit = xit xi, m = q T [Cov(q )] 1 q = 1 = Гипотеза H 0 показать, что здесь OLS = b, OLS = CV b. Гипотезу H 0 можно также проверить, используя любую из следующих разностей:

. 2 2 u + T означает в этой регрессии, что = 0. Можно u Панельные данные q1 = GLS CV, q 2 = GLS b, q =, CV b q 4 = GLS OLS. Это вытекает из соотношения GLS = w b + (1 w) CV.

Замечание Все входящие в эти разности оценки параметра состоятельны при гипотезе H 0 ;

поэтому все эти разности должны сходиться при гипотезе H 0 к нулю. П р и м е р (продолжение примера с тремя предприятиями) Применим критерий Хаусмана. Coefficients (b) fix (B) (b-B) S.E. x 1.102192 1.058959.0432328 Здесь b = CV, B = GLS, (b-B) = q = CV GLS. Cтатистика критерия Хаусмана равна chi2(1) = (b-B)'[(V_b-V_B)^(-1)](b-B) =-2.15, где V_b и V_B – состоятельные оценки дисперсий оценок CV и, соответственно. Поскольку значение этой статистики GLS оказалось отрицательным, критерий Хаусмана применить не удается. П р и м е р (объяснение размеров заработной платы) Статистические данные (из National Longitudinal Survey, Youth Sample, США) содержат сведения о 545 полностью занятых мужчинах, окончивших школу до 1980 г. и наблюдавшихся в Глава течение 1980–1987 гг. В 1980 г. эти мужчины имели возраст в пределах от 17 до 23 лет и включились в рынок труда совсем недавно, так что на начало периода их трудовой стаж составлял в среднем около 3 лет. Логарифмы заработной платы объясняются здесь длительностью школьного обучения, трудовым стажем и его квадратом, а также дамми-переменными, указывающими на членство в профсоюзе, работу в государственном секторе, семейный статус (состоит ли в браке), а также на цвет кожи (чернокожий или нет) и испаноязычность. Результаты оценивания: Оценка Between FE OLS RE Переменная Const 0.490 _ -0.034 -0.104 (0.221) (0.065) (0.111) scooling 0.095 _ 0.099 0.101 (0.011) (0.005) (0.009) experience -0.050 0.116 0.089 0.112 (0.050) (0.008) (0.010) (0.008) experience2 0.005 -0.0043 -0.0028 -0.0041 (0.003) (0.0006) (0.0007) (0.0006) Uniоn member 0.274 0.081 0.180 0.106 (0.047) (0.019) (0.017) (0.018) married 0.145 0.045 0.108 0.063 0.041 (0.018) (0.016) (0.017) black -0.139 _ -0.144 -0.144 (0.049) (0.024) (0.048) hispanic 0.005 _ 0.016 0.020 (0.043) (0.021) (0.043) Public sector -0.056 0.035 0.004 0.030 (0.109) (0.039) (0.037) (0.036) Within R2 0.0470 0.1782 0.1679 0.1776 Between R2 0.2196 0.0006 0.2027 0.1835 0.1371 0.0642 0.1866 0.1808 Overall R Панельные данные RE=EGLS (FGLS) соответствует = 0.64 FE=CV соответствует = 1 OLS соответствует = 0 Значения RE и OLS заключены между Between и FE. Если выполнены предположения модели со случайными эффектами, то все четыре оценки состоятельны. Если, однако, индивидуальные эффекты i коррелированы хотя бы с одной из объясняющих переменных, то состоятельной остается только FEоценка. Поэтому встает вопрос о проверке гипотезы H 0 о том, что модель является RE-моделью. Для этого можно сравнивать оценки “внутри” (FE) и “между” или оценки “внутри” (FE) и RE (соответствующие критерии равносильны). Проще сравнивать вторую пару, используя критерий Хаусмана, описанный ранее.

Coefficients (b) (B) fix.116457.1117851 -.0042886.0040575.0451061.0625465.0349267.0301555.081203.1064134 (b-B).0046718 -.0002311 -.0174403.0047713 -.0252104 sqrt(diag(V_b-V_B)) S.E..0016345.0001269.0073395.0126785. EXPER EXPER2 MAR PUB UNION chi2(5) = (b-B)'[(V_b-V_B)^(-1)](b-B) = 31.75 Prob>chi2 = 0. Вычисленное значение статистики этого критерия равно 31.75 и отражает различия в FE- и RE-оценках коэффициентов при 5 переменных: experience, experience2, Union member, married, Public sector. Для распределения 2 (5) значение 31.75 соответствует Pзначению 6.6 106, так что нулевая гипотеза (RE-модель) заведомо отвергается. Чем это может объясняться?

Глава Ненаблюдаемая гетерогенность i может, например, коррелировать с семейным положением, что подтверждается данными приведенной таблицы. Если из модели выметаются индивидуальные эффекты и используется FE-оценка, то влияние этого фактора уменьшается до 4.5%, тогда как для “between”-оценки это влияние составляет 14.5%. Заметим, что влияние этого фактора идентифицируется только благодаря наличию в выборке индивидов, изменивших свое семейное положение в период наблюдений. Аналогичные замечания справедливы и в отношении членства в профсоюзе. Следует, впрочем, заметить, что все использованные оценки предполагают некоррелированность объясняющих переменных с uit, и при нарушении этого условия даже FE-оценка оказывается несостоятельной. Приведенные в конце таблицы значения трех различных мер согласия показывает, что наибольшее значение within-R2 достигается для FE-оценки, т.е. именно она наилучшим образом объясняет внутригрупповую изменчивость. OLS-оценка максимизирует обычный overall-R2. RE-оценка дает близкие значения всем трем мерам согласия. Отметим еще, что стандартные ошибки OLS-оценки вообще-то говоря не соответствуют действительности, т.к. не принимают во внимание коррелированность ошибок между собой. Правильные их значения должны быть больше стандартных ошибок EGLS-оценок, принимающих во внимание эту коррелированность.

3.6. Автокоррелированные ошибки Во всех рассмотренных выше ситуациях предполагалось, что случайные составляющие u it – взаимно независимые случайные 2 величины, имеющие одинаковое распределение N 0, u. Между тем, вполне возможно, что для i -го субъекта последовательные ошибки ui1, ui 2,K, uiT не являются независимыми, а следуют, скажем, ( ) Панельные данные стационарному процессу авторегрессии первого порядка с нулевым средним. Точнее говоря, пусть мы имеем дело с моделью yit = µ + i + xit + uit, i = 1,K, N, t = 1,K, T, в которой uit = ui,t 1 + it, где < 1, а случайные величины i1, i 2,K, iT являются гауссовскими инновациями, так что они взаимно независимы и имеют одинаковое распределение N 0, 2 и, кроме того, it не зависит от значений ui,t k, k 1. Общий для всех субъектов коэффициент можно оценить различными способами. При этом в большинстве случаев сначала переходят к модели, скорректированной на групповые средние: yit yi = ( xit xi ) + (uit ui ), т.е. ~ = ~ +u, yit xit ~it а затем поступают по-разному. Можно, например, оценить (методом наименьших квадратов) последнюю модель без учета автокоррелированности ошибок, ~~ ~ получить последовательность остатков u i1, u i 2, K, u iT, вычислить значение статистики Дарбина–Уотсона ( ) d= ~ (u N T i =1 t = 2 N it T ~ u i,t 2 it ) ~ u i =1 t = и, используя приближенное соотношение 1 d 2, получить оценку DW 1 d 2.

Глава Можно поступить иначе: получив последовательность остатков ~, u, K, u, использовать оценку наименьших квадратов, ~ ~ u i1 i 2 iT получаемую при оценивании уравнения регрессии ~ ~ u =u +.

it i,t 1 it Искомая оценка вычисляется по формуле:

~ u i =1 t = 2 NT N T it ~ ui, t = i =1 t =.

~2 uit [В пакете Stata8 эта оценка обозначена как tscorr.] После получения оценки для производится преобразование переменных, призванное получить модель с независимыми ошибками. Наконец, в рамках преобразованной модели производится обычный анализ на фиксированные или случайные эффекты.

Пример В примере с тремя предприятиями для модели фиксированными эффектами получаем следующие результаты. При использовании DW-оценки:. xtregar y x, fe rhotype(dw) lbi FE (within) regression with AR(1) disturbances Number of obs = 27 R-sq: within = 0.9569 between = 0.1111 overall = 0.9252 F(1,23) = 510.54, Prob > F = 0.0000 corr(_i, Xb) = -0. с Панельные данные y x cons rho_ar sigma_ sigma_u rho_fov Coef. 1.105796 -1. Std. Err..0489398. t 22.60 -1. P>t 0.000 0..170171 1.423608 1.773845.3917622 (доля дисперсии, индивидуальным эффектам _i) соответствующей F test that all alfa_i=0: F(2,23)= 3.82, Prob > F = 0.0370 modified Bhargava et al. Durbin-Watson = 1.664958 Baltagi-Wu LBI = 1.8196862 Оценка коэффициента по сравнению со значением 1.102192, полученным ранее без учета возможной автокоррелированности ошибок, практически не изменилась. И это согласуется со значением статистики Дарбина–Уотсона. Вывод об отсутствии индивидуальных эффектов также не изменяется. При использовании tscorr-оценки:. xtregar y x, fe rhotype(tscorr) FE (within) regression with AR(1) disturbances Number of obs = 27 R-sq: within = 0.9540 between = 0.1111 overall = 0. F(1,23)= 476.47, Prob > F = 0.0000 corr(_i, Xb) = -0.1626 y Coef. Std. Err. x 1.109267.050818 cons -1.392025. t 21.83 -1. P>t 0.000 0. Глава rho_ar sigma_ sigma_u rho_fov.09213053 1.4281087 1.7701594.39426073 (доля дисперсии, соответствующей индивидуальным эффектам _i)) F test that all alfa_i=0: F(2,23) = 4.66, Prob > F = 0.0199 Оцененное значение коэффициента автокорреляции на этот раз почти в два раза меньше. Оценка коэффициента практически не изменилась.

3.7. Двухфакторные (двунаправленные) модели 3.7.1. Фиксированные эффекты Здесь мы рассматриваем модель, в которую помимо индивидуальных эффектов i включаются также и временные эффекты t : yit = µ + i + t + xit + uit, i = 1,K, N, t = 1,K, T, где i = 0, i = N t = T t = 0, так что i и t – “дифференциальные эффекты”. При этом и i и t интерпретируются как неизвестные постоянные. Обозначая 1N yt = yit и т.д. (средние по субъектам), N i = yi = 1T yit T t = и т.д. (средние по времени), Панельные данные 1NT yit (среднее по всем наблюдениям), NT i =1 t =1 получаем: ( yit yi yt + y ) = (xit xi xt + x ) + (uit ui ut + u ). Оценка наименьших квадратов для коэффициента в этом уравнении (двухфакторная внутригрупповая оценка) имеет вид y= CV = ( y i =1 t = N T it N y i y t + y )( x it x i x t + x ) T (x i =1 t = it xi xt + x ) = W xy W xx.

На основании соотношений ( yi y ) = i + (xi x ) + (ui u ), ( yt y ) = t + (xt x ) + (ut u ) можно получить оценки для i и t : = ( y y ) (x x ), t = ( y t y ) CV ( x t x ).

i i CV i Для оценивания двунаправленной модели с фиксированными эффектами в пакете Stata применяется процедура xtreg, fe с включением дамми-переменных для временных периодов. Пример (объяснение размеров заработной платы, продолжение) Fixed-effects (within) regression R-sq: within = 0.1808 between = 0.0005 overall = 0.0638 F(11,3804) = 76.30, Prob > F = 0. Глава corr(_i, Xb) = -0.1203 WAGE_LN Coef. Std. Err. t P>t BLACK (dropped) EXPER.1317361.0098356 13.39 0.000 EXPER2 -.0051704.0007047 -7.34 0.000 HISP (dropped) MAR.0464781.0183123 2.54 0.011 PUB.0347278.0385989 0.90 0.368 SCHOOL (dropped) UNION.0791253.0193354 4.09 0.000 Y80 (dropped) Y81.0193045.0203652 0.95 0.343 Y82 -.0112773.0202281 -0.56 0.577 Y83 -.0419533.0203211 -2.06 0.039 Y84 -.0383904.0203151 -1.89 0.059 Y85 -.0428743.0202506 -2.12 0.034 Y86 -.0275581.0203878 -1.35 0.177 cons 1.028383.0299620 34.32 0.000 Заметим, что значимыми оказываются здесь оцененные коэффициенты при тех же переменных что и в однонаправленной модели с фиксированными эффектами. sigma_.40078197 sigma_u.3509988 rho.56593121 (fraction of variance due to _i) F test that all _i=0: F(544, 3804) = 7.97 Prob > F = 0.0000. test Y81=Y82=Y83=Y84=Y85=Y86= Панельные данные (Здесь Y81 – дамми-переменная, равная 1 в 1981 г. и равная 0 в остальные годы;

аналогично определяются Y82,…,Y86.) F(6, 3804) = 1.96 Prob > F = 0.0680 Результаты последнего теста не выявляют значимого влияния временных эффектов. 3.7.2. Случайные эффекты В этой двухфакторной модели yit = µ + i + t + xit + uit, i = 1,K, N, t = 1,K, T предполагается, что i и t – случайные величины и что E ( i ) = E (t ) = E (uit ) = 0, 0, если i j, 2 (t s ) =, если t = s, E 0, если t s, 2 (uit u js ) = u, если i = j и t = s, E 0, в противном случае, E ( i t ) = 0, E ( iuit ) = 0, E (t uit ) = 0, E ( i xit ) = E (t xit ) = E (uit xit ) = 0. Определим it = i + t + uit. Тогда E ( ) = i j, если i = j, 2 2 2 D( it ) = D ( yit xit ) = + + u, так что ошибка состоит из трех компонент. При этом 2, если i = j, t s, Cov( it, js ) = 2, если t = s, i j, 2, если i = j, t s, D(2it ), если t = s, i j, Corr ( it, js ) = D ( it ) 1, если t = s, i = j, если t s, i j. 0, “Межсубъектная” оценка определяется как Глава bi = (x i =1 N N i x )( y i y ) x) = B xy B xx (x i =1 T, i а “межвременная” оценка определяется как bt = (x t =1 T t x )( y t y ) t (x t = x) = C xy C xx.

GLS-оценка равна GLS = 1 CV + 2 bi + 3 bt, где Wxx W 1 = = xx, 2 2 Wxx + 2 Bxx3 C xx Txx 2 = 22 = 22 Bxx Txx 2 u 2 u, 3 = 32C xx Txx, + T, 32 = u 2 + N 2 u, Панельные данные Txx = Wxx + 22 Bxx + 32C xx. Иначе говоря, GLS-оценка является взвешенным средним одной “внутри”и двух “между”-оценок, с весами, отражающими источники изменчивости.

• 2 2 Если = = 0 (так что все i и t равны нулю), то B C 22 = 32 = 1, 2 = xx, 3 = xx, Txx = Wxx + Bxx + C xx, Txx Txx GLS = W xx W xy B xx B xy C xx C xy W xy + B xy + C xy + + = = T xx W xx T xx B xx T xx C xx W xx + B xx + C xx (x = i =1 t =1 N T N T it x )( y it y ) x) = OLS (как для пула).

(x i =1 t =1 CV it • При T и N имеем 22 0 и 32 0, и = (как для модели с фиксированными GLS эффектами). Можно также комбинировать фиксированные временные эффекты и случайные индивидуальные эффекты в рамках процедуры xtreg, re с включением dummy-переменных для временных периодов. 3.7.3. Критерии эффектов для индивидуальных и временных Критерий Бройша–Пагана. Это критерий для проверки гипотезы Глава 2 2 H 0 : = = 0 (сведение к модели пула). Здесь опять можно использовать OLS-оценки параметров для получения OLS-остатков u it. Статистика критерия BP = LM 1 + LM 2, где 2N 2 ui T NT i =1 LM 1 = 1, N T 2(T 1) 2 u it i =1 t = b 2 при гипотезе H 0 : = 0 LM 2 ~ 2 (1). В качестве альтернативных могут быть использованы Fкритерии, как при проверке гипотез для фиксированных эффектов. 2 • Для проверки гипотезы H 0 : = 0 (при условии t = 0 ) используем уже применявшуюся ранее статистику (S S ) (N 1), F3 = 2 1 S1 ( NT N 1) где S 2 – RSS от OLS регрессии (пул), а S1 – RSS от однофакторной “внутригрупповой” регрессии (основанной на однофакторной CV-оценке). • Для проверки гипотезы H 0 : 1 = 2 = L = N 1 = 0, 1 = 2 = L = T 1 = распределение (2). При гипотезе H : = 2T 2 ut N NT t =1 LM 2 = 1. 2(T 1) N T 2 u it i =1 t =1 При гипотезе H 0 статистика BP имеет асимптотическое LM 1 ~ 2 (1) ;

a Панельные данные используем статистику (S S 2 w ) (N + T 2), F2way = 3 S 2 w (N 1)(T 1) 1 где S 2 w – RSS от двухфакторной “внутригрупповой” регрессии. • Для проверки гипотезы H 0 : 1 = 2 = L = N 1 = 0 при t 0 используем статистику (S 4 S 2 w ) (N 1), F4 = S 2 w ((N 1)(T 1) 1) где S 4 – RSS от регрессии ( yit yt ) = (xit xt ) + (uit ut ) • Для проверки гипотезы H 0 : 1 = 2 = L = T 1 = 0 при i 0 используем статистику (S1 S 2 w ) (T 1). F5 = S 2 w (( N 1)(T 1) 1) Может иметь смысл трактовка i как случайных, а t как фиксированных эффектов: STATA xtreg, re включает dummies как фиксированные эффекты. Для рассматриваемого примера: В рамках модели с фиксированными индивидуальными и временными эффектами проверка гипотезы об отсутствии индивидуальных эффектов дает следующие результаты: F test that all ALFA_i=0: F(544, 3804) = 7.97 Prob > F = 0.0000 Полученное значение F-статистики приводит к отвержению этой гипотезы на любом разумном уровне значимости. Проверка в рамках той же модели гипотезы об отсутствии временных эффектов приводит к следующему:

Глава test Y81=Y82=Y83=Y84=Y85=Y86=0 F(6, 3804) = 1.96 Prob > F = 0.0680 Гипотеза отсутствия фиксированных временных отвергается F-критерием на 5% уровне значимости.

эффектов не 3.8. Несбалансированные панели Мы сосредоточимся здесь на однофакторной модели. Такая модель могла бы включать временные дамми как фиксированные эффекты. До сих пор мы предполагали, что i = 1,K, N, t = 1,K, T, так что в каждый из T моментов времени имеются данные о всех N субъектах, участвующих в анализе. В таких случаях говорят о сбалансированной панели. Теперь мы рассмотрим модель yit = µ + xit + i + uit, i = 1,K, N, t = 1,K, Ti, i = N i =0, в которой количество наблюдений для разных субъектов может быть различным. В этом случае говорят о несбалансированной панели. Основные результаты для несбалансированных панелей. 1. OLS-оценка та же, что и раньше, и она является BLUE, если 2 = 0. 2. Внутригрупповая (CV) оценка в основных чертах та же, что и ранее, хотя yi и xi вычисляются по периодам времени разной длины для разных субъектов. 3. “Между”-оценка также в основном сохраняется, только средние вычисляются по Ti наблюдениям для субъекта i.

Панельные данные 4.

GLS-оценка по-существу сохраняется, но преобразование переменных имеет вид yit = yit i yi, xit = xit i xi, где yi = 1 Ti y t = Ti it, xi = 1 Ti x t = Ti it, i = 2 u 2 u2 + Ti, т. е. i изменяется от субъекта к субъекту.

3.9. Эндогенные объясняющие переменные Здесь мы рассмотрим модель с несколькими объясняющими переменными, некоторые из которых являются эндогенными. Именно, мы рассматриваем модель y2it = y1it + xit + i + uit, i = 1,K, N, t = 1,K, T, где y1it – вектор-строка g1 эндогенных переменных, xit – вектор-строка k1 экзогенных переменных, и – векторы-столбцы размерностей g1 и k1. Пусть zit – вектор-строка k 2 инструментальных переменных, k 2 g1, так что E ( zit uit ) = 0. Обозначим: 1T 1T 1T y2i = y2it, y1i = y1it, xi = xit, T t =1 T t =1 T t = 1NT 1NT 1NT y2it, y1 = y1it, x = xit. NT i =1 t =1 NT i =1 t =1 NT i =1 t =1 Оценивая методом инструментальных переменных (метод IV) “внутри”-регрессию ( y2it y2i ) = ( y1it y1i ) + (xit xi ) + (uit ui ), y2 = Глава получим IV-“внутри”-оценки IVW, IVW. Оценивая методом инструментальных переменных “между”-регрессию ( y2i y2 ) = ( y1i y1 ) + (xi x ) + (ui u ), получим IV-“между”-оценку IVB.

Пример: k 2 = g1 = 1, k1 = 0, так что y2it = y1it + i + uit. Здесь ( y IVW = i =1 t =1 N T i =1 t =1 N N T 2 it y 2i )( z it z i ) (y y 2i z i i =1 N, 1it y1i )( z it z i ) IVB = y i =.

1i z i Если E (Y1it i ) = 0, то тогда более эффективна оценка со случайными эффектами. Чтобы получить ее, используем преобразование переменных ~ = y y, ~ = y y, y 2it y1it 2 it 2i 1it 1i ~ = u u, ~ = z ~, u z z it it i it it i где = N 2 u 2 2 u + T T 2 it, 2 u = (( y i =1 t = y 2i ) ( y1it y1i ) IVW ), NT N Панельные данные T 2 2 u + T = (y i = N 2i y1i IVB ) N.

~ = ~ +u, ~ y2it y1it Применим теперь метод IV к уравнению it используя в качестве инструментов zit zi и zi или ~it. z Более общим образом, пусть = [ ] – вектор-строка размерности g1 + k1. На практике приходится применять метод IV (2SLS) трижды: 1. для получения IVW ;

2. для получения ;

IVB 2 2 2 в результате этих двух шагов получают оценки u и u + T, которые используются для преобразования модели;

3. реализуя метод IV для преобразованной модели.

Оценивание можно выполнить в пакете STATA, используя команду xtivreg c опцией re. Если E (Y1it i ) 0, то используется опция fe. Пример Исследование зависимости заработной платы женщин от различных факторов. Для исследования были взяты данные (из National Longitudinal Survey, Youth Sample, США) по N=4134 молодым женщинам, имевшим в 1968 г. возраст от 14 до 26 лет. Наблюдения проводились с 1968 по 1988 гг. Однако данные неполные: по отдельным субъектам количество наблюдений изменялось от 1 до 12 (в среднем 4.6 наблюдения для одного субъекта). Рассмотрим сначала модель с фиксированными эффектами Глава ln wit = 1 tenure + 2 age + 3 age2 + 4 notsmsa + + 5 union + 6 south + µ + i + u it, i = 1,K, N, t = 1,K, T, где wit – размер заработной платы, tenure – продолжительность (стаж) работы на наблюдаемом рабочем месте, age – возраст, notsmsa – проживание вне столичных регионов, union – принадлежность к профсоюзу, south – проживание на юге страны. Оценивание указанной модели с использованием “внутри”-оценки дает следующие результаты:. xtreg ln_w tenure age age_2 not_smsa union south, fe i(idcode) Fixed-effects (within) regression Number of obs =19007 Group variable (i): idcode Number of groups = 4134 R-sq: within = 0.1333 Obs per group: min = 1 between = 0.2375 avg = 4.6 overall = 0.2031 max = 12 F(6,14867) = 381.19 Prob > F = 0.0000 corr(_i, Xb) = 0.2074 ln_wage Coef. Std. Err. z P>z tenure.0176205.0008099 21.76 0.000 age.0311984.0033902 9.20 0.000 age_2 -.0003457.0000543 -6.37 0.000 not_smsa -.0972535.0125377 -7.76 0.000 union.0975672.0069844 13.97 0.000 south -.0620932.0133270 -4.66 0.000 cons 1.091612.0523126 20.87 0.000 sigma_ |.3910683 sigma_u |.25545969 rho |.70091004 (fraction of variance due to _i) F test that all _i=0: F(4133, 14867) = 8.31 Prob > F = 0. Панельные данные Все оцененные коэффициенты имеют высокую статистическую значимость и ожидаемые знаки. Значительная часть изменчивости (70%) объясняется индивидуальными эффектами. В то же время, если считать, например, что стаж работы на наблюдаемом рабочем месте зависит от принадлежности к профсоюзу и от региона проживания (юг – не юг) и что ошибки в уравнении для такой связи коррелированы с ошибками в уравнении для логарифма заработной платы, то тогда переменная tenureit в уравнении ln wit = 1 tenureit + 2 ageit + 3age2it + 4 notsmsait + + µ + i + uit коррелирована с ошибкой uit, и для получения состоятельных оценок коэффициентов этого уравнения приходится прибегать к методу инструментальных переменных. При сделанных предположениях в качестве инструментов для tenureit можно использовать union и south. Полный список инструментов, обеспечивающий однозначную идентификацию коэффициентов µ и 1, 2, 3, 4, включает 5 переменных: union, south, age, age2, notsmsa. Использование этих переменных в качестве инструментов приводит к следующему результату:. xtivreg ln_w age age_2 not_smsa (tenure=union south), fe i(idcode) Fixed-effects (within) IV regression Number of obs = 19007 Number of groups = 4134 Obs per group: min = 1 avg =4.6 max = 12 Wald chi2(4) = 147926.58 Prob > chi2 = 0.0000 corr(_i, Xb) = -0. Глава ln_wage Coef. Std. Err. z tenure.2403531.0373419 6.44 age.0118437.0090032 1.32 age_2 -.0012145.0001968 -6.17 not_smsa -.0167178.0339236 -0.49 cons 1.678287.1626657 10.32 sigma_ |.70661941 sigma_ u |.63029359 rho |.55690561 (fraction of variance due to _i) --------------------------------------------------F test that all _i=0: F(4133,14869) = 1.44 Prob > F = 0.0000 --------------------------------------------------Instrumented: tenure Instruments: age age_2 not_smsa union south P>z 0.000 0.188 0.000 0.622 0. Оцененные коэффициенты и здесь имеют ожидаемые знаки. Однако на этот раз оказались статистически незначимыми оцененные коэффициенты при переменных age и notsmsa. Применение “внутри”-оценки предпочтительно при интерпретации индивидуальных эффектов как фиксированных эффектов. Если рассматривать эти эффекты как случайные и некоррелированные с остальными объясняющими переменными, то предпочтительнее использовать инструментальное GLS-оценивание, как это было описано выше. Такой подход приводит к следующим результатам:. xtivreg ln_w age age2 not_smsa black (tenure = union birth_yr south black), re i(idcode) G2SLS random-effects IV regression Number of obs = 19007 Number of groups = Панельные данные R-sq: within = 0.0664 Obs per group: min = 1 between = 0.2098 avg = 4.6 overall = 0.1463 max = 12 Wald chi2(5) = 1446.37 Prob > chi2 = 0.0000 corr(_i, X) = 0 (assumed) ln_wage Coef. Std. Err. z P>z tenure.1391798.0078756 17.67 0.000 age.0279649.0054182 5.16 0.000 age_2 -.0008357.0000871 -9.60 0.000 not_smsa -.2235103.0111371 -20.07 0.000 black -.2078613.0125803 -16.52 0.000 cons 1.337684.0844988 15.83 0.000 sigma_ |.36582493 sigma_u |.63031479 rho |.25197078 (fraction of variance due to _i) -----------------------------------------------------------------------------Instrumented: tenure Instruments: age age2 not_smsa black union birth_yr south 3.10. Модели переменными с индивидуально-специфическими 3.10.1. Оценивание в RE- и FE-моделях До сих пор в модели с фиксированными эффектами неоднородность субъектов исследования характеризовалась наличием ненаблюдаемых характеристик, влияние которых отражалось в модели посредством параметров i. Однако неоднородность субъектов может выражаться также в различных значениях для этих субъектов некоторых наблюдаемых характеристик, не изменяющихся для каждого субъекта в процессе Глава наблюдений. Например, в исследованиях, касающихся зависимости размера заработной платы индивида от различных факторов, такими характеристиками могут быть пол, базовое образование и т.п. В связи с этим мы рассмотрим теперь модель yit = µ + i + xit + zi + uit, i = 1, K, N, t = 1, K, T, где z i – переменная, специфическая только в отношении субъекта. Если эта модель трактуется как RE-модель, в которой эффекты не коррелированы с xit и z i, то проблем с оцениванием коэффициентов и не возникает: в этом случае BLUE являются GLS-оценки для и. Если же эта модель трактуется как FE-модель или если i случайны и E ( i z i ) = 0, но E ( i xit ) 0, то тогда GLS-оценки (строящиеся, как в RE-модели) несостоятельны, и приходится искать другие оценки. Усредним обе части уравнения по t : y i = µ + i + xi + z i + u i, i = 1,K, N. Тогда yit yi = ( xit xi ) + (uit u ), i = 1,K, N. В применении к последнему уравнению метод наименьших квадратов приводит опять к оценке с фиксированными эффектами CV. Но при таком подходе из исходного уравнения выметаются не только i, но и z i. Однако если i фиксированы или E ( i xit ) 0, но E ( i z i ) = 0, то тогда все же можно построить состоятельную оценку коэффициента. Для этого заметим, что y i xi = µ + z i + ( i + u i ). Если считать значение известным, то мы можем оценить эту модель, () минимизируя ( i = N i + ui ), и получить between-оценки Панельные данные (( y = i = N i y ) ( x i x ) )(z i z ) (z i = N, i z) µ = y x z. Подставляя CV вместо в эти два выражения, получаем оценки ~ и µ для и µ ;

при этом ~ ~ plim =, ~ т.е. – состоятельная оценка. [В пакете STATA используeм predict residfe, ue после xtreg…, fe и затем xtreg…, fe Zi, be ] N Пример (объяснение размеров заработной платы, продолжение) При оценивании модели с фиксированными эффектами оказались выметенными переменные scooling, black, hispanic. Попробуем все же получить оценки коэффициентов при этих переменных. Использование процедуры, предусмотренной Stata8, приводит к следующему результату. Between regression (regression on group means) R-sq: within = 0.0000 between = 0.2119 overall = 0.1264 F(3,541) = 48.47, Prob > F = 0.0000 Coef. Std. Err. t P>t SCHOOL.1015825.0089372 11.37 0.000 BLACK -.1442396.0484007 -2.98 0.003 HISP.0210173.0435069 0.48 0. Глава Полученные оценки практически совпадают с оценками для соответствующих коэффициентов в модели со случайными коэффициентами (при GLS-оценивании). 3.10.2. Модель Хаусмана–Тейлора Рассмотрим модель yit = X it + Z i + i + uit, i = 1, K, N, t = 1, K, T, где X it – строка k наблюдаемых переменных, изменяющихся и от субъекта к субъекту и во времени, а Z i – строка g наблюдаемых переменных, инвариантных относительно времени на периоде наблюдений. Предполагается, что выполнены обычные предположения RE-модели (в частности, что все объясняющие переменные экзогенны в обычном смысле), за исключением того, что теперь ненаблюдаемые индивидуальные эффекты i могут быть коррелироваными с одними объясняющими переменными и некоррелироваными с другими объясняющими переменными. Хаусман и Тейлор предложили в таком случае производить разбиение: X it = [ X 1it X 2it ], Z i = [Z 1i Z 2i ], где k1 переменных, входящих в состав X 1it, и g1 переменных, входящих в состав Z1i, экзогенны по отношению к i в том смысле, что E ( X 1it i ) = E (Z1i i ) = 0, а k 2 переменных, входящих в состав X 2it, и g 2 переменных, входящих в состав Z 2i, эндогенны по отношению к i в том смысле, что E ( X 2it i ) 0, E (Z 2i i ) 0. При таком разбиении модель записывается в виде yit = X 1it 1 + X 2it 2 + Z1i 1 + Z 2i 2 + i + uit, Панельные данные и переход к модели, скорректированной на индивидуальные средние, yit yi = (X 1it X 1i )1 + (X 2it X 2i ) 2 + uit, приводит к возможно неэффективной, но состоятельной оценке T для = T, T. Однако при этом опять вместе с CV выметаются переменные, инвариантные относительно времени. T T для, вычисляем для Получив оценку CV = 1T,CV, 2,CV каждого субъекта остатки от оцененной “внутри”-регрессии: d it = ( y it y i ) (X 1it X 1i ) 1,CV (X 2it X 2i ) 2,CV и получаем состоятельную оценку для дисперсии случайных ошибок 2 D(uit ) = u : RSS CV 2. u = NT (k1 + k 2 ) Далее, по аналогии с уже делавшимся ранее, замечаем, что yi X 1i 1 X 2i 2 = Z1i 1 + Z 2i 2 + ( i + uit ). Только на этот раз в правой части E (Z 2i i ) 0, так что OLS-оценки для 1 и 2, получаемые по этой модели (between-оценки) смещены и несостоятельны. Поэтому здесь для получения состоятельных оценок для 1 и 2 применяем метод инструментальных переменных (2SLS), используя инструменты [ Z1i X 1it ]. При этом количество экзогенных переменных в X 1it (k1 ) должно быть не меньше числа эндогенных переменных в Z 2i (g 2 ). Полученные оценки для 1 и 2 обозначим 1, IV и 2, IV. Используя теперь все четыре полученные оценки, образуем “остатки” eit = yit X 1it 1,CV X 2it 2,CV Z1i1,IV Z 2i2,IV ( ) i ( ) и на их основе определим статистику Глава 1NT 2 eit, NT i =1 t =1 2 2 которая является состоятельной оценкой для суммы u + T.

S2 = 2 Тогда состоятельная оценка для получается как 2 S2 u. T Следующим шагом является выполнение стандартного GLSпреобразования всех переменных, используемого в RE-модели: yit = yit yi и т.п. Для реализации этого преобразования в качестве оценки параметра берется = 1, где 2 = = 2 u 2 2 u + T, 2 2 2 2 а u и – полученные выше состоятельные оценки для u и. Это приводит к преобразованному уравнению yit = X 1it 1 + X 2it 2 + Z1i 1 + Z 2i 2 + it. К этому уравнению применяем метод IV (2SLS), используя инструменты [X 1it X 1i, X 2it X 2i, X 1i, Z1i ], и получаем в результате для вектора = T, T T T Тейлора HT = HT, HT [ [ ].

T ] T инструментальную оценку Хаусмана– Замечания 1. В процедуре Хаусмана–Тейлора инструменты берутся внутри самой модели. 2. X 1it используется как инструмент дважды: как среднее и как отклонение от среднего. 3. Если k1 < g 2, то параметр не идентифицируем. В этом случае = и не существует.

HT CV HT Панельные данные 4.

T T Если k1 = g 2, то HT = CV и HT = IV = 1, IV, 2, IV. (Случай точной идентифицируемости.) 5. Если k1 > g 2, то уравнение сверхидентифицируемо. В этом случае матрица Cov Cov положительно T ( ) определена и оценка Хаусмана–Тейлора более эффективна, чем “внутри”-оценка. Влияние метода Хаусмана–Тейлора на прикладные исследования относительно мало из-за трудности нахождения экзогенных переменных X 1, которые можно было бы уверенно рассматривать как не коррелированные с i (так что E ( X 1it i ) = 0 ).

() CV () HT 3.11. Динамические модели Рассмотрим динамическую модель. y it = y i,t 1 + i + u it, i = 1,K, N, t = 1,K, T, 2 < 1, uit ~ i.i.d. N (0, u ) – инновации (так что E (uit yi,t k ) = 0 для k > 0 ). Будем предполагать, что значения yit наблюдаются для t = 0,1,K, T. “Bнутри”-оценка для имеет вид:

в которой CV = где (y i =1 t =1 N T N T it y i )( y i,t 1 y i, 1 ) i,t (y i =1 t = y i, 1 ), 1T 1T yit, yi,1 = T yi,t 1. T t =1 t =1 В соответствии с определением модели, yi = Глава yi = 1T ( yi,t 1 + i + uit ) = yi,1 + i + ui, T t = так что yit yi = ( yi,t 1 yi, 1 )+ (uit ui ) и CV = + (u i =1 t =1 N N T it u i )( y i,t 1 y i, 1 ) NT i,t (y i =1 t = T y i, 1 ) NT.

Рассмотрим предел по вероятности числителя дроби в правой части последнего выражения: 1NT p lim (uit ui )(yi,t 1 yi, 1 )= N NT i =1 t = = p lim N 1 NT u i = N T t = it T T yi,t 1 ui yi,t 1 yi, 1 uit + T ui yi, 1 = t =1 t = yi 2 = yi1 + i + ui 2 = 2 yi 0 + ( + 1) i + ui1 + ui 2,... y it = t y i 0 + 1 t i (1 ) + t 1 u i1 + L + u i,t 1 + u it. Отсюда, в частности, получаем, что при T = 2 указанный предел по вероятности равен 1N p lim (( + 1) y i 0 + i + u i1 )(u i1 + u i 2 ) = 4 N i =1 N 1 ui yi, 1. N N i =1 Заметим, что yi1 = yi 0 + i + ui1, = p lim N ( ) ( ) p lim N 1 4N u i21 = i = N 2 u 0, Панельные данные так что оценка CV несостоятельна. При произвольном Т получаем: 1NT p lim (uit ui )(yi,t 1 yi, 1 )= N NT i =1 t = T 1 T + T, 2 2 N T (1 ) 2 T 1NT (yi,t 1 yi,1 )2 = u 2 1 1 2 T 12 T +2. p lim N NT i =1 t =1 1 T T (1 ) Отсюда вытекает, что если не только N, но и T, то первый предел по вероятности стремится к нулю, а второй – к = p lim 1N ui yi,1 N i = ( )= 2 u 2 u 0, N, T 1 2 так что p lim CV =. Если же значение Т фиксировано, то тогда p lim CV = N первый предел не равен нулю и p lim CV, так что оценка CV N несостоятельна. Асимптотическое смещение вызывается “внутри”преобразованием, исключающим индивидуальные эффекты i из каждого наблюдения, что порождает корреляцию между остатками (uit ui ) в преобразованной модели и “объясняющей переменной” (yi,t 1 yi,1 ). Когда Т велико, эта корреляция близка к нулю. Для малых значений Т смещение отрицательно, если > 0. Например, для Т асимптотическое смещение равно (1 ) 2. Следующий график иллюстрирует, как асимптотическое смещение оценки CV изменяется c ростом Т.

Глава 0.8 0. lim_gamma_estim 0.4 0.2 0 -0.2 -0.4 -0.6 T GAM=0.1 GAM=0.3 GAM=0.5 GAM=0.7 GAM=0.9 2 3 4 5 6 7 8 9 ”Внутри”-оценка остается несостоятельной при малых T и когда в правую часть уравнения модели добавляются экзогенные объясняющие переменные. Для преодоления этой проблемы можно воспользоваться другим преобразованием, “выметающим” i : вместо вычитания средних по времени перейти к первым разностям временных рядов для каждого субъекта. При этом получаем: yi,t yi,t 1 = ( yi,t 1 yi,t 2 ) + (u it ui,t 1 ), или yi,t = yi,t 1 + uit, где обозначено yi,t = yi,t yi,t 1, uit = uit ui,t 1. Здесь Cov(yi,t 1, uit ) = Cov ( yi,t 1 yi,t 2, uit ui,t 1 )= = Cov ( yi,t 1, ui,t 1 ) 0.

Панельные данные Поэтому OLS-оценка для в преобразованном (“продифференцированном”) уравнении оказывается несостоятельной даже если T. Однако к преобразованному уравнению можно применить метод инструментальных переменных (IV – instrumental variables). Для этого достаточно заметить, что если взять переменную yi,t 2, то для нее Cov( yi,t 2, yi,t 1 ) = Cov ( yi,t 2, yi,t 1 yi,t 2 ) 0, а это означает, что эта переменная может использоваться в качестве инструмента, и это приводит к оценке Cov( yi,t 2, uit ) = Cov ( yi,t 2, uit ui,t 1 ) = 0, IV = (y i =1 t = i =1 t =1 NT (y N T i,t y i,t 1 )y i,t 2 y i, t 2 )y i, t.

i,t Необходимое условие состоятельности этой оценки: NT 1 p lim (uit ui,t 1 ) yi,t 2 = 0 N N (T 1) i =1 t = 2 при T или/и N. В качестве инструмента вместо yi,t 2 можно использовать, например, разность y i,t 2 y i,t 3, что приводит к другой оценке IV = (y i =1 t = i =1 t =1 NT (y N T i,t y i,t 1 )( y i,t 2 y i,t 3 ) y i,t 2 )( y i,t 2 y i,t 3 ), i,t для состоятельности которой необходимо, чтобы NT 1 p lim (uit ui,t 1 )(yi,t 2 yi,t 3 ) = 0. N N (T 2 ) i =1 t = Глава Состоятельность обеих оценок гарантируется отсутствием автокоррелированности ui,t. Заметим теперь, что NT 1 p lim (uit ui,t 1 ) yi,t 2 = E [(uit ui,t 1 ) yi,t 2 ] = 0, N N (T 1) i =1 t = 2 NT 1 p lim (uit ui,t 1 )(yi,t 2 yi,t 3 )= N N (T 2 ) i =1 t = = E [(uit ui,t 1 )( yi,t 2 yi,t 3 )] = 0. Это условия на моменты совместных распределений пар случайных величин (uit ui,t 1 ), yi,t 2 и (uit ui,t 1 ), ( yi, t 2 yi,t 3 ). Если оба эти условия (условия ортогональности) выполняются, то использование сразу двух инструментов приводит к повышению эффективности оценок (используется большее количество информации). Заметим, что можно найти и другие подходящие инструменты. Например, каждая из переменных yi,t 2 j, j = 0,1,K удовлетворяет условиям E (uit ui,t 1 ) yi,t 2 j = 0, [ E [( y i,t yi,t 2 ) yi,t 2 j 0, ] ] так что и эти переменные годятся в качестве инструментов. Arellano, Bond (1991) предложили расширить список инструментов, поступая следующим образом. Пусть, например, Т = 4. Соотношение E [(ui 2 ui1 ) yi 0 ] = 0 рассматривается как моментное условие для t = 2. Для t = 3 имеем E [(ui 3 ui 2 ) yi1 ] = 0, но при этом справедливо и соотношение E [(ui 3 ui 2 ) yi 0 ] = 0. Для t = 4 имеется три аналогичных моментных условия:

Панельные данные E [(ui 4 ui 3 ) yi 0 ] = 0, E [(ui 4 ui 3 ) yi1 ] = 0, E [(ui 4 ui 3 ) yi 2 ] = 0. Всю эту совокупность моментных условий можно использовать рамках обобщенного метода моментов (GMM – generalized method of moments). Для произвольного Т определим (T 1) 1 -вектор L 0 0 [ yi 0 ] 0 0 [ yi 0, yi1 ] L Zi = ;

M O M 0 L 0 [yi 0,K, yi,T 2 ] каждая строка матрицы Z i содержит инструменты, подходящие для соответствующего момента времени. В этих обозначениях, указанная совокупность T (T 1) / 2 моментных условий записывается в виде: E Z iT u i = 0. Если определить еще yi 2 yi1 yi1 yi 0 yi = M M, yi, 1 =, y y y i,T 1 i,T i,T 1 yi,T ui 2 ui1 ui = M u u i,T 1 i,T и (T 1) (T (T 1) / 2 ) -матрицу [ ] то последнее соотношение записывается также в виде: E Z iT (yi yi, 1 ) = 0. В отличие от метода наименьших квадратов здесь мы имеем количество моментных условий больше необходимого для [ ] Глава определения с их помощью значения, так что использование разных условий приводит к различным оценкам. Следовательно, нет возможности получения значения, при котором выполняются все указанные моментные условия. Вместо этого приходится ограничиваться требованием в каком-то смысле “наилучшего” приближения ко всем моментным условиям сразу. Чтобы использовать всю совокупность моментных условий, в GMM минимизируется квадратичная форма от выборочных аналогов моментных условий 1 N 1 N Q( ) = Z iT (y i y i, 1 ) W N Z iT (y i y i, 1 ), N i =1 N i =1 где WN – симметричная положительно определенная весовая матрица. Искомый минимум достигается при значении, равном T N N N N GMM = yiT,1 Z i WN Z iT yi,1 yiT,1Z i WN Z iT yi. i =1 i =1 i=1 i =1 Это и есть GMM-оценка параметра. Свойства этой оценки зависят от выбора взвешивающей матрицы WN. Хотя она состоятельна при положительной определенности матрицы WN, в частности, для единичной матрицы WN = I N, желательно выбирать матрицу WN таким образом, чтобы GMM-оценка была по возможности наиболее эффективна – о такой матрице говорят как об оптимальной взвешивающей матрице. Такая матрица должна удовлетворять условию:

p lim W N = Cov Z iT u i N (( )) = E Z iT u i (u i ) Z i T [( )].

И если на ковариационную матрицу вектора ошибок наблюдений для i -го субъекта не накладывается никаких ограничений, то можно поступить следующим образом. Сначала полагаем WN = I N и производим GMM-оценивание коэффициента в модели y i,t = yi,t 1 + u it с такой Панельные данные взвешивающей матрицей, получая предварительную оценку (1) для. При этом получаем остатки u it = y i,t (1) y i,t 1 и составляем из них векторы u i 2 u i = M. u i,T Искомая матрица определяется после этого соотношением 1 N T Z i u i (u i )T Z i. = N i =1 Если uit ~ i.i.d., то положение значительно упрощается. В этом случае 0 2 1 0 K 0 0 1 2 1 K 0 0 1 2 K 0 0 T 2 2 E u i (u i ) = u G = u M M MOM M 0 0 K 2 1 0 0 0 0 K 1 2 и поэтому не требуется предварительного оценивания. Оптимальная матрица определяется соотношением opt WN ( ) 1 N W = Z iT G Z i N i =1 и GMM-оценивание производится за один шаг. В общем случае GMM-оценка GMM имеет асимптотически нормальное распределение с ковариационной матрицей opt N Глава y Z u i (u i ) Z y i, 1. i =1 i =1 i =1 Если uit ~ i.i.d., то средняя составляющая редуцируется к N T i, 1 p lim N N 1 Zi N N N T i T Zi 1 N N T i W 2 u opt N 1 = N 2 u Z G Zi. i = T i Рассмотрим теперь динамическую модель с экзогенными переменными T yit = yi,t 1 + xit + i + uit, i = 1,K, N, t = 1,K, T. Здесь дифференцирование приводит к модели T yi,t = yi,t 1 + xit + uit. Если предполагать, что все p объясняющих переменных, входящих в состав вектора xit, строго экзогенны, в том смысле, что они не коррелированы с каждым uis, то тогда E (xit uis ) = 0 для всех t, s, так что в указанные ранее списки инструментов для каждого момента (периода) времени можно добавить xi1,K, xiT. Тогда для момента t список инструментов принимает вид: [ y i0, yi1, K, y i,t 2, xi1, K, xiT ]. Такой список может быть весьма длинным, если p и T не очень малы. В то же время при строгой экзогенности xit имеем также:

E (xit uit ) = 0 для каждого t, так что xit могут выступать в качестве инструментов для самих себя. При таком подходе список инструментов для момента t имеет Панельные данные вид:

y, y, K, y i, t 2, xi1, K, xit. i 0 i Этот список существенно короче, если панель достаточно длинна. Предположим теперь, что переменные в xit не являются строго экзогенными, но являются предетерминированными, в том смысле, что E ( xit uis ) = 0 для всех s > t. В этом случае уже не все xi1,K, xiT годятся в качестве инструментов для продифференцированного уравнения в момент t, а только xi1,K, xi,t 1, и, соответственно, накладываются моментные условия E (xi,t j uit ) = 0 для j = 1,K, t 1.

Разумеется, если в состав xit входят как строго эндогенные, так и предетерминированные переменные, то списки инструментов соответствующим образом корректируются. Замечание Указанная выше “оптимальная” взвешивающая матрица является оптимальной в отношении выбранного множества инструментов. В то же время возникает вопрос об “оптимальном” выборе самих инструментов. Привлечение большего количества инструментов подразумевает получение более эффективных оценок. Однако здесь возникают две опасности: • некоторые из переменных, привлеченных в качестве инструментов, в действительности могут быть коррелированными с ошибками;

для предотвращения таких ситуаций необходимо проверять гипотезу о выполнении соответствующих условий ортогональности;

• оценки коэффициентов могут иметь значительное смещение вследствие оценивания взвешивающей матрицы WN.

Глава Проверка гипотез динамической модели о правильности спецификации Пример Вернемся к рассмотренным ранее данным об объемах инвестиций y и прибыли x трех предприятий ( N = 3 ) за десятилетний период ( T = 10 ) и рассмотрим на этот раз динамическую модель первого порядка yit = µ + i + yi,t 1 + 1 xit + 2 xi,t 1 + uit, i = 1, 2, 3, t = 2,K,10. Дифференцирование приводит к модели для разностей: yit = yi,t 1 + 1 xit + 2 xi,t 1 + uit, i = 1, 2, 3, t = 3,K,10. Если следовать описанию программы xtabond в пакете Stata8, то в этой программе будут использованы в качестве инструментов:

t 3 4 5 6 7 8 9 Инструменты yi1 yi1, yi 2 yi1, yi 2, yi 3 yi1, yi 2, yi 3, yi 4 yi1, yi 2, yi 3, yi 4, yi 5 yi1, yi 2, yi 3, yi 4, yi 5, yi 6 yi1, yi 2, yi 3, yi 4, yi 5, yi 6, yi 7 yi1, yi 2, yi 3, yi 4, yi 5, yi 6, yi 7, yi Кол-во 1 2 3 4 5 6 7 Всего:

а также xi 3 + L + xi,10 и xi 2 + L + xi 9. Это дает всего 36 + 2 = 38 моментных условий. Поскольку модель в разностях содержит 3 неизвестных коэффициента, для оценивания этих коэффициентов достаточно использовать только 3 моментных условия, а остальные 38 3 = 35 условий – избыточные. Их можно было бы не Панельные данные использовать вовсе, но это снизило бы эффективность получаемых оценок. Вместе с тем наличие избыточных условий позволяет проверять адекватность сделанных в отношении модели предположений. Точнее говоря, возникает возможность проверки гипотезы H 0 о том, что избыточные условия (выведенные на основании исходных предположений о рассматриваемой модели) действительно выполняются. Для проверки этой гипотезы используется статистика Саргана (Sargan):

S = N Q GMM, ( ) где GMM – GMM-оценка вектора коэффициентов модели (в T нашем примере = (,, ) ), а Q – значение при = 1 минимизируемой в методе GMM квадратичной формы. Если гипотеза H 0 справедлива, то статистика Саргана имеет асимптотическое (при N ) распределение хи-квадрат с числом степеней свободы, равным количеству избыточных моментных условий (в нашем примере оно равно 35). Приведем теперь результаты применения программы xtabond при использовании взвешивающей матрицы W opt N ( GMM ) GMM 1 = N Z G Zi i = N T i (так что оценивание производится за один шаг).. xtabond y x l1(x), lags(1) Arellano-Bond dynamic panel-data estimation Number of obs = 24 Number of groups = 3 Obs per group: min = Глава One-step results y1 x 1.132349.0606134 18.68 0.000 -.0423772.2375232 -0.18 0.858 x1 cons.1032841.1361505 0.76 0.448 Sargan test of over-identifying restrictions: chi2(35) = 21.81 Prob > chi2 = 0.9600 Результаты применения критерия Саргана говорят в пользу гипотезы о выполнении избыточных предположений. В то же время коэффициенты при запаздывающей разности значений объясняемой переменной и запаздывающей разности объясняющей переменной статистически незначимы, что возвращает нас к статической модели регрессии.

Coef.. Std. Err.. z 0. P>z 0. В программе xtabond используется еще один критерий проверки адекватности модели. Он основан на следующем обстоятельстве. Если ошибки ui1,K, uiT взаимно независимы, то • “соседние” разности uit, ui,t 1 коррелированы, т.к.

Corr (uit, ui,t 1 ) = Corr (uit ui,t 1, ui,t 1 ui,t 2 ) = u2 ;

отстоящие на большее количество периодов времени разности uit, ui,t s, s = 2, 3, K напротив, не являются коррелированными. Соответственно, с целью дополнительной проверки адекватности оцененной модели проверяется “наличие автокоррелированности первого порядка” и “отсутствие автокоррелированности второго порядка”. Приведем результаты такой проверки для только что оцененной модели: Arellano-Bond test that average autocovariance in residuals of order 1 is 0: H0: no autocorrelation z = -2.56, Pr > z = 0.0106. Arellano-Bond test that average autocovariance in residuals of order 2 is 0: H0: no autocorrelation z = 0.77, Pr > z = 0.4427.

• Панельные данные Полученные результаты подтверждают правильность сделанных предположений об ошибках Пример Здесь мы обратимся к исследованию, предпринятому в работе Konigs, Roodhooft [De Economist, 145 (1997)] и касающемуся эластичности спроса на труд со стороны предприятий Бельгии. Данные относились к более, чем 3000 крупных фирм в период с 1986 по 1994 г. Статическое уравнение спроса на труд бралось в форме ln Lit = 1 + 2 ln wit + 3 ln rit + 4 ln Yit + 5 ln w jt + uit, где wit – стоимость единицы труда, rit – стоимость единицы капитала, Yit – объем выпуска, wit – средняя реальная заработная плата по отрасли. Динамические модели брались в разных формах, из которых простейшей была модель, в правую часть которой включалось запаздывающее на один период значение объясняемой переменной. При этом rit заменялась акционерным капиталом K it, а в качестве Yit выступала условно-чистая продукция. Соответствующая модель имела вид ln Lit = 1 + 2 ln wit + 3 ln K it + 4 ln Yit + 5 ln w jt + ln Li,t 1 + i + it. Здесь i отражает наличие ненаблюдаемой переменной, специфичной в отношении фирм и не изменяющейся во времени. Переходя к первым разностям, выметаем i, но полученное уравнение нельзя состоятельно оценить OLS из-за наличия корреляции между ln Li,t 1 и i,t. Кроме того, может существовать коррелированность между i,t и ln wi,t вследствие наличия договоров нанимателей с профсоюзами по вопросу о занятости и оплате труда, так что помимо ln Li,t 1 надо Глава инструментировать и ln wi,t. В качестве инструментов можно использовать запаздывающие разности ln wi,t 2, ln wi,t 3 и т.д. Приводимые ниже результаты оценивания относятся к модели, в правую часть которой дополнительно включались временные и региональные дамми-переменные.

Переменные ln Li,t Оценка коэффициента 0. Стандартная ошибка 0. ln Yit ln wi,t ln w j,t 0.008 -0.66 0.054 0. 0.005 0.19 0.033 0. ln K it Значимость коэффициента при ln Li,t 1 говорит в пользу динамической модели. Значение -0.66 характеризует “краткосрочную” эластичность спроса по заработной плате, а значение 0.60 (1 0.60 ) = 1.6 характеризует “долговременную” эластичность спроса по заработной плате. Заметим, что если производить оценивание “долговременной” эластичности в рамках статической модели, интерпретируя такую модель как модель долговременной связи между переменными, то тогда долговременная эластичность оценивается величиной 1.78. Такого рассогласования оценок можно было бы избежать в рамках модели коррекции ошибок. Впрочем, к самим полученным результатам можно отнестись критически хотя бы по следующим обстоятельствам. В процессе инструментирования было использовано 29 “лишних” инструментов. Соответственно, имеется возможность проверить гипотезу о выполнении соответствующих 29 условий ортогональности с помощью статистики Саргана S = N Q GMM, где – оценка вектора кэффициентов модели обобщенным методом ( ) GMM моментов. Статистика Саргана принимает здесь значение 51.66, что Панельные данные соответствует P-значению, рассчитанному по распределению хиквадрат с 29 степенями свободы, равному 0.006. Следовательно, гипотеза о выполнении дополнительных моментных условий отвергается.

3.12. Модели бинарного выбора Мы уже рассматривали модели такого рода в Главе 1, но только для данных, относящихся к одному-единственному моменту (периоду) времени (cross-section data – данные в сечениях). Если исследование затрагивало n субъектов, то мы отмечали факт наличия или отсутствия некоторого интересующего нас признака у i -го субъекта при помощи индикаторной (бинарной) переменной y, которая принимает в i -м наблюдении значение yi. При этом y i = 1 при наличии рассматриваемого признака у i -го субъекта и y i = 0 – при отсутствии рассматриваемого признака у i -го субъекта. Если пытаться объяснить наличие или отсутствие рассматриваемого признака значениями (точнее, сочетанием значений) некоторых факторов (объясняющих переменных), то, следуя идеологии классической линейной модели, мы могли бы расмотреть модель наблюдений yi = 1 xi1 + L + p xip + i, i = 1, K, n, в которой xi1, K, xip – значения p объясняющих переменных в i -м 1,K, p – неизвестные параметры, а 1, K, n – случайные ошибки, отражающие влияние на наличие или отсутствие рассматриваемого признака у i -го субъекта каких-то неучтенных дополнительных факторов. При обычных предположениях регрессионного анализа в такой модели получаем: P{y i = 1 x i } = 1 xi1 + L + p xip, наблюдении, Глава т.е. должно выполняться соотношение 0 1 xi1 + L + p xip 1.

Это первая из трудностей, с которыми мы сталкиваемся при обращении к таким моделям. Далее, случайная величина i имеет условную дисперсию D ( i x i ) = xiT 1 xiT. Таким образом, здесь возникает также проблема гетероскедастичности, осложненная еще и тем, что в выражения для дисперсий i входит и (неизвестный) вектор параметров. Кроме того, если, скажем, yi = + xi + i, i = 1, K, n, то E ( yi xi ) = P{yi = 1 xi } = + xi, ( ) так что если значение xi увеличить на единицу, то вероятность наличия представляющего интерес признака у i -го субъекта увеличится на величину, равную ( + (xi + 1)) ( + xi ) =, независимо от того, сколь большим или малым является значение xi. Более подробное рассмотрение этой ситуации привело нас к необходимости использования нелинейных моделей вероятности вида P{y i = 1 x i } = G ( 1 xi1 + L + p x ip ), где G (z ) – S-образная функция распределения, имеющего плотность g ( z ) = G ( z ), что соответствует нелинейной модели регрессии y i = G ( 1 xi1 + L + p xip ) + i, i = 1, K, n. Предположим, что при фиксированных значениях объясняющих переменных в n наблюдениях, что соответствует фиксированным значениям векторов xi, случайные ошибки 1, K, n статистически Панельные данные независимы. Тогда при фиксированных xi статистически независимы и случайные величины G ( 1 xi1 + L + p xip ) + i, i = 1, K, n, т.е. статистически независимы y1,K, yn. В силу этого (условная при фиксированных xi, i = 1, K, n ) совместная вероятность получения конкретного набора наблюдений y1,K, yn (конкретного набора нулей и единиц) равна произведению y 1 y (P{yi = 1 xi }) (P{yi = 0 xi }) i n i = i = (G (x )) (1 G (x )) n T i yi T i i = 1 yi.

Правая часть этого выражения является при фиксированных xi, i = 1, K, n, функцией от вектора неизвестных параметров, L( ) = L( x1, K, x n ) = G xiT n i = ( ( )) (1 G (x )) yi T i 1 yi и интерпретируется как функция правдоподобия параметров 1,K, p. Дело в том, что при различных наборах значений 1,K, p получаются различные L( ), т.е. при фиксированных xi, i = 1, K, n, вероятность наблюдать конкретный набор значений y1,K, yn может быть более высокой или более низкой, в зависимости от значения. Метод максимального правдоподобия предлагает в качестве оценки вектора параметров использовать значение =, максимизирующее функцию правдоподобия, так что L = max L = max () () (G(x )) (1 G (x )) n T i yi T i i = 1 yi.

Использование свойства монотонного возрастания функции ln(z ), позволяет найти то же самое значение логарифмическую функцию правдоподобия случае n i =, максимизируя ln L( ). В нашем ln L( ) = y i ln G xiT + (1 y i ) ln 1 G xiT.

i = () n ( ( )) Глава Если не имеет место чистая мультиколлинеарность объясняющих переменных (т.е. если матрица X = xij значений p объясняющих () переменных в n наблюдениях имеет ранг p, так что ее столбцы линейно независимы), то тогда функция L( ) имеет единственный локальный максимум, являющийся и глобальным максимумом, что гарантирует сходимость соответствующих итерационных процедур к оценке максимального правдоподобия. Модель бинарного выбора обычно связывается с наличием некоторой ненаблюдаемой (латентной) переменной yi, часто трактуемой как “полезность” интересующего нас признака для i -го субъекта, и такой, что 1, если y i >, yi = 0 в противном случае. Если эта “полезность” определяется соотношением y = 1 xi1 + L + p xip + i, i = 1, K, n, i и случайные ошибки имеют нормальное распределение, то P{y i = 1 x i } = G xiT = ( 1 x i1 + L + p xip ). В стандартной модели полагается = 0. Нарушение предположения об одинаковой распределенности случайных ошибок i в процессе порождения данных приводит к гетероскедастичной модели и к несостоятельности оценок максимального правдоподобия, получаемых на основании стандартной модели. Перейдем теперь к панельным данным. И здесь модель бинарного выбора обычно связывается с наличием некоторой ненаблюдаемой (латентной) переменной y it и наблюдаемой индикаторной переменной y it такой, что ( ) Панельные данные 1, если yit > 0, yit = 0 в противном случае. Например, y it может указывать на то, работает ли i -й индивид в период t или нет. Типичной является модель, в которой T y = xit + i + it, it T где xit – вектор-строка значений объясняющих переменных для i -го субъекта в период t. Предположим, что случайные ошибки it независимы и одинаково распределены в обоих направлениях и имеют симметричное распределение с функцией распределения G и что объясняющие переменные строго экзогенны. Если трактовать i как фиксированные неизвестные параметры, то это соответствует включению в модель N дамми-переменных. Логарифмическая функция правдоподобия принимает тогда вид: ln L(, 1, K, N ) = T T = y it ln G ( i + x it ) + (1 y it ) ln 1 G i + xit. i,t i,t ( ( )) И здесь возникает ситуация, когда оценка максимального правдоподобия для и i даже при выполнении стандартных предположений состоятельна только если T, а при конечном Т и N она несостоятельна. Мы встречались уже с такой ситуацией в рамках OLS-оценивания линейной модели с фиксированными эффектами. Только там при несостоятельности оценок для i оценка для оставалась все же состоятельной, тогда как здесь несостоятельность оценок для i в общем случае переносится и на оценку для. Одним из исключений является линейная модель вероятности, в которой вероятность P{y it = 1 x it } моделируется как линейная функция от объясняющих переменных.

Глава Конечно, по подобию проделанного раньше, возникает желание вымести i непосредственно из уравнения T y = x it + it i + it. Однако это не дает практической пользы, поскольку, например, если выметание производится путем перехода в этом уравнении к разностям y y i,t 1, то не удается указать it переход к наблюдаемым переменным типа y it y i,t 1. Альтернативный подход состоит в использовании условного максимального правдоподобия (conditional FE). В этом случае рассматривается функция правдоподобия, условная относительно некоторого множества статистик ti, которое достаточно для i. Это означает, что при заданных значениях этих статистик вклад i -го субъекта в правдоподобие уже не зависит от i. Таким образом, если f ( yi1,K, yiT i, ) – совместная вероятность значений индикаторной переменной для i -го субъекта, то f ( yi1,K, yiT ti, i, ) = f ( yi1,K, yiT ti, ). Соответственно, мы можем получить состоятельную оценку для, максимизируя условную функцию правдоподобия, основанную на f ( yi1, K, yiT ti, ). Наличие указанных достаточных статистик зависит от вида распределения it. В линейной модели вероятности с нормальными ошибками такой достаточной статистикой является y. Максимизация соответствующей условной функции правдоподобия приводит к FE-оценке для i. Однако, например, в случае пробит-модели, в которой нормальными являются ошибки в уравнении T y = xit + i + it, it Панельные данные достаточной статистики для i просто не существует. А это означает, что мы не можем состоятельно оценить пробит-модель с фиксированными эффектами при конечном Т. 3.12.1. Логит-модель с фиксированными эффектами Такой модели соответствует латентное уравнение T y = x it + i + it, it в котором z it имеют логистическое распределение G ( z ) = ( z ) = Рассмотрим для иллюстрации логит-модель с Т = 2. Заметим, что в этом случае сумма y i1 + y i 2 есть просто общее количество периодов безработицы (суммарная продолжительность пребывания в состоянии безработицы) для i -го субъекта, и что для каждого субъекта есть 4 возможных последовательности состояний ( y i1, y i 2 ) : (0,0), (0,1), (1,0), (1,1). Соответственно, сумма y i1 + y i 2 может принимать только 3 возможных значения: 0, 1, 2 (у i -го субъекта не было периодов безработицы, был один период безработицы, был безработным в течение обоих периодов). Вычислим условные вероятности указанных четырех последовательностей при различных значениях суммы y i1 + y i 2. Если y i1 + y i 2 = 0, то возможна только последовательность (0,0), так что } exp{x + } 1. = P{y = 0 x,, } = 1 1 + exp{x + } 1 + exp{x + } T it i it it i T it i T it i e. При этом 1+ ez T exp x it + i, P{y it = 1 xit, i, } = T 1 + exp xit + i { { } Глава P{(0,0) yi1 + yi 2 = 0, i, } = 1, а условные вероятности трех других последовательностей при y i1 + y i 2 = 0 равны 0. Если yi1 + yi 2 = 2, то возможна только последовательность (1, 1), так что P{(1,1) yi1 + yi 2 = 1, i, } = 1, а условные вероятности трех других последовательностей при y i1 + y i 2 = 1 равны 0. Если же y i1 + y i 2 = 1, то возможны две последовательности (0,1) и (1,0), и они имеют условные вероятности, отличные от 0 и 1, тогда как условные вероятности последовательностей (0,0) и (1, 1) равны 0. При этом P{(0,1) x it, i, } = P{(0,1) y i1 + y i 2 = 1, x it, i, } = P{y1 + y 2 = 1 x it, i, } = P{y i1 = 0 x it, i, }P{y i 2 = 1 x it, i, } + P{y i1 = 1 xit, i, }P{y i 2 = 0 x it, i, } exp x iT2 + i 1 1 + exp x iT + i 1 + exp x iT2 + i P{y i1 = 0 xit, i, }P{y i 2 = 1 xit, i, } } { } = = exp{x + } exp{x + } 1 1 + 1 + exp{x + } 1 + exp{x + } 1 + exp{x + } 1 + exp{x + } { } T i2 i T i1 i T i1 i T i2 i T i1 i T i2 i { = {}, exp{x + }+ exp{x + } exp{x }+ exp{x } exp x iT2 + i i T i1 T i { } = exp x iT i T i T i так что индивидуальные эффекты выметаются, и T exp (x i 2 x i1 ). P{(0, 1) y i1 + y i 2 = 1, x it, i, } = T 1 + exp (x i 2 x i1 ) { { } } Панельные данные Соответственно, P{(1,0) y i1 + y i 2 = 1, x it, i, } = 1 P{(0,1) y i1 + y i 2 = 1, x it, i, }=. T 1 + exp (xi 2 x i1 ) Таким образом, все условные вероятности P{( y i1, y i 2 ) = (r, s) y i1 + y i 2 = l, x it, i, }, = { } где r, s = 0,1, l = 0, 1, 2, не зависят от индивидуальных эффектов, так что продолжительность периодов безработицы является достаточной статистикой для i, и использование условного правдоподобия приводит к состоятельной оценке для. Полученные результаты означают, что при T = 2 мы можем оценивать логит-модель с фиксированными эффектами, используя стандартную логит модель, в которой в качестве объясняющей переменной выступает xi 2 xi1, а в качестве наблюдаемой бинарной переменной – переменная, отражающая изменение значения переменной yit при переходе от первого ко второму наблюдению (1 – при возрастании yit, 0 – при убывании yit ). Соответственно, функцию правдоподобия можно записать в виде:

L = P{(0, 0) }P{(0,1) }P{(1, 0) }P{(1, 1) }= N i = exp ( xi 2 xi1 )T 1 1S11, = 1 1 + exp (x x )T 1 + exp ( x x )T i =1 i2 i1 i2 i1 где S rs = 1, если y i1 = r, y i 2 = s, и S rs = 0 в противном случае. Мы видим, что субъекты, для которых yi1 = yi 2 = 0 или yi1 = yi 2 = 1, не вносят дополнительный вклад в функцию правдоподобия и фактически игнорируются при оценивании. Для оценивания существенны только те субъекты, которые хотя бы однажды изменяют свой статус в отношении yit.

N S 01 S10 S { { } } { } Глава Параметр идентифицируется здесь по одному только “within”-измерению данных. Вклад в оценивание вносят только те субъекты, которые изменили свой статус. При значениях T > 2 вычисление условных вероятностей более хлопотно, но также возможно. Проверку гипотезы H 0 об отсутствии индивидуальных эффектов можно осуществить с помощью критерия типа Хаусмана, основанного на разности между оценкой CML для, полученной с использованием условного правдоподобия и обычной логит ML оценкой ML, игнорирующей индивидуальные эффекты (при вычислении последней константа исключается). Логит MLE состоятельна и эффективна только при гипотезе H 0 и несостоятельна при альтернативе. Условная же MLE состоятельна и при гипотезе H 0 и при альтернативе, но не эффективна, так как использует не все данные. Таким образом, положение здесь соответствует тому, при котором реализуется схема Хаусмана (см. Главу 2, разд. 2.6.5.). Статистика критерия 1 T C ov H= Cov имеет при гипотезе H 0 асимптотическое распределение хи-квадрат с числом степеней свободы, равным размерности вектора. Замечание Существенным недостатком метода условного правдоподобия является то, что он предполагает (условную) независимость yi1,K, yiT при фиксированных xit, i,. Метод неприменим к моделям с запаздывающими значениями объясняющей переменной в правой части.

( CML ML )( ( CML ) ( )) ( ML CML ML ) Панельные данные 3.12.2. Пробит-модель со случайными эффектами Если i статистически независимы от объясняющих переменных, то модель со случайными эффектами представляется более подходящей, и в этом случае проще рассматривать не логит, а пробит-модель. (Хотя можно использовать и логит-модель, что и делается в приводимом далее примере.) Здесь мы отправляемся от спецификации 1, если yit > 0, yit = 0 в противном случае, T y it = xit + uit, uit = i + it, где 2 i – случайные индивидуальные эффекты, i ~ i.i.d. N (0, ), it – случайные ошибки, it ~ i.i.d. N (0, 2 ), причем индивидуальные эффекты и ошибки статистически независимы. В этих условиях совместное распределение случайных 2 величин ui1, K, uiT нормально, причем E (uit ) = 0, D(uit ) = + 2, 2 Cov(u it, u is ) = Cov( i + it, i + is ) = для s t, так что значение 2 Cov(uit, uis ) коэффициента корреляции = = 2 2 между D (uit ) D (uis ) + ошибками uit и uis внутри одной группы (субъекта) одинаково для 2 Это соответствует предположению о том, что 2 = 1. Совместная вероятность получения набора yi1,K, yiT заданных xi1,K, xiT определяется как 2 любых s t. В “стандартной” спецификации D (uit ) = 1 и =.

при Глава f ( yi1,K, yiT xi1,K, xiT, ) = = f (y i,K, yiT xi1,K, xiT, i, )f ( i )d i = T f (yit xit, i, ) f ( i )d i. t =1 В рассматриваемой пробит-модели xT + i it, если yit = 1, 1 2 f ( yit xit, i, ) = xT + i it, если yit = 0, 1 2 1 1 i2. exp 2 2 2 2 Итоговый интеграл вычисляется численными методами. Соответствующие программы имеются в некоторых пакетах (например, в Stata).

f ( i ) = При гипотезе H 0 об отсутствии индивидуальных эффектов 2 = = 0, так что проверка отсутствия индивидуальных эффектов сводится к проверке гипотезы = 0.

Замечание В контексте панельных данных построение порядковых пробит моделей с несколькими категориями отклика довольно затруднительно.

Панельные данные 3.12.3. Пример Рассмотрим результаты исследования панельных данных по Германии (German Socio-Economic Panel) за 5-летний период с 1985 по 1989 гг., проводившихся с целью выяснения влияния состояния безработицы на степень удовлетворенности жизнью (“well-being”). Исходные данные были представлены в порядковой шкале и индексировались числами от 0 до 10. Ввиду сложности построения порядковых логит- и пробит-моделей для панельных данных, данные были затем сжаты до бинарных. Индивиды, у которых удовлетворенность жизнью индексировалась числами от 0 до 4, считались неудовлетворенными жизнью, тогда как индивиды с индексами 5 и выше считались более или менее удовлетворенными жизнью. В качестве объясняющих переменных первоначально были привлечены следующие характеристики индивидов: Непрерывная переменная: LOGINCOME – логарифм (располагаемого) дохода – см. ниже. Дамми-переменные: UNEMP (безработный), NOPARTIC (не включен в рынок труда), SELFEMP (самозанятый), PARTTIME (частично занятый) – указывают текущий сатус на рынке труда (категория “полностью занятый” не снабжается дамми-переменнной), MALE – индивид мужского пола, OKHEALTH – хорошее состояние здоровья, AGE – возраст и AGESQUARED – квадрат возраста, VOCATIONAL D. – наличие профессиональной степени, UNIVERSITY D. – наличие университетской степени, MARRIED – состояние в браке. Для правильной интерпретации влияния безработицы на удовлетворенность жизнью надо учитывать целый ряд обстоятельств. Например, безработица обычно ведет к сокращению дохода, что, в свою очередь, может уменьшить удовлетворенность. Однако, если Глава доход включается в число объясняющих переменных, то коэффициент при безработице фактически измеряет влияние безработицы при прочих равных, т.е. при сохранении дохода постоянным. Это могло быть в реальности, если бы страховое возмещение при безработице достигало 100%. При высоком (отрицательном) коэффициенте корреляции между безработицей и доходом оценки остаются несмещенными, но их точность может значительно уменьшаться. Удовлетворенность индивида может уменьшаться вследствие безработицы также и потому, что доля его вклада в общий семейный бюджет уменьшается. Поскольку, в отличие от доходов домохозяйства, имеющиеся в панели данные в отношении индивидуального дохода ограничены прошлыми доходами, в уравнение включается не индивидуальный доход, а доход домохозяйства. Включение в модель взаимодействий факторов позволяет выделять дифференциальные эффекты влияния безработицы в группах, имеющих разные атрибуты, например, в разных возрастных группах. В связи с этим в модель включены помимо собственно UNEMP также и переменные UNEMP*AGE< UNEMP*AGE30-49.

Другим важным взаимодействием является взаимодействие между безработицей и продолжительностью текущего периода пребывания в состоянии безработного. Влияние продолжительности безработицы на психическое состояние индивида достаточно хорошо документировано в литературе по психологии. В соответствии с этим, в уравнение включается переменная UNEMPDUR (продолжительность периода безработицы, продолжающегося в настоящее время) и, для учета возможной нелинейности, переменная UNEMPDURSQ*10-2.

Панельные данные К сожалению, в данных полностью отсутствовал региональный аспект, так что не удалось выяснить влияние локального уровня безработицы. Следует отметить очень существенное взаимодействие безработицы и пола индивида. По этой причине обработка данных производилась также раздельно по мужчинам и женщинам. Наличие протяженных наблюдений позволяет, в принципе, включать в модель элементы динамики. Мы, однако, уже говорили о проблемах с оцениванием динамических моделей бинарного выбора, в частности, с включением в правую часть запаздывающих значений объясняемой переменной. В данном анализе предполагается устойчивость индивидуальных откликов во времени, и она как раз учитывается введением в модель индивидуальных эффектов. Для проверки этого свойства в модель помимо переменной UNEMPDUR включается также переменная PREVDUR, указывающая на суммарную продолжительность периодов безработицы за 10 лет, предшествующих анализируемому периоду. Кроме того в модели используется в качестве объясняющей еще и переменная CHANGEINC – относительное изменение дохода домохозяйства по сравнению с предыдущим годом. Это связано с некоторой неясностью в отношении того, что именно влияет на удовлетворенность – собственно уровень доходов или его изменение. Наконец, нельзя исключать возможного наличия и обратной причинной связи между безработицей и уровнем удовлетворенности, т.е. того, что внутренне менее удовлетворенные индивиды скорее и оказываются безработными. Если это так, то переменная UNEMP коррелирует со случайным эффектом в модели случайных эффектов и оценка максимального правдоподобия, не учитывающая этого, оказывается несостоятельной. Поскольку далее приводятся результаты статистического анализа и по модели с фиксированными эффектами и по модели со случайными эффектами, имеется возможность оценить устойчивость результатов к этой возможной эндогенности.

Глава Основная задача состоит в проверке гипотезы о негативном влиянии безработицы на удовлетворенность при очистке от влияния прочих факторов, включая влияние уменьшения доходов. В приводимых ниже табл. А1 и А2 указаны результаты оценивания порядковой пробит-модели, не учитывающей панельной структуры данных (данные усреднены по времени), но включающей временные дамми. В рассмотренной порядковой пробит-модели предполагается, что уравнение полезности имеет вид T Sit = xit + it, и наблюдаемое значение индекса удовлетворенности определяется соотношениями 0, если Sit < 0, 1, если 0 < Sit < 1, Sit = M 10, если S >. it 9 Таблицы B1 и B2 содержат результаты оценивания FE логитмодели и RE пробит-модели с бинарным откликом (1 – если уровень удовлетворенности равен 5 или выше, 0 – если уровень удовлетворенности ниже 5). Таблица А1 (объединенная выборка) Pooled coeff. Constant MALE UNEMP 1.661 -0.059 -0.265 s.e. (0.168) (0.015) (0.050) Панельные данные UNEMP*AGE<29 UNEMP*AGE30-49 UNEMPDUR UNEMPDURSQ*10 PREVDUR NOPARTIC SELFEMP PARTTIME MARRIED OKHEALTH AGE AGESQ*10-2 VOCATIONAL D. UNIVERSITY D. LOGINCOME CHANGEINC 1986 1987 1988 1989 Observations - 329 -0.164 -0.221 -0.011 0.013 -0.009 -0.042 -0.107 -0.060 0.140 0.428 -0.050 0.062 0.083 0.106 0.208 0.018 -0.027 -0.127 -0.191 -0.219 24055 (0.078) (0.065) (0.007) (0.020) (0.001) (0.018) (0.033) (0.028) (0.017) (0.014) (0.004) (0.005) (0.013) (0.033) (0.017) (0.022) (0.020) (0.020) (0.020) (0.021) Глава Таблица А2 (раздельное оценивание по мужчинам и женщинам) Male coeff. Constant UNEMP UNEMP*AGE<29 UNEMP*AGE30-49 UNEMPDUR UNEMPDURSQ*10-2 PREVDUR NOPARTIC SELFEMP PARTTIME MARRIED OKHEALTH AGE AGESQ* - Female s.e. (0.246) (0.063) (0.105) (0.085) (0.010) (0.028) (0.001) (0.035) (0.038) (0.129) (0.024) (0.021) (0.006) (0.007) (0.019) (0.040) (0.024) (0.030) (0.028) (0.028) (0.028) (0.029) coeff. 1.259 -0.118 -0.064 -0.175 -0.010 0.042 -0.008 0.056 -0.155 -0.001 0.110 0.426 -0.049 0.062 0.093 0.174 0.253 0.015 -0.037 -0.152 -0.206 -0.258 11450 s.e. (0.234) (0.089) (0.126) (0.109) (0.018) (0.064) (0.001) (0.024) (0.069) (0.031) (0.026) (0.021) (0.006) (0.007) (0.019) (0.059) (0.025) (0.031) (0.029) (0.030) (0.030) (0.030) 2.273 -0.402 -0.321 -0.245 -0.003 -0.013 -0.010 -0.273 -0.087 -0.180 0.133 0.409 -0.063 0.078 0.066 0.086 0.165 0.014 -0.018 -0.104 -0.175 -0.178 VOCATIONAL D. UNIVERSITY D. LOGINCOME CHANGEINC 1986 1987 1988 1989 Observations Панельные данные Таблица B1 (мужчины) MALE Random Effects coef. s.e. Constant UNEMP UNEMP*AGE<29 UNEMP+AGE30-49 UNEMPDUR UNEMPDURSQ*10 PREVDUR NOPARTIC SELFEMP PARTTIME MARRIED OKHEALTH AGE AGESQ* -2 - Fixed Effects coef. s.e. (0.358) (0.518) (0.419) (0.047) (0.145) 1.849 -0.849 -0.089 -0.013 -0.026 0.027 -0.011 -0.511 -0.185 -0.274 0.294 0.448 -0.073 0.086 0.098 0.057 0.135 0.158 0.382 (0.682) (0.145) (0.225) (0.187) (0.025) (0.072) (0.004) (0.084) (0.107) (0.274) (0.068) (0.052) (0.019) (0.023) (0.060) (0.115) (0.068) (0.072) (0.040) 556 0.676 0.086 (0.245) (0.174) -0.287 0.643 -0.162 0.575 0.409 0.009 -0.112 (0.243) (0.418) (0.554) (0.254) (0.128) (0.114) (0.131) -1.257 0.115 0.368 -0.030 0. VOCATIONAL D. UNIVERSITY D. LOGINCOME CHANGEINC No. of individuals Глава Таблица B2 (женщины) FEMALE Random Effects coef. s.e. Constant UNEMP UNEMP*AGE<29 UNEMP*AGE30-49 UNEMPDUR UNEMPDURSQ*10 PREVDUR NOPARTIC SELFEMP PARTTIME MARRIED OKHEALTH AGE AGESQ* -2 - Fixed Effects coef. s.e.

-0.160 0.003 -0.255 -0.550 -0.017 0.047 -0.009 0.007 -0.057 0.022 0.220 0.529 -0.035 0.042 0.149 0.280 0.278 0.159 0.411 (0.639) (0.209) (0.299) (0.240) (0.039) (0.144) (0.003) (0.069) (0.191) (0.087) (0.074) (0.053) (0.019) (0.023) (0.063) (0.185) (0.068) (0.073) (0.039) 538 0.356 0.265 (0.233) (0.160) -0.180 -0.268 -0.206 0.561 0.620 -0.179 0.066 (0.225) (0.497) (0.241) (0.261) (0.126) (0.108) (0.125) -0.192 -0.069 -0.821 0.014 -0.022 (0.484) (0.641) (0.548) (0.074) (0.270) VOCATIONAL D. UNIVERSITY D. LOGINCOME CHANGEINC No. of individuals Панельные данные Результаты, приведенные в таблицах, подтверждают сделанные ранее выводы. В частности, влияние безработицы представляется отрицательным. Однако следует помнить, что в нелинейных моделях оцененные коэффициенты не представляют предельные эффекты2. Более того, они не сравнимы для разных спецификаций модели. Тем не менее в рамках оценивания порядковой пробит модели без разделения по полу, можно отметить следующие моменты: • Влияние пола оказывается весьма значимым (коэффициент –0.059 при стандартной ошибке 0.015), что говорит в пользу раздельного анализа данных по мужчинам и женщинам. • Подтверждаются разультаты более ранних исследований, указывающие на U-образную форму степени негативного влияния безработицы на удовлетворенность: оцененный коэффициент выше по абсолютной величине в наиболее активных возрастных группах. • Уровень доходов имеет существенный положительный эффект при измерении его в уровнях, но не в приращениях. • Положительное влияние имеют наличие профессионального или университетского диплома, а также состояние в браке. При раздельном оценивании отдельно по мужчинам и по женщинам обнаруживаются большие дифференциальные эффекты, так что публикация результатов только по объединенной выборке, как это делают некоторые авторы, может вводить в заблуждение. Наиболее существенное различие: на мужчин состояние безработного действует в значительно большей степени. Так, для мужчин среднего возраста эффект безработицы равен –0.402–0.245 = –0.65, тогда как для женщин он равен только –0.118–0.175 = –0.29.

См. главу 1, разд. 1.4.

Глава Это соответствует росту неудовлетворенности на 12% для мужчин и только на 4% для женщин. Отметим также, что пребывание вне рынка рабочей силы негативно влияет на мужчин, но не на женщин. При переходе к анализу собственно панельными методами следует заметить, что в FE-модели выметаются все регрессоры, значения которых не изменяются во времени (Const, PREVDUR, VOCATIONAL D., UNIVERSITY D.) Кроме того, количество индивидов, по которым производится оценивание, сокращается, поскольку в выборку в этом случае надо включать только тех индивидов, у которых значение бинарного отклика изменялось на 5-летнем периоде исследования. Переход к FE- и RE-моделям не очень сильно повлиял на выводы, сделанные ранее на основе порядковой модели.

Pages:     | 1 | 2 || 4 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.