WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 || 3 |

Описываются непрерывные модели пропорциональных рисков, ускоренного времени и пропорционального отношения выбытия (proportional odds) и дискретные модели, основанные на logit и cloglog-спецификациях для функции риска. Демонстрируется связь разнородности и временной зависимости.

Параграф 1.4 посвящён включению в модель ненаблюдаемой разнородности – тех различий изучаемых объектов, которые не удаётся учесть включением в модель объясняющих переменных. Как правило, суммарное воздействие ненаблюдаемых факторов моделируется с помощью случайной величины, про которую обычно предполагается, что она является независимой от объясняющих переменных.

Акцент делается на моделировании латентных классов объектов, в частности, на модели разделённой совокупности (split population model), в которой предполагается наличие класса «безнадёжных» объектов, для которых вероятность прекращения состояния (т.е. нахождения работы) равна нулю.

Рассматривается проблема идентификации ненаблюдаемой разнородности и временной зависимости.

В параграфе 1.5 рассматриваются особенности данных о длительностях состояний – наличие цензурированных наблюдений и урезания выборки.

Наблюдение называется цензурированным, если оно не даёт точной информации о длительности, а лишь отмечает, что длительность принадлежит некоторому множеству значений. Урезание – свойство отбора наблюдений, приводящее к недостаточной доле каких-либо наблюдений в выборке (например, урезание возникает, если из выборки исключить все наблюдения со слишком малыми длительностями).

Обзор механизмов цензурирования и урезания приводится в расширенном относительно обычных работ по эконометрике виде, так как наблюдение путём проведения последовательности опросов может рассматриваться как особая комбинация этих механизмов.

Рассматриваются непараметрические методы Каплана-Мейера и Нельсона-Аалена и особенности применения метода максимального правдоподобия для анализа цензурированных и урезанных выборок.

Указывается на проблему начальных условий, возникающую при оценивании моделей с ненаблюдаемой разнородностью и временной зависимостью по урезанным слева данным. Если в выборке имеются наблюдения с «задержанным входом» (delayed entry), которые на момент начала наблюдения уже продолжались в течение некоторого времени, то индивидуальный эффект, описывающий ненаблюдаемую разнородность, уже нельзя считать независимым от экзогенных переменных модели. Дело в том, что до начала наблюдения более склонны «доживать» состояния, которым свойственно меньшее значение случайного эффекта и, соответственно, меньший уровень риска. Таким образом, индивидуальный эффект оказывается коррелирован с продолжительностью пребывания в состоянии безработицы на момент начала наблюдения.

В параграфе 1.6 описывается подход конкурентных, или соревнующихся, рисков (competing risks) для моделирования разлчиных типов выхода из изучаемого состояния. При таком подходе рассматриваются латентные независимые случайные величины T1, T2,..., TS, описывающие продолжительность пребывания в изучаемом состоянии до выхода в состояния 1, 2,..., S. Минимальное значение этих величин задаёт наблюдаемую длительность: T = min(T1, T2,..., TS). Кроме наблюдаемой длительности исследователю также известно состояние, в которое произошёл выход.

При отсутствии цензурирования или наличии только цензурирования справа задача оценивания модели длительностей Ti сводится к оцениванию модели с одним состоянием выхода. Оценивание модели с различными типами выхода по интервально цензурированным данным затруднительно. Возможные подходы к решению этой задачи разбираются в следующей главе диссертации.

Во второй главе («Оценивание моделей длительности состояний по данным опросов населения») рассматривается задача анализа длительности состояний в случае, когда имеющиеся данные получены в результате нескольких дискретных моментов наблюдения (раундов опроса). В параграфе 2.1 описываются проблемы, связанные с моделированием длительностей по таким данным. Указывается на смещение отбора, возникающее вследствие того, что опросы с большей вероятностью фиксируют продолжительные состояния, в то время как короткие состояния «проскакивают» между опросами, оставаясь незамеченными. Описывается статистический эксперимент, в котором моделировался отбор состояний, происходящий при последовательности опросов. Результаты эксперимента демонстрируют последствия смещения отбора. На приведённом ниже рисунке показаны «истинные» функции риска и дожития, а также их оценки полученные методом Каплана-Мейера по сгенерированным в ходе эксперимента данным:

1,2 0,S(t) h(t) 1 0,S^(t) h^(t) 0,8 0,0,6 0,0,4 0,0,2 0,0 t t 1 3 5 7 9 11 13 15 17 19 21 1 3 5 7 9 11 13 15 17 19 21 Функция дожития S(t) и её оценка S^(t) Функция риска h(t) и её оценка h^(t) Рис. 1. Результаты статистического эксперимента Как показывает график, процедура отбора приводит к искажению временной зависимости и сильному завышению функции дожития.

Параграф 2.2 посвящён анализу длительностей в случае, когда имеются данные всего одного опроса и, соответственно, невозможно отследить смену состояний изучаемых объектов. В диссертационном исследовании эти методы необходимы для сравнения результатов, полученных по данным РМЭЗ с оценками, полученными на основании других данных. Изложенные подходы к решению этой проблемы известны в эконометрике, хотя не нашли широкого применения. Причина малой распространённости заключается, видимо, в том, что в основной части исследований изучается экономика стран, относительно которых имеются более подробные данные, позволяющие применять более точные методы анализа.

Описывается метод синтетической когорты (см. например, Kiefer, Lundberg, Neumann, 1984), который используется в следующей главе для сравнения результатов, полученных по данным РМЭЗ, с оценками, которые можно получить из других источников данных. Метод предполагает неизменность функции дожития для состояний, начавшихся в разные моменты времени, предшествующие опросу. Подробно рассматривается частный случай, в котором приток объектов в изучаемое состояние постоянен. Подобная предпосылка делается нами в дальнейшем при анализе эмпирических данных, так как мы не располагаем информацией о притоке.

В параграфе 2.3 рассматриваются данные последовательности опросов населения. Показывается, что особенностью этих данных является наличие урезания слева, а также интервального цензурирования и цензурирования справа. Цензурирование справа широко расространено в данных о длительности состояний и не представляет особой проблемы для исследователей. Интервальное цензурирование затрудняет оценивание моделей с различными типами выхода. Урезание приводит к смещению отбора, последствия которого рассматриваются в диссертации далее. Учёт урезания и цензурирования приводит к подходу, существенно отличающемуся от использованного в предыдущих исследованиях по данным РМЭЗ – схема такого подхода изображена на рис.2. В его основе лежит тот факт, что хотя длительности состояний, попадающих на моменты опросов населения, подвержены смещению отбора, но вероятность завершения некоторого состояния в промежуток времени между опросами может быть состоятельно оценена. Зная вероятность прекращения можно восстановить закон распределения длительностей.

Данные о времени начала Данные о времени завершения наблюдавшихся при опросах наблюдавшихся при опросах состояний состояний Данные о длительностях наблюдавшихся состояний Модель длительности а) подход, использованный в работах (Grogan, van den Berg, 1999), Карцева (2002) Данные о завершении/не завершении наблюдаемых состояний в период между раундами опроса Модель вероятности завершения состояний между раундами опроса Распределение длительности состояний б) предлагаемый подход.

Рис. 2. Сравнение подходов к анализу длительностей по данным последовательности опросов населения Рассматривается случай наличия двух раундов опроса. На момент первого раунда i-й объект находится в изучаемом состоянии в течение времени ti. Между двумя наблюдениями за i-м объектом проходит время li. За это время состояние может завершиться одним из S возможных типов выхода. Во втором раунде выясняется, прекратилось ли состояние, наблюдавшееся в первом раунде, и, если прекратилось, то какой тип выхода произошёл. Наступивший выход или его отсутствие обозначается величиной Yi, равной нулю, если изучаемое состояние всё ещё продолжается, иначе – номеру наступившего типа выхода (1, …, S). В дальнейшем, в соответствии с кодировкой величины Yi, мы будем называть изучемое состояние «состоянием 0», а тип выхода s = 1,..., S – выходом в состояние s.

Сначала решается задача анализа длительностей в случае одного типа выхода. Особое внимание уделяется оцениванию модели экспоненциальной регрессии, в которой предполагается, что наблюдаемые длительности Ti имеют показательное распределение с параметром i exp(xi ' ), где xi – набор объясняющих переменных в i-м наблюдении, а – вектор коэффициентов при этих переменных. Показывается, что задача оценивания этой модели сводится к задаче оценивания cloglog-регрессии – известной и реализованной в современных статистических пакетах процедуре:

P(Yi 1) 1 exp(exp(xi ' ln li)).

При оценивании cloglog-регрессии в качестве объясняющих величин фигурируют не только переменные xi, но и логарифм времени, прошедшего между двумя раундами опроса ln li, причём коэффициент при этой дополнительной переменной равен единице, так что при оценивании на него должно быть наложено ограничение.

После этого допускается наличие двух типов выхода, для их моделирования используется модель конкурентных рисков (competing risks). То есть, длительность состояния 0 у i-го объекта задаётся с помощью двух латентных величин T1,i и T2,i – длительностей до выхода в состояние 1 и в состояние 2, соответственно. Величина Ti - наблюдаемая длительность состояния 0 - задаётся следующим образом: Ti min(T1,i,T2,i ). Показывается, что в случае показательного распределения величин T1,i и T2,i вероятности выходов имеют следующее выражение:

P(Yi 0) exp((1,i 2,i ) li), 1,i 1,i exp((1,i 2,i )li ) (1,i 2,i ) exp(2,ili ) P(Yi 1) (1 exp(1,ili )) exp(2,ili ), (1,i 2,i ) 2,i 2,i exp((1,i 2,i)li) (1,i 2,i) exp(1,ili ) P(Yi 2) (1 exp(2,ili )) exp(1,ili ), (1,i 2,i ) где 1,i и 2,i – параметры распределения величин T1,i и T2,i.

Показывается, что анализ данных более чем двух опросов сводится к случаю двух опросов искусственным увеличением числа наблюдений.

Хотя функция правдоподобия может быть выписана в случае зависимости параметров 1,i и 2,i от объясняющих переменных, при нахождении оценок параметров возникает проблема множественных максимумов, так что при анализе данных РМЭЗ такой подход использовался только для определения средней продолжительности безработицы и вероятностей выхода в занятость и из рабочей силы.

В параграфе 2.4 даётся альтернативное решение задачи, поставленной в предыдущем параграфе. Рассматривается дискретная модель, в которой весь ненаблюдаемый промежуток между раундами опроса разбивается на конечное число отрезков одинаковой продолжительности (в условную единицу времени).

Различные варианты смены состояний изучаемого объекта, приводящие к разным значениям объясняемой переменной Yi (тип, или состояние, выхода) изображены на рис. 3 (проиллюстрирован случай двух типов выхода):

Рис. 3. Возможные выходы из изучаемого состояния в течение ненаблюдаемого промежутка времени между двумя опросами.

На рис. 3 за ps(j) обозначается вероятность перехода в состояние s в течение одной единицы времени для состояния 0, продлившегося в течение j временных единиц. Предлагается моделировать эти вероятности с помощью логистической модели множественного выбора:

p0(ti |,, xi) S exp(x 'k k (ti |k )) i kexp(xi 's s (ti |s )) ps (ti |,, xi ), s 1,..., S S exp(x 'k k (ti |k )) i k где s - вектор коэффициентов при объясняющих переменных xi, которые описывают направление и степень влияния этих переменных на вероятность выхода в состояние s, - вектор всех коэффициентов модели, s - вектор параметров временной зависимости для вероятности выхода в состояние s, - вектор всех параметров временной завимости, s(t | s) – некоторые функции, задающие форму временной зависимости для вероятности выхода в состояние s.

Такой подход гарантирует нахождение вероятностей в допустимых пределах и даёт возможность интерпретации параметров. Значения элементов вектора exp(s) отражают коэффициенты пропорциональности прироста относительного риска выхода в состояние s при увеличении соответствующих объясняющих переменных на единицу. Под относительным риском понимается величина ps ( j) / p0( j).

Вероятности возможных выходов или продолжения состояния 0 в период между двумя раундами опроса имеют следующее выражение (для краткости опущены параметры модели):

ti li P(Yi 0 | ti,li) p0( j) jti ti li 1 j P(Yi s | ti,li ) ps ( j) p0(k), s 1,..., S jti k ti Отсюда выводится выражение для функции правдоподобия, максимизация которой даёт оценки параметров модели и. Показывается, что введение ненаблюдаемой разнородности в модель приводит к проблеме начальных условий, кроме того случая, когда временная зависимость отсутствует. Выводится функция правдоподобия для простейшей модели с ненаблюдаемой неоднородностью и отсутствием временной зависимости – модели разделённой совокупности (split population model).

Третья глава диссертации («Моделирование длительности безработицы в России») посвящена оцениванию средней продолжительности безработицы по данным РМЭЗ, НОБУС и ОНПЗ и построению эконометрической модели длительности безработицы по данным РМЭЗ.

В параграфе 3.1 даётся обзор исследований, посвящённых проблеме длительности безработицы. Основной акцент делается на использованных различными исследователями методов анализа и полученных результатов в отношении временной зависимости.

В параграфе 3.2 приводится теоретическое основание эконометрических моделей длительности безработицы – модель поиска работы. Также рассматриваются различные причины временной зависимости, в особенности предпосылка о падении резервной заработной платы как причины роста вероятности нахождения работы.

Pages:     | 1 || 3 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»