WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     || 2 | 3 |

На правах рукописи

Кудров Александр Владимирович

ВЕРОЯТНОСТНО-СТАТИСТИЧЕСКИЙ АНАЛИЗ МАКСИМУМОВ ВРЕМЕННЫХ РЯДОВ С ПСЕВДОСТАЦИОНАРНЫМ ТРЕНДОМ

Специальность 08.00.13 – «Математические и инструментальные методы экономики»

Специальность 01.01.05 – «Теория вероятностей и математическая статистика»

Автореферат

диссертации на соискание ученой степени

кандидата физико-математических наук

Москва 2009

Работа выполнена в Государственном университете Высшей Школе Экономики

Научные руководители: доктор физико-математических наук, профессор

Айвазян Сергей Арутюнович;

доктор физико-математических наук, профессор

Питербарг Владимир Ильич

Официальные оппоненты: доктор физико-математических наук

Бродский Борис Ефимович;

доктор физико-математических наук, профессор

Тюрин Юрий Николаевич.

Ведущая организация: Учреждение Российской академии наук Вычислительный центр им. А. А. Дородницына РАН.

Защита состоится «16» марта 2009 г. в 12.00 часов на заседании Диссертационного совета Д 002.013.02 в Учреждении Российской академии наук Центральном экономико-математическом институте РАН по адресу: 117418, г. Москва, Нахимовский проспект, д. 47, ауд. 520.

С диссертацией можно ознакомиться в библиотеке ЦЭМИ РАН.

Автореферат разослан «12» февраля 2009 г.

Ученый секретарь диссертационного совета

кандидат физико-математических наук С.В. Борисова

I. Общая характеристика работы.

Актуальность темы. Задачи статистического оценивания распределения экстремальных значений экспериментальных данных и статистических выборок является одной из важнейших задач теории вероятностей и математической статистики. Поведение экстремальных значений статистической выборки как правило является предметом первоочередного внимания исследователя. При оценивании вероятностей экстремальных природных явлений, таких как наводнения, ураганы, высокие концентрации загрязнений, при моделировании сценариев тяжелых аварий сложных технических устройств, таких как ядерные установки, при оценивании вероятностей больших страховых выплат, ценовых пиков, продолжительности жизни в задачах страхования исследователь в первую очередь интересуется распределением экстремальных значений. Классическая вероятностно-статистическая теория экстремумов родилась в первой половине XX столетия работами Р. Фишера и Л. Типпета (1928) и Б. В. Гнеденко (1943). В основе вероятностной части теории лежит фундаментальная предельная теорема Гнеденко для максимума случайной выборки и метод ее доказательства, базирующийся на теории правильно меняющихся функций. Далее вероятностная теория экстремумов интенсивно развивалась по пути получения уточнений теоремы Гнеденко и ее обобщений на случай зависимых выборок (отрезков временного ряда) и на непрерывное время. Статистическая часть теории развивалась по пути оценивания параметров предельного распределения максимума, и, как следствие, эффективному оцениванию квантилей высокого уровня исходной функции распределения и прогнозу вероятности высокого максимума выборки. Эти задачи решались как в классической постановке, когда наблюдается последовательность независимых одинаково распределенных случайных величин, так и для зависимых наблюдений, что чрезвычайно важно при исследовании экономических и финансовых рядов, динамики природных явлений. В настоящее время имеется большое число методов оценивания вероятностей экстремумов как в классической постановке, когда имеется стандартная выборка независимых одинаково распределенных числовых или векторных наблюдений, так и в случае, когда наблюдается стационарный временной ряд или стационарный случайный процесс. Современное состояние вероятностно-статистической теории в основном описано в монографиях 1

,2. Однако в реальной практике возникают серии наблюдений, которые не могут удовлетворять стандартным условиям однородности выборки. Обычной ситуацией в конкретных статистических исследованиях является пропуск или утеря, по тем или иным причинам, некоторых наблюдений. В случае наблюдения временного ряда с определенной структурой зависимости, это может достаточно сильно повлиять на выбор методики исследования. Теория непараметрического и параметрического оценивания в статистике временных рядов и случайных процессов предлагает соответствующие методики. В то же время развитие соответсвующих методов в статистике экстремумов только начинается. Далее, временные ряды и случайные процессы, которые мы наблюдаем в экономике, финансах, окружающей среде, не всегда можно считать однородными. Как правило, присуствует тренд и сезонные составляющие. Исследуя экстремальные явления, где явно присутствует сезонная составляющая, статистики, как правило, сужают выборку, рассматривая лишь максимальные значения по периодам (дневные, сезонные годичные максимумы). Представляется, что при этом теряется определенная часть информации, поскольку ближайшие к абсолютным сезонным максимумам значения также содержат информацию о распределении максимальных значений. Исследования в этих направлениях находятся в начальной стадии 3

,4

. В первой работе рассмотрено поведение оценки экстремального индекса временного ряда в случае пропущенных наблюдений, во второй рассмотрена стандартная статистическая выборка с добавленным малым почти периодическим трендом. В настоящей работе эти две задачи объединяются в одну - мы исследуем предельное распределение максимума временного ряда с добавленным малым почти периодическим (псевдостационарным) трендом и рассматриваем поведение статистических оценок, основанных на этой модели. Таким образом, в настоящей работе рассмотрены две актуальные задачи статистической теории экстремумов - задача об оценивании вероятности высокого максимума при наличии пропусков в наблюдениях и с учетом тренда типа сезонной составляющей.

Основные цели работы:

• вывод приближенной формулы для распределения максимума отрезка случайного стационарного временного ряда с добавленным трендом и доказательство соответствующей предельной теоремы в условиях слабой зависимости далекоотстоящих экстремумов;

• вывод приближенной формулы для совместного распределения максимума отрезка временного ряда и того же отрезка с пропущенной частью наблюдений;

• конкретизация условий слабой зависимости в данной постановке для случая гауссовской последовательности;

• исследование предложенных приближений при помощи методов статистического моделирования и на реальных данных.

Научная новизна диссертации заключается в разработке методов анализа макимумов прореженных нестационарных временных рядов. Доказаны предельные теоремы о совместном распределении максимума случайной стационарной последовательности с добавленным псевдостационарным трендом и ее прореженной подпоследовательности. Для доказательства введено новое условие перемешивания (слабой зависимости) далеко отстоящих экстремумов. В случае гауссовской последовательности получен окончательный результат о предельном распределении максимума. Все полученные теоретические результаты являются новыми и доказаны автором лично. На основании этих математических результатов предложена новая методика обработки данных об экстремальных значениях временных экономических рядов. Эта методика апробирована на данных, полученных методом статистического моделирования, и на реальных данных – потребление электроэнергии в России и температура в центральной части Англии. Последние данные достаточно часто используются в литературе для апробации новых статистических методов.

Методы исследования. Использован аппарат асимптотического анализа (метод Лапласа), асимптотической теории гауссовских процессов, методы стохастического моделирования, методы статистического анализа экстремумов, такие как методы оценивания квантилей и экстремального индекса. Также использовались типичные для статистического анализа методы визуализации данных (квантильные бумаги и графики Пикандса) с последующим применением методов линейного регрессионного анализа.

Теоретическая и практическая ценность. В работе получены важные аппроксимации для функции распределения максимума стационарной случайной последовательности с добавленным псевдостационарным трендом. Эти аппроксимации позволяют оценивать высокопроцентные квантили распределения и вероятности высоких максимумов с большой точностью. Полученные предельные теоремы представляют собой новый шаг в развитии вероятностно-статистического анализа экстремумов. Численные исследования разработанных на основании полученных аппроксимаций статистических методов показали их хорошую эффективность по сравнению с классическими, применяемыми в моделях с малым трендом.

Апробация результатов исследования. Основные результаты работы докладывались на:

1). Cеминаре "Многомерный статистический анализ и вероятностное моделирование реальных процессов" в ЦЭМИ РАН.

2). VII-ой международной школы-семинара по многомерному статистичесому анализу и эконометрики, пос. Цахкадзор (Республика Армения), 2008 год.

3). Научном семинаре кафедры математической экономики и эконометрики, ГУ ВШЭ.

4). Cеминаре по теории вероятностей университета Черногории, Подгорица.

5). Cеминаре по теории вероятностей на механико-математическом факультете МГУ.

Публикации. По теме диссертации опубликовано 4 научные работы (в том числе 3 основные работы) общим объемом п. л., личный вклад автора п. л., 1 работа опубликована в журнале, рекомендованном ВАК.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 87 наименований, 1 таблицы, 36 рисунков.

II. Основное содержание работы.

Во введении обосновывается актуальность темы и дается краткое содержание работы.

В первой главе рассматривается задача аппроксимации распределения максимума прореженных значений временного ряда

1 2

где – строго стационарная случайная последовательность, где случайная величина имеет функцию распределение, которое предполагается максимум-устойчивым; – тренд, ведущий себя стационарным образом в определенном ниже смысле (например, сезонная составляющая), а – последовательности, для которых выполняется предельное соотношение:

3 4

где невырожденная функция распределения.

Обозначим,,.

В первом параграфе первой главы вводится условие типа Лидбеттера на перемешивание больших значений в модели (1), которое носит название условие. Оно состоит в следующем:

последовательность случайных величин удовлетворяет условию, если найдется семейство чисел, и последовательность натуральных чисел такие, что,, и для любых, и произвольных множеств натуральных чисел таких, что

выполняется неравенство

где супремум берется по всем отображениям из множества натуральных чисел в множество.

Условие гарантирует перемешивание (слабую зависимость) далеко отстоящих больших значений временного ряда (1).

Вводится также дополнительное условие для случайной последовательности – условие :

Это условие гарантирует отсуствие кластеров экстремумов, аналогично случаю независимых, подробности см. в 2.

Пусть имеется случайная последовательность из нулей и единиц, где событие символизирует пропуск наблюдения.

Для введем "выборочные функции распределения" значений тренда для пропущенных и наблюдаемых,

, знак обозначает число элементов множества.

Пусть – неубывающая неотрицательная непрерывная справа ограниченная функция, обозначим, и определим функции

Сформулируем условие псевдостационарности последовательности относительно случайной последовательности :

найдутся функции и такие, что для обоих имеет место сходимость по вероятности

5 6

во всех точках непрерывности соответствующей функции Кроме того, для любого, если, то для всех и существуют конечные пределы

Функции участвуют в формулах для предельного распределения вектора. Заметим, что при выполнении условия лишь не обязательно конечно.

Во втором параграфе первой главы представлены вспомогательные леммы и их доказательства. Среди них – аналог теоремы Лидбеттера для последовательности и двух пороговых уровней.

В третьем параграфе доказан основной результат первой главы – предельная теорема для случайного вектора

при неограниченно растущем.

Теорема 1 Пусть в модели (1), где или. Предположим, что для последовательности случайных величин выполнены условия,.Предполодим далее, что последовательность псевдостационарна относительно случайной последовательности и ограничена сверху (). Пусть последовательности и независимы. Тогда,

если или, то для всех,

7 8

если, то для всех,

9 10

Во второй главе исследуется ассимптотическое поведение совместного распределения максимума гауссовской последовательности и максимума ее же с детерминированным прореживанием в модели

где – гауссовская стационарная последовательность с нулевым средним и единичной дисперсией,, – псевдостаный тренд,.

Обозначим

Отметим, что последовательности являются нормирующими последовательности в предельной теореме для максимума последовательности независимых гауссовских случайных величин (2), см. 2,5.

Прореживание задается с помощью множества индексов непрореженных наблюдений, которое является подмножеством,,, – целая часть.

В первом параграфе второй главы определяется псевдостационарная последовательность относительно детерминированного прореживания: последовательность, где и при, называется псевдостационарной с функцией распределения, если для любого предел

существует. Через обозначено число элементов этого множества

Отметим, что – не обязательно вероятностная функция распределения, то есть, не обязательно равно

Во втором параграфе доказываются вспомогательные леммы, а также дана формулировка обобщенного неравенства Бермана, введенного и доказанного В. И. Питербаргом6, которое состоит в следующем:

Pages:     || 2 | 3 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»