WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


На правах рукописи

ГРИБКОВА Надежда Викторовна

АППРОКСИМАЦИЯ ВТОРОГО ПОРЯДКА И БУТСТРЕП ДЛЯ УСЕЧЕННЫХ СУММ И L-СТАТИСТИК

01.01.05 теория вероятностей и математическая статистика

АВТОРЕФЕРАТ

диссертации на соискание ученой степени доктора физико-математических наук

Санкт-Петербург 2011

Работа выполнена на кафедре "Прикладная математика" ФГОУ ВПО "Петербургский государственный университет путей сообщения".

Научный консультант: доктор физико-математических наук, профессор Никитин Яков Юрьевич

Официальные оппоненты: доктор физико-математических наук, профессор Бенинг Владимир Евгеньевич доктор физико-математических наук, профессор Ермаков Михаил Сергеевич доктор физико-математических наук, профессор Розовский Леонид Викторович

Ведущая организация: Математический институт им. В.А.Стеклова Российской академии наук (МИРАН).

Защита состоится " " 2011 года в часов на заседании диссертационного совета Д 002.202.01 в Санкт-Петербургском отделении Математического института им. В.А.Стеклова РАН по адресу 191023, СанктПетербург, наб. р. Фонтанки, д. 27, к. 311.

С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского отделения Математического института им. В.А.Стеклова РАН по адресу 191023, Санкт-Петербург, наб. р. Фонтанки, д. 27.

Автореферат разослан " " 2011 года.

Ученый секретарь диссертационного совета Д 002.202.доктор физико-математических наук А.Ю.Зайцев

Общая характеристика работы

В диссертации исследуется асимптотика второго порядка распределений усеченных сумм, L-статистик и их бутстреп-версий, изучаются свойства порядковых статистик, устанавливаются новые формулы, соотношения.



Актуальность темы. L-статистики – это краткое название линейных функций членов вариационного ряда. Впервые использование взвешенных сумм порядковых статистик в качестве оценок параметров распределений было предложено и обосновано, согласно историческому очерку С.Стиглера1, П.Дэниеллом2 в 1920 году.

Хорошо известно, что L-статистики и, в частности, усеченные суммы элементов вариационного ряда играют ключевую роль в теории робастных статистических выводов (см., например, книгу Р.Маронна и др.3 и более ранние монографии П.Хьюбера4, Ф.Хампеля и др.5). Изучение асимптотических свойств L-статистик на протяжении последних 50–60-ти лет привлекало внимание многих известных ученых, таких, как Дж.Тьюки, П.Бикел, С.Стиглер, Г.Шорак, Д.Мэйсон, В.ван Цвет, П.Хьюбер, П.Холл и др.

Значительный интерес к L-статистикам, был обусловлен, конечно, в первую очередь приложениями, но существовала и другая немаловажная причина чисто теоретического интереса к ним – это своеобразная, связанная с упорядочением природа зависимости слагаемых, образующих L-статистику, которая делает изучение ее асимптотики довольно трудным. Необходимость развития асимптотической теории L-статистик начиная с 70-х годов XX-го века стимулировала открытие в этой области новых подходов и методов.

В частности, в работе П.Бикела6 было впервые упомянуто о возможности аппроксимации L-статистик U-статистиками второго порядка. Впервые этот подход был успешно применен Р.Хелмерсом7 для получения неравенств типа Берри – Эссеена для L-статистик. Асимптотическая теория U-статистик была существенно продвинута в 80–90-е годы, что позволило эффективно использовать метод U-статистической аппроксимации для исследования асимптотических свойств симметричных статистик.

Как L-статистики, так и U-статистики являются симметричными функциями элементов выборки, то есть принадлежат классу так называемых Stigler, S.M., Simon Newcomb, Percy Daniell and the history of robust estimation 1885-1920 // J. Amer.

Statist. Assoc., 1973, v. 68, no.344, p. 872–879.

Daniell, P.J. Observations weighted according to order // American Journal of Mathematics, 1920, v. 42, p. 222–236.

Maronna, R., Martin, R. D. and Yohai, V. Robust Statistics – Theory and Methods, Wiley, New York, 2006.

Хьюбер, П. Робастность в статистике, М.: Мир, 1984.

Хампель Ф.Р., Рончетти Э.М., Рассеу П.Д., Штаэль В.A. Робастность в статистике. Подход на основе функций влияния, М.: Мир, 1989.

Bickel, P.J., Edgeworth expansions in nonparametric statistics // Ann. Statist., 1974, v. 2, p. 1–20.

Helmers, R., A Berry – Esseen theorem for linear combinations of order statistics // Ann. Probab., 1981, v. 9, p. 342–347.

симметричных статистик. В диссертации свойства усеченных сумм и Lстатистик анализируются, в том числе, в контексте теории симметричных статистик. Часть результатов диссертации связана с работами В. ван Цвета8, Х.Путтера и В. ван Цвета9, В.Бенткуса и др.10.

Влияние крайних членов вариационного ряда на асимптотику сумм исследовалось многими авторами, начиная с работ Д.Дарлинга (1952), Д.З.Арова и А.А.Боброва (1960), В.А.Егорова и В.Б.Невзорова (1974, 1975), П.Холла (1978), можно упомянуть также более поздние работы Ш.Чёргё и др.

(1986, 1988, 2001), Л.Пенга (2001), Р.Кулика (2008). В многомерной ситуации (при упорядочивании по норме) этот вопрос изучался Ю.А.Давыдовым и А.В.Нагаевым (2004), в контексте бутстрепа влияние крайних членов изучали П.Деовельс, Д.Мэйсон и Г.Шорак (1993), П.Бикел, Ф.Гётце и В.ван Цвет (1997). Если вопросы, относящиеся к асимптотике первого порядка усеченных сумм (то есть класс возможных предельных законов, условия сходимости к ним, необходимые и достаточные условия асимптотической нормальности и т.д.) изучены достаточно полно в работах Ш.Чёргё и др.11, П.Гриффина и В.Пруитта12 и других авторов, то до недавнего времени имелось совсем мало работ, посвященных уточнениям. Фактически нам известна только одна статья13, в которой получены некоторые оценки скорости сходимости к нормальному закону для усеченных сумм в общем случае, когда доля отсекаемых по краям наблюдений является последовательностью, которая может, в частности, стремиться к 0 при n , где n – объем исходной выборки (и эти оценки не оптимальны), и совсем не существовало работ, посвященных получению разложений типа Эджворта в этой общей ситуации.

Другое направление исследований связано с получением разложений типа Эджворта для усеченного среднего – хорошо известной оценки параметра сдвига – и для его бутстреп-версии. До недавнего времени явный вид формул разложения Эджворта для этой статистики не был известен даже в случае стандартной неслучайной нормировки, тем более – в случае стьюдентизации. В статье П.Холла и А.Падманабхана14 авторы пишут о том, van Zwet, W.R., A Berry – Esseen bound for symmetric statistics // Z. Wahrsch. Verw. Gebiete, 1984, v. 66, p. 425–440.

Putter, H., van Zwet, W.R., Empirical Edgeworth expansions for symmetric statistics // Ann. Statist., 1998, v. 26, p. 1540–1569.

Bentkus, V., Gtze, F., van Zwet, W.R., An Edgeworth expansion for symmetric statistics // Ann. Statist., 1997, v. 25, p. 851–896.

Csrg, S., Haeusler, E., Mason, D.M., The asymptotic distribution of trimmed sums // Ann. Probab., 1988, v. 16, p. 672–699.

Griffin, P.S., Pruitt, W.E., Asymptotic normality and subsequential limits of trimmed sums // Ann. Probab., 1989, v. 17, p. 1186–1219.

Егоров, В.А., Невзоров, В.Б., Некоторые оценки скорости сходимости сумм порядковых статистик к нормальному закону // Зап. научн. семинаров ЛОМИ, 1974, т. 41, с. 105–128.

Hall, P., Padmanabhan, A.R., On the bootstrap and the trimmed mean // J. Multivariate Analysis, 1992, v. 41, p. 132–153.

что в случае (стьюдентизованного) усеченного среднего получение разложения Эджворта в явном виде очень сложно, и предлагают заменить аналитические трудности бутстреп-моделированием. В данной работе мы все же получаем явный вид формул асимптотических разложений для этой статистики и ее стьюдентизованной версии.

Бутстреп-метод, предложенный Б.Эфроном15 в 1979 году, получил широкое распространение в последние три десятилетия. Этот метод предполагает интенсивное компьютерное моделирование и демонстрирует результаты, сопоставимые с теми, что дают классические процедуры, а в ряде случаев превосходит их в эффективности. Свойство корректности второго порядка, означающее тот факт, что бутстреп-распределение статистики точнее приближает ее истинное распределение, чем предельный закон, если таковой существует, вызвало огромный интерес исследователей в конце 80-х и 90-е годы XX-го века и породило шквал публикаций на эту тему. Доказательство корректности второго порядка, как правило, опирается на разложения Эджворта (см., например, монографию П.Холла16), поэтому тематика, связанная с получением асимптотических разложений типа Эджворта, приобрела в последние годы новое звучание и актуальность.

Еще один круг проблем, рассмотренных в диссертации, касается получения представлений типа Бахадура – Кифера, означающих связь квантильного и эмпирического процессов. Впервые такое представление для выборочной квантили было открыто Р.Бахадуром (1966), результат Бахадура был уточнен Дж.Кифером в серии работ (1967–1970). Получение представлений типа Бахадура – Кифера17 является задачей теории эмпирических процессов18, которая имеет фундаментальное значение для математической статистики и продолжает интенсивно развиваться.

Получаемые в диссертации представления типа Бахадура – Кифера используются в данной работе для конструирования U-статистических аппроксимаций для усеченных сумм.

Цель работы. Основная цель работы – исследование асимптотических свойств распределений усеченных сумм случайных величин, L-статистик и их бутстреп-версий: оценивание скорости сходимости к нормальному закону, нахождение асимптотических разложений, доказательство корректности бутстреп-аппроксимаций. Особый интерес для нас представляет случай слегка усеченной суммы, когда доля отсекаемых по краям элементов вариационного ряда стремится к нулю при стремлении объема выборки к бесконечности, и случай усеченного среднего, играющего важную роль в теории робастной Efron, B., Tibshirani, R.J., An Introduction to the Bootstrap, Chapman and Hall, N.Y., 1993.

Hall, P., The Bootstrap and Edgeworth Expansion, Springer-Verlag, New York, 1992.

Deheuvels, P., Mason, D.M., Bahadur – Kiefer – type processes // Ann. Probab., v. 18, 1990, p. 669–697.

Shorack, G.R., Wellner, J.A., Empirical Processes with Applications to Statistics, Springer, 2009.

статистики. Целью работы является также дальнейшее изучение свойств квантильных процессов, получение для них новых формул, оценок и представлений.

Общая методика исследования. Для доказательства основных результатов по аппроксимации распределений нормированных и стьюдентизованных усеченных сумм мы конструируем стохастические U-статистические аппроксимации, оцениваем остаточные члены этих аппроксимаций, применяем результаты из теории U-статистик и теории симметричных статистик, свойства правильно меняющихся функций. При изучении случайных нормировок (стьюдентизации) мы строим также аппроксимации оценок асимптотической дисперсии суммами независимых случайных величин.

Существенную роль при построении этих U-статистических аппроксимаций играет уинсоризация исходных случайных величин и специальные представления типа Бахадура – Кифера, справедливость которых мы доказываем в качестве вспомогательных результатов. При получении эмпирических асимптотических разложений мы используем ядерные оценки плотности, оцениваем их точность. В части, касающейся корректности бутстреп-метода, применяются факты и результаты из теории бутстрепа, методы гармонического анализа, оценки для моментов порядковых статистик.

Для доказательства результатов типа Бахадура – Кифера мы используем свойства порядковых статистик, экспоненциальные неравенства Бернштейна, Хёфдинга и Петрова.

Научная новизна и основные результаты. Все результаты, представленные в диссертации, являются новыми, к наиболее существенным из них относятся следующие.

1. Найден новый подход к исследованию асимптотики распределений нормированных и стьюдентизованных усеченных сумм независимых одинаково распределенных случайных величин. Этот подход основан на оригинальной U-статистической стохастической аппроксимации, для построения которой мы используем уинсоризацию исходных случайных величин и специальные представления типа Бахадура – Кифера. Предлагаемая нами аппроксимация отличается от приближений, использующих линейную и квадратичную группы слагаемых разложения Хёфдинга, и имеет по сравнению с ними более простую и удобную для работы структуру.

2. Впервые получены асимптотические разложения типа Эджворта для нормированных и стьюдентизованных усеченных сумм, причем рассмотрена общая ситуация, когда доли усечения n = kn/n и n = mn/n (n – число наблюдений, kn, mn – номера порядковых статистик, по которым происходит усечение, min(kn, mn) , n ) являются последовательностями, которые могут стремиться к нулю при n (слабое усечение). При этом предполагается, что исходное распределение не имеет конечной дисперсии.

3. Получены оптимальные по порядку оценки скорости сходимости в центральной предельной теореме для последовательностей нормированных усеченных сумм. При этом впервые доказано, что в случае, когда исходное распределение F не имеет конечного второго момента, оптимальной оценкой -1/скорости сходимости к нормальному закону является оценка порядка rn, где rn = min(kn, mn).

4. Исследован вопрос о состоятельности бутстреп-аппроксимации для усеченного среднего. Впервые доказано, что модифицированный m n бутстреп (m – объем бутстреп-выборки, m/n 0, m ) без каких-либо условий обеспечивает состоятельную оценку распределения нормированного усеченного среднего. В то же время классический бутстреп Эфрона (m = n) и нормальная аппроксимация не состоятельны, если исходное распределение имеет промежутки (интервалы ненулевой длины, имеющие нулевую F -меру), граничащие с квантилями, в которых происходит усечение.

5. Найдены асимптотические разложения типа Эджворта для бутстрепверсий нормированного (и стьюдентизованного) усеченного среднего. С помощью полученных разложений доказана корректность бутстрепа второго порядка, то есть тот факт, что бутстреп-аппроксимация для усеченного среднего при определенных условиях на порядок точнее, чем нормальная аппроксимация.





6. Получены новые специальные представления типа Бахадура – Кифера для последовательностей выборочных квантилей уровня n (0, 1), в том числе, для "хвостовых", когда n может стремиться к 0 или к 1. Найдены не встречавшиеся ранее представления для сумм порядковых статистик, находящихся между n-й выборочной и соответствующей генеральной квантилями. Впервые доказана справедливость представлений Бахадура – Кифера для квантилей бутстреп-выборки.

7. Получены новые, оптимальные по порядку оценки типа Берри – Эссеена для L-статистик при слабых моментных ограничениях и для усеченных L-статистик. Исследован вопрос о состоятельности бутстреп-аппроксимации распределений нормированных L- статистик.

Теоретическая и практическая значимость. Диссертация носит в основном теоретический характер, хотя некоторые ее результаты, особенно относящиеся к бутстреп-методу, применимы и в прикладной статистике.

Методы и подходы, разработанные в диссертации, могут быть использованы для решения близких задач теории U- и L-статистик, в робастной статистике.

Апробация. Результаты диссертации докладывались на следующих симпозиумах и конференциях:

14-15, 29-й Международные семинары по проблемам устойчивости стохастических моделей, Суздаль, 1991 г., Пермь, 1992 г., Светлогорск, 2011 г.

Международная конференция "Асимптотические методы в теории вероятностей и математической статистике", С.-Петербург, 1998.

3-й Санкт-Петербургский международный симпозиум по моделированию, С.-Петербург, 1998.

8, 9, 10-я Вильнюсские международные конференции по теории вероятностей и математической статистике, Вильнюс, Литва, 2002, 2006, 2010.

24-я Европейская конференция статистиков, Прага, 2002.

XI, XII, XIV, XVI-я Всероссийские школы-коллоквиумы по стохастическим методам, Сочи, 2004, 2005, 2007 г., Санкт-Петербург, 2009 г.

VI, VII, XI-й Всероссийские симпозиумы по прикладной и промышленной математике, Санкт-Петербург, 2005 г., Кисловодск, 2006, Сочи, 2010 г.

22-я Международная северная конференция по математической статистике (NORDSTAT-2008), Вильнюс, Литва, 2008.

По результатам диссертации были сделаны доклады: на семинаре по предельным теоремам теории вероятностей в 1998 г. (руковод. – проф.

В.В.Петров); на семинаре отдела PNA (Probability, Networks and Algorithms) математического центра CWI в Амстердаме, Нидерланды, в 2002 г. (руковод. – Р.Хелмерс); на городском семинаре по теории вероятностей и математической статистике в 2005, 2008, 2010 годах (руковод. – акад. И.А.Ибрагимов).

Соавтором Р.Хелмерсом были сделаны доклады в университетах Амстердама (2003), Гонконга (2004, 2007), Тель-Авива (2006), Сиднея (2008).

Публикации. Список работ по теме диссертации приведен в конце реферата.

Основные результаты диссертации опубликованы в статьях [1]–[11] в журналах и изданиях, рекомендованных ВАК (перевод статьи [5] опубликован в журнале J.Math.Sci, входящем в систему цитирования SCOPUS, статья [6] опубликована в книге, изданной VSP, Utrecht, статьи [8]–[9] опубликованы в журнале Mathematical Methods of Statistics, входящем в систему SpringerLink). Работы [12]–[17] – это статьи, опубликованные в трудах конференций и препринты.

Основные результаты диссертации опубликованы также в сборниках тезисов упомянутых выше конференций.

Работы [8]–[11] и [14] выполнены в соавторстве с Р.Хелмерсом (Нидерланды). В работе [8] соавтору принадлежит постановка задачи и идея использования ядерных оценок плотности в теореме 2.3, доказательство всех результатов принадлежит автору, в работе [9] соавтором предложено доказать теорему 2.7, касающуюся метода бутстреп-экстраполяции Бикела – Яхавы, в работе [10] – предложение о включении раздела 3 (Некоторые применения), в [11] – улучшение формулировок, [14] – это статья обзорного характера по полученным в работах [8]–[9] результатам.

Структура и объем диссертации. Диссертация состоит из введения, семи глав, разделенных на параграфы, и списка литературы. Библиография содержит 181 наименование. Общий объем диссертации составляет 2страницу.

Обзор содержания работы Во введении дается обзор литературы, относящейся к теме диссертации, обсуждаются задачи и методы исследования, описывается структура и содержание работы, вводятся основные обозначения.

В главе 1 мы изучаем асимптотические свойстра распределений усеченных сумм вида:

n kn n Sn = Xi - Xi:n - Xi:n, (1) i=1 i=1 i=n-mn+где kn, mn – целые, 0 kn < n - mn n, и min(kn, mn) при n , Xi:n – порядковые статистики, соответствующие выборке X1,..., Xn независимых одинаково распределенных случайных величин (с.в.) с функцией распределения (ф.р.) F. Мы рассматриваем, в том числе, и случай слегка усеченных сумм, когда max(kn, mn)/n 0, n , при этом в большинстве результатов предполагается, что распределение F имеет тяжелые хвосты, т.е.

что EX1 = . В этой главе мы получаем оценки типа Берри – Эссеена -1/порядка O rn, rn = min(kn, mn), для нормальной аппроксимации Sn и доказываем, что этот порядок является неулучшаемым без предположения конечности EX1. Кроме того, мы получаем разложения типа Эджворта для (слегка) усеченных сумм и их стьюдентизованных версий.

-Введем непрерывную слева инверсию F, определенную равенством -1 -1 -F (u) = inf{x : F (x) u}, 0 < u 1, F (0) = F (0+), и пусть Fn и -Fn обозначают эмпирическую ф.р. и ее инверсию соответственно. Определим -квантиль = F () распределения F уровня 0 < < 1.

Положим n = kn/n, n = mn/n, и пусть Wi(n), i = 1,..., n, обозначают Xi, уинсоризованные вне (, 1- ], то есть Wi(n) = (Xi 1- ), где n n n n s t = min(s, t), s t = max(s, t).

-Определим квантильную функцию Qn(u) := (F (u) 1- ) и два n n первых кумулянта Wi(n):

1 µW = Qn(u) du, W = (Qn(u) - µW )2 du. (2) (n) (n) (n) 0 Положим a1 = lim infn n, a2 = lim supn n, b1 = lim infn (1-n), b2 = lim supn (1 - n) и предположим, что a2 < b1.

Пусть f = F обозначает плотность исходного распределения, если она существует. Определим две последовательности:

1 n 1 n q = , q = . (3) n n n W f( ) n W f(1- ) (n) n (n) n Величины q, q определены при всех достаточно больших n, если выполнено n n следующее условие:

-[A1]. Инверсия F дифференцируема в U = Ua Ub, где Ua, Ub (0, 1) – два открытых множества, причем (0, ), если 0 = a1 = a2, (1 -, 1), если b1 = b2 = 1, Ua (0, a2], если 0 = a1 < a2, Ub [b1, 1), если b1 < b2 = 1, [a1, a2], если 0 < a1 a2, [b1, b2], если b1 b2 < 1, (4) (с некоторым 0 < 1 в случаях, соответствующих первой строке (4)).

Пусть h – вещественнозначная функция, определенная на множестве -F (U) (см. (4)). Возьмем произвольное 0 < B < и для всех достаточно больших n определим величины n log kn -1 -,h(B) = sup h F n + t - h F n, n n |t|B n log mn -1 -1-,h(B) = sup h F 1 - n + t - h F 1 - n, (5) n n |t|B -1 -где h F (u) = h F (u).

В формулировках результатов используются следующие предположения.

[A2]. q q - 0, при n .

n n [A3] Для любого 0 < B < n n ,f(x)(B) - 0, 1-, (B) - 0, n .

1 n n f(x) n W n W (n) (n) Положим Tn = n-1Sn и определим ф.р. нормированной с.в Tn : FT (x) = n 1-n --P W n1/2 Tn - µ(n, 1 - n) x, с µ(n, 1 - n) = F (s) d s n (n) (генеральное усеченное среднее). Прежде всего мы доказываем, что в условиях [A1]–[A3] выполнены необходимые и достаточные условия асимптотической нормальности Tn (Ш.Чёргё и др.(1988)), поэтому supxR |FT (x) - (x)| = n o(1), n , где – стандартная нормальная ф.р. Положим rn = kn mn.

Следующая теорема дает оценку скорости сходимости распределения нормированного усеченного среднего Tn к стандартному нормальному закону.

Теорема 1.1 Предположим, что выполнены условия [A1]–[A3]. Тогда A -c sup |FT (x) - (x)| 1,n + 2,n + 3,n + 4,n + C rn, (6) n n xR E |W1(n)|3 1 n n 1,n =, 2,n = +, W W f( ) f(1- ) (n) n n (n) 5/3 5/n n 3,n = n 1/3 + n 1/3, f( )W f(1- )W n (n) n (n) 1 4,n = n log kn , (B) + n log mn 1-, (B), n n f(x) f(x) W (n) для любого c > 0, где A, B, C > 0 – постоянные, зависящие только от c.

Для того, чтобы получить более простые по форме оценки, чем (6), имеющие -1/порядок rn, нам требуются несколько более строгие ограничения.

[A 2]. Предположим, что 3/2 3/n n lim sup < , lim sup < .

W f( ) W f(1- ) n n (n) n (n) n [A 3]. Для любого B > 1 1 , (B) = O, 1-, (B) = O, n n f(x) f(x) f( ) log kn f(1- ) log mn n n Теперь можно сформулировать результат, дающий оценку в более простой форме, чем в теореме 1.1. Пусть, как и прежде, rn = kn mn.

Теорема 1.2 Предположим, что условия [A1], [A 2] и [A 3] выполнены. Тогда -1/sup |FT (x) - (x)| C rn, (7) n xR где C – некоторая положительная постоянная, не зависящая от n.

Оптимальность оценки (7) (в случае бесконечной дисперсии у F и в отсутствие симметрии) следует из результатов по разложениям типа Эджворта.

Следующее утверждение касается слегка усеченного среднего в случае, когда EX1 < , т.е. в случае легких хвостов.

Теорема 1.3 Предположим, что EX1 < , n n 0, n , и что выполнены условия [A1], [A 2]. Кроме того, предположим, что для любого B > 1 0 , (B) = o (f( ) log kn)-1 и 1-, (B) = o (f(1- ) log mn)-1, n n n n f(x) f(x) n . Тогда -1/sup |FT (x) - (x)| = o(rn ). (8) n xR Далее в главе 1 приведены несколько следствий теорем 1.1 – 1.3. Первое следствие касается случая слегка усеченной суммы, когда ф.р. F принадлежит области притяжения устойчивого закона.

Обозначим RV класс регулярно меняющихся на бесконечности функций:

g RV g(x) = |x| L(x), для |x| > x0, с некоторыми x0 > 0, R, и L(x) – положительной медленно меняющейся на бесконечности функцией.

Нам понадобится следующее условие регулярности плотности f на хвостах:

[R]. Предположим, что f RV, где = -(1 + ), > 0, и что x |f(x + x) - f(x)| = O f(x), x когда x = o(|x|), при |x| .

Следующее утверждение справедливо для слегка усеченных сумм в случае правильно меняющейся на бесконечности плотности:

Следствие 1.1 Предположим, что n n 0 при n , условие [A1] выполнено с некоторым > 0, и плотность f удовлетворяет условию [R] с -0 < 2 на множестве F (U). Тогда:

(i) оценка (7) справедлива;

(ii) кроме того, если = 2 и 2 < , то оценка (8) также имеет место.

Второе следствие касается классического случая усечения на уровне центральных порядковых статистик.

Следствие 1.2 Предположим, что 0 < a1 < b2 < 1 и что выполняется условие [A1]. Кроме того, предположим, что плотность f удовлетворяет -условию Гёльдера порядка d > 0 на множествах F (Uc), c = a, b. Тогда C sup |FT (x) - (x)| , n n xR где C > 0 – не зависящая от n постоянная.

Следующая группа результатов главы 1 касается разложений типа Эджворта. Определим 3,W = (Qn(u) - µW )3 du, (n) (n) где, как прежде, Qn(u), µW – квантильная функция и среднее с.в. Wi(n), и (n) положим µW - 2 µW - 1- (n) n (n) n 2 2,W = -n + n.

(n) f( ) f(1- ) n n Определим две последовательности вещественных чисел 3,W 2,W (n) (n) 1 =, 2 = (n) (n) 3 W W (n) (n) В главе 1 доказывается, что в условиях [A1]–[A3] для ф.р. FT имеет место n разложение типа Эджворта, мы находим для него явную формулу:

(x) bn Gn(x) = (x) - 1 + 32 (x2 - 1) + 6 n, (9) (n) (n) 6 n W (n) n(1-n) 1 n где = , bn = - (1-n) +, а bn/W имеет смысл (n) 2 n f(n) f(1-n) асимптотического смещения (несмотря на отсутствие каких-либо моментных предположений).

-1/Чтобы доказать неулучшаемость в общем случае порядка O(rn ) оценки оценки скорости сходимости к нормальному закону распределения усеченной суммы, мы рассматриваем ситуацию, когда max(n, n) 0, существует плотность f = F при всех достаточно больших |x|, и эта плотность правильно изменяется на бесконечности с показателем = -(1 + ), где 0 < < 2.

Предполагая также отсутствие симметрии (иначе Gn(x) = (x)) и используя свойства Караматы для урезанных моментов, мы находим, что |Gn(x)-(x)| -1/kn + m-1/2.

n Следующая теорема утверждает справедливость асимптотического разложения для распределения нормированной усеченной суммы.

Теорема 1.4 Предположим, что условия [A1]–[A3] выполнены. Тогда C1 Csup |FT (x) - Gn(x)| 1,n + 2,n + 3,n + 4,n+ n n n3/xR C-c + 5,n + 6,n + C4 rn, (10) n1/для любого c > 0 и некоторых постоянных Ci > 0, i = 1,..., 4, не зависящих 2+ 2+ E(W1(n))2 1 2 от n, где 1,n =, 2,n = n W(n)f(n) + n W(n)f(1-n) (с W (n) произвольным > 0), 3,n – то же, что и 2,n, но с = 0, кроме того 4,n = (log kn)5/4(n)3/4 (log mn)5/4(n)3/log kn 1 +, 5,n = n W(n) , (B) + n log mn 1-, (B), f(n)W(n) f(1-n)W(n) n W(n) n f(x) f(x) где B > 0 есть некоторая постоянная, зависящая только от c. Наконец, (1(n)+32(n)) bn 6,n =. Постоянные Ci в правой части (10) зависят только от W(n) c и.

Для формулировки дальнейших результатов потребуется еще одно предположение:

[L]. Существует 0 < s 1 такое, что lim supn ns/rn < .

Теорема 1.5 Предположим, что n n 0, n , условия [A1] и [L] выполнены и плотность исходного распределения f удовлетворяет условию [R] с 0 < < 2. Тогда (log kn)5/4 (log mn)5/sup |FT (x) - Gn(x)| = O +, n . (11) n 3/xR kn m3/n Далее в главе 1 мы получаем разложения типа Эджворта для стьюдентизованных (слегка) усеченных сумм. Определим эмпиричес-кую квантильную функцию Qn(u) = Xk :n Fn (u) Xn-m :n, и оценки n n 1 подстановки µW = Qn(u) du, W = (Qn(u) - µW )2 du для µW (n) (n) (n) 0 (n) и W соответственно. Определим ф.р. стьюдентизованной усеченной суммы (n) n(Tn-µ(n,1-n)) FT,S(x) = P x.

n W(n) Мы доказываем, что разложение Эджворта для FT,S(x) дается формулой n (x) bn Hn(x) = (x) + (2x2 + 1)1 + 3(x2 + 1)2 - 6 n, (12) (n) (n) 6 n W (n) где bn то же, что в (9). Определим величину n,S = i(n), (13) i=где 3/2 3/n log kn 3/4 n log mn 3/1(n) = +, W f( ) kn W f(1- ) mn (n) n (n) n 2 n n 2 2(n) = B log kn q + 2 (B) + log mn q + 2 (B), 1 n 2 n f(x) nW n,f(x) nW 1-n, (n) (n) где B > 0 – некоторая постоянная, 3/2 3/n log kn 1/2 n log mn 1/1 3(n) = , (B) + 1-, (B), n n f(x) f(x) W kn W mn (n) (n) 3/2 3/1 1 1 n log kn n log mn 4(n) = + +, n mn f( )W f(1- )W kn n (n) n (n) 2 log kn + log mn1- log kn log mn n n 5(n) = = O +.

nW kn mn (n) Величина n,S определяет порядок остаточного члена в стохастической W(n) аппроксимации разности - 1 суммой независимых с.в. (см. лемму 1.2).

W (n) Следующий результат утверждает справедливость разложения Эджворта для стьюдентизованной усеченной (в том числе, для слегка усеченной) суммы.

Теорема 1.6 Предположим, что условия [A1], [A2] и [A3] выполнены. Тогда sup |FT,S(x) - Hn(x)| C(n + n,S), (14) n xR где C > 0 – некоторая постоянная, не зависящая от n, n – величина, стоящая в правой части (10) (см. теорему 1.4) и n,S = n,S + i,S(n), i=1 где n,S то же, что в (13); 1,S(n) = log kn(1 q + )+log mn( q + );

kn mn n mn kn n 3 2,S(n) = (log kn)2 q + (log mn)2 q + log kn log mnq q (q + q ).

n n n n n n Теперь сформулируем результат типа Эджворта для стьюдентизованной статистики Tn, параллельный теореме 1.5.

Теорема 1.7 Предположим, что n n 0, n , условия [A1] и [L] выполнены, и плотность удовлетворяет условию [R] с 0 < < 2. Тогда (log kn)5/4 (log mn)5/sup |FT,S(x) - Hn(x)| = O +, n . (15) n 3/xR kn m3/n В завершение обзора содержания главы 1 опишем построение Uстатистической аппроксимации для с.в. Tn и для оценки подстановки ее асимптотической дисперсии, которые играют ключевую роль в -доказательствах. Положим 1(Xi) = 1{X }, где = F (), 0 < < 1, i и 1A – индикатор события A. Определим U-статистику степени 2 с ядром, зависящим от n:

n Ln + Un = Ln,i + Un,(i,j), (16) i=1 1 i < j n 1 где Ln,i = Wi(n) - µW и Un,(i,j) = -f(1 1 (Xi)-n 1 (Xj)(n) n n ) n n n n n + 11- (Xi) - (1 - n) 11- (Xj) - (1 - n).

n n f(1-n) Заметим, что ELn,i = 0, i = 1,..., n, EUn,(i,j) = 0, E Ln,iUn,(i,j) = 0, i, j = 1,..., n (i = j ), поэтому, как и в случае разложения Хёфдинга, приближение посредством (16) – это аппроксимация суммой некоррелированных слагаемых.

Следующая лемма дает оценку точности аппроксимации Tn суммой Uстатистики вида (16) и смещения bn (где bn такое же, как в (9)).

Лемма 1.1 Предположим, что условия [A1] и [A2] выполнены. Тогда для любого c > -c P n1/2 Tn - µ(n, 1 - n) - (Ln + Un + bn) > n = O(rn ), (17) 1/kn где n = A(,n +,n), ,n = n log 1 log kn +, (B), ,n = n f(n) kn n f(x) 1/mn 1 log mn n log +1-, (B) и A, B > 0 – постоянные, зависящие n f(1-n) mn n f(x) только от c.

Ключевой леммой при доказательстве результатов для стьюдентизованного 2 варианта Tn является утверждение об аппроксимации (W /W - 1) суммой (n) (n) независимых одинаково распределенных случайных величин.

Лемма 1.2 Предположим, что условия [A1] и [A2] выполнены. Тогда для любого c > W Vn (n) -c P - 1 - > An,S = O(rn ), (18) 2 W W (n) (n) где n,S – величина, определенная в теореме 1.6, Vn = Vn,1 + Vn,2, n N - nn n Vn,1 = 2 µW - (n) n f( ) n n n N1- - (1 - n)n n + 2 µW - 1- (n) n f(1- ) n n и n Vn,2 = Wi(n) - µW 2 - W, (n) (n) n i=A, B > 0 (B – константа, появляющаяся в i(n), i = 2, 3) – некоторые Vn постоянные, не зависящие от n. Кроме того, EVn = 0 и E = W (n) E(W1(n))4 2 O + q + q.

n W n n (n) В главе 2 доказывается, что m n-бутстреп-аппроксимация (n – объем исходной выборки, m – объем бутстреп-выборки; m/n 0 при m ) распределения усеченного среднего является состоятельной без каких-либо предположений относительно исходного распределения F. В то же время классический бутстреп Эфрона (случай m = n) и нормальная аппроксимация не состоятельны, если имеются промежутки ненулевой длины нулевой F -меры такие, что их границами являются квантили, в которых происходит усечение.

Рассматриваются два варианта усеченного среднего:

n-[n] 1- 1 -Tn = Xi:n, Tn = Fn (u) du, (19) (1) (2) n - [n] - [n] 1 - - i=[n]+где , > 0 – фиксированные числа, < 1 - , [] здесь и далее обозначает целую часть числа .

Пусть X1,..., Xm обозначает бутстреп-выборку объема m = m(n) из эмпирического распределения с ф.р. Fn, основанного на первых n наблюдениях X1,..., Xn исходной с.в.; Fm обозначает бутстреп-эмпирическую ф.р., X1:m · · · Xm:m – соответствующие порядковые статистики. Здесь и далее мы используем сокращенное обозначение m, опуская аргумент n. Определим m = n-бутстреп-двойников усеченных средних:

m-[m] 1- 1 Tn,m = Xi:m, Tn,m = (Fm)-1(u) du, (1) (2) m - [m] - [m] 1 - - i=[m]+(20) где и те же, что и в (19). Хорошо известно, что обе версии усеченного среднего служат статистическими оценками параметра сдвига 1- -µ(, ) = F (u) du (21) 1 - - – генерального усеченного среднего. Бутстреп-версия параметра µ(, ) дается 1- 1 -формулой µn(, ) = Fn (u) du = Tn. Введем -е (0 < < 1) (2) 1-- -1 -1 квантили F, Fn и Fm: = F (), n:n = Fn (), m:m = (Fm)-1().

Прежде всего мы показываем, что n1/2(Tn - Tn ) 0, P-п.н., n , и (2) (1) P что m1/2(Tn,m - Tn,m ) 0, P-п.н., min(n, m) . (Здесь и всюду далее (2) (1) P обозначает вероятностную бутстреп-меру, имеющую атомы 1/n в точках Xi:n, E обозначает соответствующее математическое ожидание). Из этих соотношений следует, что предельные распределения (если они существуют) обеих версий усеченного среднего, определенных в (19), одинаковы; то же замечание справедливо для распределений соответствующих бутстрепдвойников. Поэтому мы будем далее использовать следующие сокращенные обозначения: Tn = Tn, Tn,m = Tn,m, j = 1, 2.

(j) (j) Мы показываем в главах 3, 4, что асимптотические свойства второго порядка (разложения Эджворта) двух вариантов усеченного среднего и соответствующих их бутстреп-версий различны, и что Tn является более (2) подходящим определением усеченного среднего в контексте бутстрепа.

Определим две величины -1 -A = sup{x : F (x) } - F () ; B = sup{x : F (x) 1 - } - F (1 - ), которые обращаются одновременно в нуль тогда и только тогда, когда -инверсия F непрерывна в точках и 1 - . Введем вспомогательные с.в.

Yi, имеющие функцию распределения G(x):

F (x - A), x < + A, Xi + A, Xi , G(x) = F (x), + A x < 1-, Yi = Xi, < Xi 1-, F (x + B), 1- x, Xi - B, 1- < Xi.

i = 1,..., n. Определим обратную функцию G-1(u) = inf{x : G(x) u} и квантили распределения G: = G-1() = + A, 1- = G-1(1 - ) = 1-.

Введем с.в. Yi, уинсоризованные вне интервала (, 1-], т.е.

Wi = (Yi 1-), i = 1,..., n, (22) соответствующая им квантильная функция имеет вид Q(u) = (G-1(u) 1-). Определим первые два центральных момента Wi:

1 µW = Q(u) du, W = (Q(u) - µW )2 du. (23) 0 Пусть (Z1, Z2, Z3) обозначает нормально распределенный случайный вектор N (O, C) с нулевым математическим ожиданием и ковариационной матрицей (1 - ) ( - µW ) - C = ( - µW ) W (1- - µW ).

- (1- - µW ) (1 - ) Положим Z = (1 - - )-1 - A max(0, Z1) + Z2 + B max(0, Z3). Обозначим FZ ф.р. с.в. Z. Мы предполагаем, что = 1-, т.е. что W > 0.

Следующая теорема есть основной результат главы 2, она состоит из двух частей: мы доказываем, во-первых, версию классической теоремы C.Стиглера, дающей асимптотическое распределение усеченного среднего и, во-вторых, m n-бутстреп-аналог этой теоремы.

Теорема 2.1 Предположим, что W > 0. Тогда (i) sup P n1/2(Tn - µ(, )) x - FZ(x) - 0, n ;

xR (ii) sup P m1/2(Tn,m - Tn) x - FZ(x) -P 0, m , m/n 0.

xR Кроме того, (ii ) если (m log log n)/n 0, m , то в (ii) есть сходимость P-п.н.

Отметим, что условие m/n 0 необходимо для сходимости к предельному распределению только в том случае, если длина хотя бы одного из промежутков A и B не равна нулю. Однако, если A = B = 0, то предельное распределение является нормальным при единственном условии, что n m . Следующее утверждение есть прямое следствие теоремы 2.1.

Следствие 2.1 Предположим, что W > 0, тогда (i) sup P m1/2(Tn,m - Tn) x -P n1/2(Tn - µ(, )) x -P 0, xR m , m/n 0.

(i ) В (i) имеется сходимость P-п.н., если m , (m log log n)/n 0.

В главе 2 мы обсуждаем некоторые применения полученных результатов.

Так как предельное распределение n1/2(Tn - µ(, )) имеет, вообще говоря, ненулевое среднее EZ, естественно оценивать параметр µ(, ) с помощью статистики Tn - n-1/2EZ (см. (24) ниже). Для оценки асимптотического смещения EZ мы предлагаем применить m n-бутстреп-процедуру.

Определим EZ = m1/2E(Tn,m - Tn), 2n,m = m E(Tn,m - Tn)2 - EZ. (24) Мы доказываем следующее утверждение о состоятельности этих оценок.

Утверждение 2.1 Если W > 0, то EZ - EZ -P 0, 2n,m/Var(Z) -P 1, при m , m/n 0. Кроме того, сходимость имеет место P-п.н., если (m log log n)/n 0 при m .

Величины E(Tn,m) и 2n,m легко вычислить, используя метод МонтеКарло.

Полученные результаты применяются в главе 2 для построения доверительного интервала для параметра µ(, ). Результаты главы 2 иллюстрируются компьютерным моделированием.

В главе 3 мы устанавливаем справедливость разложений Эджворта для нормированного и стьюдентизованного усеченного среднего. Оценивая входящие в них неизвестные параметры, мы получаем так называемые эмпирические разложения Эджворта.

Мы снова рассматриваем два варианта усеченного среднего, определенные -в (19), и предполагаем, что инверсия F непрерывна в точках и 1 - .

Определим уинсоризованные с.в. Wi = (Xi 1-) и квантильную -функцию Q(u) = (F (u) 1-), u (0, 1). В дополнение к первым двум центральным моментам W1 (см. (23)) определим третий момент: 3,W = (Q(u) - µW )3 du и положим 2 2,W = - [µW - ]2 + [µW - 1-]2. (25) f() f(1-) Предположим, что = 1- (т.е. W > 0). В главе 3 показано, что формулы разложений Эджворта для усеченных средних Tn и Tn отличаются (1) (2) только асимптотическим смещением bn, поэтому мы используем объединяющее обозначение Tn, подчеркивая различия между Tn и Tn в тех случаях, когда (1) (2) это необходимо. Определим функцию распределения n1/2(Tn - µ(, )) FT (x) = P x (26) n (1 - - )-1W 3 нормированного Tn. Положим 1 = 3,W /W, 2 = 2,W /W. Мы доказываем, что разложение Эджворта для FT (x) имеет вид n (x) bn Gn(x) = (x) - (1 + 32)(x2 - 1) + 6 n, (27) 6 n W где – стандартная нормальная ф.р., = , bn = bn – асимптотическое (j) смещение, которое для Tn определяется формулой (2) 1 (1 - ) (1 - ) bn = - +, (28) (2) 2 n f() f(1-) а для Tn имеет вид (1) bn = bn - b[.],n (29) (1) (2) где n - [n] n - [n] b[.],n = µ(, ) - + µ(, ) - 1-.

n n Для формулировки результатов потребуется следующее условие:

[C1] Предположим, что функция распределения F имеет плотность f = F в окрестностях точек , причем f() > 0, = , 1 - . Кроме того, предположим, что плотность f удовлетворяет условию Гёльдера порядка a > 0 в точках , 1-, то есть существует постоянная C, такая, что |f(x) - f()| C|x - |a, для всех x, принадлежащих окрестности , = , 1 - .

Теперь сформулируем наш первый результат о разложении Эджворта для нормированного усеченного среднего.

Теорема 3.1 Предположим, что выполняется условие [C1]. Тогда sup |FT (x) - Gn(x)| = o(n-1/2-p), n , (30) n xR для любого p < min(a/2, 1/4). Кроме того, если a 1/2 в условии [C1], то имеет место оценка (log n)5/sup |FT (x) - Gn(x)| = O, n . (31) n n3/xR В главе 3 мы находим также разложения Эджворта для стьюдентизованного усеченного среднего. Определим 1 µW,n = Qn(u) du, W,n = (Qn(u) - µW,n)2 du, (32) 0 -где Qn(u) = n:n (Fn (u) (1-)n:n) – эмпирическая квантильная функция.

Определим функцию распределения стьюдентизованного усеченного среднего:

n1/2(Tn-µ(,)) FT,S(x) = P x. Положим n (1--)-1W,n (x) bn Hn(x) = (x) + (2x2 + 1)1 + 3(x2 + 1)2 - 6 n. (33) 6 n W Следующая теорема утверждает справедливость разложения Эджворта для стьюдентизованного усеченного среднего.

Теорема 3.2 Предположим, что выполняется условие [C1]. Тогда sup |FT,S(x) - Hn(x)| = o(n-1/2-p), n , (34) n xR для любого p < min(a/2, 1/4). Кроме того, если a 1/2 в условии [C1], то имеет место оценка (log n)5/sup |FT,S(x) - Hn(x)| = O, n . (35) n n3/xR Для того, чтобы получить так называемое эмпирическое разложение Эджворта мы заменим 1, 2, bn и W в (27) и (33) их статистическими оценками. Неизвестные параметры моментного типа мы оцениваем по методу подстановки эмпирической ф.р. Так мы получаем оценку 1 = -W,n3,W. Для оценки 2 и bn требуется оценить значения плотности f() и f(1-). Для этого мы используем ядерные оценки со ступенчатым ядром:

g(x) = I{|x| 1/2}, в качестве ширины ядра используется = n-1/4.

Тогда оценки для значений плотности определяются равенствами: f() = n-3/4 n I{2n1/4|Xi - n:n| 1}, где = , 1 - .

i=Заменяя все неизвестные величины их оценками в формулах (27) и (33), мы получаем эмпирические разложения Эджворта:

(x) bn Gn(x) = (x) - (1 + 32)(x2 - 1) + 6 n, 6 n W,n (x) bn Hn(x) = (x) + (2x2 + 1)1 + 3(x2 + 1)2 - 6 n, 6 n W,n где W,n – корень из оценки асимптотической дисперсии (см. (32)).

Следующее утверждение означает справедливость эмпирических разложений Эджворта.

Теорема 3.3 Предположим, что условие [C1] выполнено с a = 1, то есть что в окрестностях квантилей , 1- существует положительная плотность f, удовлетворяющая там условию Липшица.

Тогда для любого c > (log n)5/P sup |FT (x) - Gn(x) A1 = O(n-c), n , (36) n n3/xR (log n)5/P sup |FT,S(x) - Hn(x) A2 = O(n-c), n , (37) n n3/xR где Ai (i = 1, 2) – некоторые постоянные, зависящие только от c.

В заключение, мы доказываем, что результаты главы 3 не могут быть получены в качестве следствий общего результата Х.Путтера и В.ван Цвета (см.

сноску 9, стр. 4) для симметрических статистик, поскольку их условия не могут быть выполнены для усеченного среднего.

В главе 4 доказывается справедливость разложений Эджворта для бутстреп-версий усеченного среднего, находятся явные формулы для члена порядка m-1/2 (корректирующего асимметрию и смещение; m – объем бутстреп-выборки). Опираясь на эти разложения и результаты главы 3, мы доказываем корректность второго порядка m = n-бутстреп- аппроксимации для усеченного среднего, т.е. доказываем, что m = n-бутстреп-аппроксимация ф.р. усеченного среднего и стьюдентизованного усеченного среднего является более точной, чем нормальная аппроксимация. В главе 4 показано, что в общем случае m = n-бутстрепа свойство корректности второго порядка усеченного среднего Tn, заданного первой из формул (19), может быть достигнуто только (1) при дополнительной коррекции смещения, в то время как для Tn, заданного (2) второй из формул (19), коррекция не требуется.

Для того, чтобы сформулировать некоторые из результатов главы 4, будут нужны следующие предположения:

[C1] Предположим, что функция распределения F имеет плотность f = F в окрестностях точек , причем f() > 0, = , 1 - .

Кроме того, предположим, что плотность f удовлетворяет равномерному условию Гёльдера порядка a > 0 в окрестностях точек , 1-, т.е.

существует постоянная C такая, что |f(x) - f(y)| C|x - y|a, для всех x, y, принадлежащих окрестности , = , 1 - .

[C2] Для некоторого 0 < d 1 m = O n2-d, n m .

В главе 4 показано, что формулы разложений Эджворта для бутстрепверсий (в "бутстреп-мире") совпадают с соответствующими формулами для нормированного и стьюдентизованного усеченных средних (в "реальном мире"), если заменить входящие в эти формулы величины их оценками подстановки. Справедливость этих разложений доказывается в условиях [C1] и [C2]. Из-за ограниченности объема автореферата мы не будем формулировать теоремы 4.1, 4.2 о справедливости разложений Эджворта для бутстреп-версий усеченных средних. Вместо этого мы приведем некоторые их следствия, касающихся корректности второго порядка бутстреп-аппроксимации.

В дополнение к предыдущим обозначениям, относящимся к главам 2 и 3, наряду с величинами Wi, определенными в (22), введем их бутстреп-версии:

Wi = n:n (Xi (1-)n:n), i = 1,..., m,, определим соответствующую им квантильную функцию Q (u) = m:m ((Fm)-1(u) (1-)m:m).

m Как и прежде, мы отмечаем, что разложения Эджворта для двух версий бутстреп-двойников усеченного среднего отличаются только смещением, поэтому мы используем объединяющее обе версии обозначение Tn,m, уточняя, какой из вариантов имеется в виду там, где это необходимо. Определим ф.р. нормированной бутстреп-версии усеченного среднего: FT (x) = n,m m1/2(Tn,m-Tn(2)) P x, где W,n = (Qn(u) - µW,n)2 du (см. (32)) и ф.р.

(1--)-1W,n m1/2(Tn,m-Tn(2)) стьюдентизованного усеченного среднего FT,S(x) = P x, (1--)-1W,m n,m 1 где (W,m)2 = (Q (u) - µ )2 du и µ = Q (u) du m W,m W,m m 0 (1-) Определим величину b = -(1-) +. Следующее утверждение 2W f() f(1-) является следствием теорем 4.1 и 4.2 главы 4 и теорем 3.1 и 3.2 главы 3. Оно справедливо для Tn = Tn и Tn,m = Tn,m, т.е. для усеченного среднего, (2) (2) определенного второй из формул (19) и для соответствующей бутстреп-версии.

Следствие 4.1 Предположим, что условия [C1] и [C2] выполнены. Тогда 1 1 FT (x) - FT (x) = -(x) - (1 + 32)(x2 - 1) + b n(2) n,m(2) m n +R1,n + R1,n,m + R1,m, 1 1 1 FT,S(x) - FT,S(x) = (x) - 1(2x2 + 1) + 2(x2 + 1) - b n(2) n,m(2) m n 6 +R2,n + R2,n,m + R2,m, где для k = 1, 2: Rk,n = o(n-1/2-p) для любого p < min(a/2, 1/4) при n , R k,n,m = o m-1/2n-s для любого s < a/2, P-п.н. при n m , Rk,m = o m-1/2-p для любого p < min(a/2, 1/4, d/(4(2 - d))) P-п.н. при n m .

Отметим, что m может быть здесь как меньшего порядка, чем n, т.е.

m n, так и большего, т.е. m n. Граничный случай m = n соответствует стандартному "простому" непараметрическому бутстрепу Эфрона.

Из наших результатов следует, что корректность второго порядка m = n-бутстреп-аппроксимации, т.е. граница порядка o(n-1/2), для усеченного среднего может быть достигнута тогда и только тогда, когда m/n 1 при n , то есть когда m = n + o(n). Кроме того, если мы предположим выполненным условие: m = n + O(nr) с некоторым 0 r < 1, то получим, 1 что - = O n-3/2+r. Из этого соотношения и следствия 4.1 вытекает m n следующий результат для m = n-бутстрепа.

Теорема 4.3 Предположим, что условие [C1] выполняется, и пусть m = n + O(nr), 0 r < 1. Тогда для любого p < min(a/2, 1 - r, 1/4) sup |FT (x) - FT (x)| = o n-1/2-p, (38) n(2) n,m(2) xR sup |FT,S (x) - FT,S (x)| = o n-1/2-p, (39) n(2) n,m(2) xR P-п.н., n .

Далее в главе 4 мы объясняем, почему использование усеченного среднего Tn, заданного второй из формул (19), предпочтительней в контексте (2) бутстрепа. Мы доказываем, что для Tn (см. первую из формул (19)) (1) результат, аналогичный теореме 4.3 (т.е. корректность второго порядка), может быть получен только при введении дополнительной коррекции смещения, без которого в общем случае может быть получена только оценка O min(n, m)-1/2. Этот факт составляет содержание теоремы 4.4.

В п. 4.3 главы 4 мы обсуждаем возможность получения корректности второго порядка для бутстреп-аппроксимации за сокращенное время моделирования, т.е. когда m n (m/n 0, m ). Эта возможность связана с использованием полученных нами разложений Эджворта в сочетании с бутстреп-экстраполяцией Бикела – Яховы. Подробно обсуждается метод бутстреп-экстраполяции, доказываются соответствующие результаты:

теоремы 4.5 и 4.6.

В п. 4.4 главы 4 выводятся следствия (теоремы 4.7, 4.8) для случая "простого" бутстрепа, когда m = n.

В п. 4.5 главы 4 приведены результаты численного моделирования, которые иллюстрируют наши результаты по корректности второго порядка m = n бутстреп-аппроксимации.

В главе 5 изучаются свойства выборочных квантилей и их бутстрепверсий, доказываются результаты типа Бахадура – Кифера. Результаты главы 5 носят вспомогательный для наших целей характер, они служат основой построения U-статистических аппроксимаций. Вместе с тем они имеют и самостоятельный интерес. Приведем некоторые из результатов главы 5. Пусть kn – последовательность натуральных чисел такая, что 0 kn n, и -rn = kn (1 - kn) , n . Положим n = kn/n, и пусть = F (n), n - n:n = Fn (n) обозначают соответственно генеральную и выборочную n квантили уровня n. Определим два числа 0 a1 = lim inf n a2 = lim sup n 1. (40) n n В формулировках результатов п. 5.2 используются следующие условия.

-[B1]. Функция F дифференцируема в некотором открытом множестве -U (0, 1) (т.е. плотность f = F существует и положительна в F (U)), кроме того, (0, ), 0 = a1 = a2, (1 - , 1), a1 = a2 = 1, U (0, a2] 0 = a1 < a2, U [a1, 1), 0 < a1 < a2 = 1, [a1, a2], 0 < a1 a2 < 1, (0, 1), a1 = 0, a2 = 1, (41) с некоторым 0 < 1 в случаях, соответствующих первым строкам (41).

-[B2]. rn log n 0, n .

Отметим, что условие [B1] соответствует условию гладкости [A1] из главы 1, отнесенному к одной из участвующих в [A1] последовательностей.

Пусть h – вещественнозначная функция, определенная на множестве -F (U) (см. (41)). Возьмем произвольное 0 < C < и для всех достаточно больших n определим rn log rn -1 -,h(C) = sup h F n + t - h F n, (42) n n|t|C -1 -где h F (u) = h F (u). Кроме того, определим функцию ,h(C), n которая получается из ,h(C) заменой log rn на log n в (42).

n Пусть G(x), x R, обозначает вещественнозначную функцию, g = G – ее производную, если она существует, и пусть (g/f)(x) и (|g|/f)(x) обозначают отношения g(x)/f(x) и |g(x)|/f(x) соответственно.

Теорема 5.1 Предположим, что rn , n , условие [B1] выполнено -и функция G дифференцируема на множестве F (U). Тогда g G( n:n) - G( ) = -[Fn( ) - F ( )] ( ) + Rn(n), (43) n n n n n f где для любого c > -c P(|Rn(n)| > n) = O rn, n , 3/4 1/g n = A (n(1-n))1/4 log rn |g|( )+B (n(1-n))1/2 log rn , (C), n n n f n f где A, B и C – некоторые положительные постоянные, зависящие только от c.

Кроме того, если дополнительно условие [B2] также выполняется, то (43) имеет место и для любого c > P(|Rn(n)| > n) = O n-c, n , g где n получается из n заменой log rn на log n и заменой функции , (C) n f g функцией , (C).

n f Теорема 5.2 Предположим, что rn , n , условие [B1] выполнено -и функция G дифференцируема на множестве F (U). Тогда n 1 g (G(x) - G( )) d Fn(x) = - [Fn( ) - F ( )]2 ( ) + Rn(n), (44) n n n n 2 f nn:n где для любого c > -c P(|Rn(n)| > n) = O rn, n , 5/g n = A (n(1 - n))3/4 log rn |g|( ) + B n(1 - n)log rn, (C), где A, n n n f n f B и C – некоторые положительные постоянные, зависящие только от c.

Кроме того, если дополнительно условие [B2] также выполняется, то (44) имеет место и P(|Rn(n)| > n) = O n-c, n , для любого c > 0, где n получается из n заменой log rn на log n и заменой g g функции , (C) функцией ,f (C).

n n f Далее в п. 5.2 формулируются следствия теорем 5.1–5.2, в которых остаточный член дается в более простой форме, рассматривается несколько примеров.

В п. 5.3 главы 5 формулируются и доказываются аналогичные результаты для бутстреп-версий квантилей. Пусть 0 < < 1 – фиксированное число, [n] = Fn(n:n), G – функция, определенная и дифференцируемая в -окрестности квантили = F (), g – ее производная.

Лемма 5.4 Пусть в некоторой окрестности существует плотность f = F, причем f() > 0. Предположим, что выполнено условие [C2].

Кроме того, предположим, что функции f, g удовлетворяют равномерному условию Гёльдера (см. [C1] выше) порядка a > 0 в окрестности . Тогда g G(m:m) - G(n:n) = - [Fm(n:n) - Fn(n:n)] (n:n) + Rm, (45) f где P |Rm| > m-1/2-p = o (m-c) P-п.н. при n m , для любого p < min(a/2, 1/4, d/(4(2 - d))).

Лемма 5.5 Предположим, что выполнены условия леммы 5.4. Тогда n:n (G(x) - G(n:n))d Fm(x) m:m 1 g = - [Fm(n:n) - Fn(n:n)]2 (n:n) + Rm, (46) 2 f где P |Rm| > m-1-p = o (m-c) P-п.н. при n m для любого p < min(a/2, 1/4, d/(4(2 - d))).

В главе 6 рассматриваются статистики вида Ln = n-1/2 n ci,nXi:n, i=ci,n R. Мы получаем некоторые оценки скорости сходимости распределений нормированных с.в. Ln к нормальному закону, т.е. неравенства типа Берри – Эссеена. Положим n b = n max |ci,n - ci-1,n|, 3 = |ci,n|3E|Xi:n|3, 2in n i=Ln-ELn Fn(x) = P x, где L = (DLn)1/2, DLn – дисперсия Ln.

n Ln Мы получаем следующее обобщение результата В. ван Цвета для L-статистик (см. сноску 8, стр. 4).

Теорема 6.1 Предположим, что 0 < L < . Тогда n 3 + b3 {E|X1|}3 b2 {E|X1|}sup |Fn(x) - (x)| C + n-1/2, (47) 3 L L xR n n где C – абсолютная положительная постоянная.

Если E|X1|3 < , то из (47) следует оценка В. ван Цвета. Однако теорема 6.1 имеет и другие следствия. Из нее мы выводим следующий результат.

Теорема 6.2 Предположим, что E|X1| < , L > 0 и что ci,n = 0 для n i = 1, 2, n - 1, n. Тогда 3 bE|X1| bE|X1| sup |Fn(x) - (x)| C + n-1/2, (48) L L xR n n где C – абсолютная положительная постоянная.

В главе 7 изучается состоятельность бутстреп-aппроксимации распределений L-статистик с весами ci,n, определенными с помощью весовой функции 1 i J(u), u (0, 1), по формулам: (i) ci,n = J(n+1) или (ii) ci,n = n i/n J(u) du, i = 1,..., n. Мы показываем, что имеется некоторое (i-1)/n различие в асимптотических свойствах распределений бутстреп-версий Ln для этих двух типов весов. При одних и тех же естественных моментных предположениях условия гладкости, налагаемые на функцию J, достаточные для состоятельности бутстреп-аппроксимации, в случае (ii) более мягкие, чем в случае (i).

Воспользуемся интегральным представлением Ln, причем в случае (i) будем обозначать L-статистику Sn, а в случае (ii) – Tn. Иными словами:

1 -1 -Sn = Fn (u)Jn(u) du ; Tn = Fn (u)J(u) du, 0 -1 i i-1 i где Fn (u) – инверсия эмпирической ф.р., Jn(u) = J, u <.

n+1 n n Введем m = n-бутстреп-версии статистик Sn и Tn, которые определяются формулами 1 Sm = (Fm)-1 (u)Jm(u) du, Tm = (Fm)-1 (u)J(u) du.

0 -Введем величину (J, F ) = F (u)J(u) du, статистическими оценками которой могут служить S n и Tn. Бутстреп-версия параметра (J, F ) – -это величина (J, Fn) = Fn (u)J(u) du = Tn, получаемая из (J, F ) подстановкой эмпирической ф.р. Для краткости формулировок положим 2 = 2 2(J, F ), n = 2(J, Fn), 2 = 2(J, Fm), где 2(J, F ) = J(F (x))J(F (y))[F (min(x, y)) - F (x)F (y)] dx dy -- – асимптотическая дисперсия. Среди других результатов мы доказываем следующее утверждение о корректности бутстреп-аппроксимации для Lстатистик.

Теорема 7.7 Предположим, что EX1 < , A = supu(0,1) |J(u)| < , функция J удовлетворяет условию Гёльдера порядка a > 0 на (0, 1) и = (J, F ) > 0. Тогда sup |P{ n(Tn - ) < x} - P{ m(Tm - Tn) < x}| = o(1), x n(Tn - ) m(Tm - Tn) sup |P{ < x} - P{ < x}| = o(1), n x n(Tn - ) m(Tm - Tn) sup |P{ < x} - P{ < x}| = o(1), (49) n m x P-п.н., n m .

В теореме 7.6 мы доказываем, что соотношения (49) верны, если заменить в них Tn, Tn на Sn и Sn соответственно, но при дополнительном условии, что функция J удовлетворяет условию Гёльдера порядка a > 1/2 на (0, 1).

Публикации автора по теме диссертации Статьи в журналахи изданиях, рекомендованных ВАК:

[1] Грибкова Н.В. Об оценке скорости сходимости к нормальному закону усеченных линейных комбинаций порядковых статистик // Матем. заметки, 1987, т. 42, № 5, c. 739–746.

[2] Грибкова Н.В. О скорости сходимости к нормальному закону конечно усеченных линейных комбинаций порядковых статистик // Теория вероятн. и ее примен., 1988, т. 33, № 4, c. 781–784.

[3] Грибкова Н.В. Об аналогах неравенства Берри – Эссеена для L-статистик.

– В сб. Проблемы устойчивости стохастических моделей, Труды семинара ВНИИ системн. исследов., М 1991, с. 41–49. Англ. перев.: On analogues of the Berry – Esseen inequality for L-statistics // J. Math. Sci. (N. Y.), 1994, v. 72, No. 1, p. 2872–2879.

[4] Грибкова Н.В. Оценки скорости сходимости распределений L-статистик к нормальному закону в условиях, близких к условиям сходимости // Теория вероятн. и ее примен. т. 37, № 4, 1992, с. 774.

[5] Грибкова Н.В. Об аналогах неравенства Берри – Эссеена для урезанных линейных комбинаций порядковых статистик // Теория вероятн. и ее примен., 1993, т. 38, № 1, c. 176–183.

[6] Gribkova N.V. Bounds for absolute moments of order ststistics. – In Exploring Stochastic Laws: Festschrift in Honor of the 70th Birthday of Acad. V.S.Korolyuk (A.V.Skorokhod et al. Eds.), Utrecht: VSP, 1995, p. 129–134.

[7] Грибкова Н.В. Бутстреп-аппроксимация распределений L-статистик// Зап.

научн. семинаров ПОМИ, 1999, т. 260, с. 84–102. Англ. перев.: Bootstrap approximation of distributions of the L-statistics // J. Math. Sci. (N. Y.), 2002, v. 109, No. 6, p. 2088–2102.

[8] Gribkova N.V., Helmers, R. The empirical Edgeworth expansion for a Studentized trimmed mean // Math. Methods Statist., 2006, v. 15, p. 61–87.

[9] Gribkova N.V., Helmers, R. On the Edgeworth expansion and the M out of N bootstrap accuracy for a Studentized trimmed mean // Math. Methods Statist., 2007, v. 16, p. 142–176.

[10] Грибкова Н.В., Хелмерс, Р. О состоятельности M N-бутстрепаппроксимации распределения усеченного среднего // Теория вероятн. и ее примен., 2010, т. 55, вып. 1, с. 3–18.

[11] Грибкова Н.В. Хелмерс, Р. Аппроксимация второго порядка для слегка усеченных сумм // Теория вероятн. и ее примен., 2011, т. 56, вып. 4 (в печати);

arXiv:1104.3347v1 [math.PR].

Работы, опубликованные в других изданиях:

[12] Deheuvels P., Gribkova N.V., Nevzorov V.B. Bootstrapping order statistics and records. – In Proc. of 3-rd St.-Petersburg Workshop On Simulation (S.M.Ermakov et al. Eds.), 1998, St.-Petersburg, p. 349–355.

[13] Грибкова Н.В. О свойствах порядковых статистик бутстреп-выборки вблизи выборочной квантили // Обозр. прикл. и промышл. матем., т. 12, в. 3, 2005, с. 656–657.

[14] Gribkova, N.V., Helmers R. On the bootstrap accuracy for the trimmed mean:

a survey of some recent developments. – In Proc. of the 5-th SEAMS-GMU Intern.

Confer. on Mathematics and its Applications, 2007, Yogyakarta, p. 55–68.

[15] Грибкова Н.В. Аппроксимация второго порядка для слегка усеченных сумм случайных величин // Обозр. прикл. и промышл. матем., т. 16, в. 2, 2009, с. 257–258.

[16] Грибкова Н.В. Асимптотическая аппроксимация типа разложения Эджворта для слегка усеченных сумм // Обозр. прикл. и промышл. матем., т. 17, в. 6, 2010, с. 863–864.

[17] Gribkova N.V., Helmers R. On the Bahadur – Kiefer representation for intermediate sample quantiles (представлено в журнал); arXiv:1106.2260v1 [math.PR].






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.