WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     || 2 | 3 |
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. М.В. ЛОМОНОСОВА ФИЗИЧЕСКИЙ ФАКУЛЬТЕТ

На правах рукописи

Котляров Олег Леонидович Методы экстраполяции нерегулярных временных рядов Специальность 01.04.02 – «Теоретическая физика»

Автореферат диссертация на соискание ученой степени кандидата физико-математических наук

Москва – 2006

Работа выполнена на физическом факультете Московского государственного университета им. М.В. Ломоносова Научный руководитель доктор физ.-мат. наук, профессор А.Ю. Лоскутов

Официальные оппоненты:

доктор физ.-мат. наук, профессор Г.Э. Норман доктор физ.-мат. наук, профессор А.И. Чуличков Ведущая организация Российская экономическая академия им. Г.В. Плеханова

Защита состоится «_» 2006 года в _ часов на заседании диссертационного совета К 501.001.17 физического факультета МГУ им. М.В. Ломоносова по адресу 119992, Москва, МГУ, физический факультет, ауд. _.

С диссертацией можно ознакомиться в библиотеке физического факультета МГУ им. М.В. Ломоносова.

Автореферат разослан «_» 2006 года.

Ученый секретарь диссертационного совета доктор физ.-мат. наук П.А. Поляков

Общая характеристика работы

Актуальность темы Оценка результатов любого эксперимента базируется на обработке полученных данных. В этих условиях обработка временных рядов с целью извлечения из них полезной информации становится одной из важнейших задач любого исследования. Но этим цели обработки временных рядов не ограничиваются. Достаточно часто определяющим является не только изучение свойств системы, породившей временной ряд, но – иногда и в первую очередь – прогноз дальнейшей динамики временного ряда, т.е. его экстраполяция. В метеорологии практический интерес представляет прогноз погоды на ближайшее время. В геофизике задача, имеющая на сегодня наибольшую общественную значимость, – это предсказание землетрясений. Подобное задачи прогнозирования возникают при изучении солнечной активности в астрофизике, в финансовом анализе при прогнозе курсов акций, биржевых индексов, а также во многих других областях исследований и научных дисциплинах.

С другой стороны, стремление заглянуть в будущее возникло у человечества очень давно, а вместе с ним возникли и различные способы постижения будущего. Однако область приложения методов и моделей, рассматриваемых в работе, далека от сфер приложения астрологии и хиромантии, а цели применения этих методов и моделей не столь глобальны.

Основная задача, на которую они ориентированы, – исходя из имеющихся данных в предположении неизменности характера динамики системы, построить прогноз поведения наблюдаемой.

В основе большинства методов, связанных с обработкой временных рядов, лежит использование многомерного представления временного ряда в виде матрицы задержек – набора копий временного ряда, взятых с определенными лагами. Новым результатом теории динамических систем явилось установление факта, что пространство задержек при соблюдении определенных условий может рассматриваться как реконструкция фазового пространства нелинейной динамической системы, породившей временной ряд. Таким образом, была доказана возможность описания динамики многомерной системы по временному ряду наблюдаемой. В свою очередь, возможность описания и реконструкции динамики системы при определенных условиях позволяет прогнозировать ее дальнейшее поведение.

В рамках теории динамических систем было разработано достаточно много методов анализа и прогнозирования временных рядов. В представленной работе подробно рассмотрены два из них, отражающие два основных подхода к описанию динамики временных рядов: глобальный – метод сингулярного спектрального анализа – и локальный – метод локальной аппроксимации.

Метод сингулярного спектрального анализа позволяет сгладить исходный ряд, снизить уровень случайных возмущений, выявлять периодические составляющие ряда и во многих случаях прогнозировать дальнейшее изменение изучаемой временной зависимости. Преимущества локальной аппроксимации проявляются в первую очередь при прогнозировании нерегулярных (хаотических и квазипериодических) стационарных временных рядов.

На сегодняшний день существует несколько вариантов метода локальной аппроксимации, которые различаются конкретным видом используемых моделей, способом прогнозирования на несколько шагов вперед и особенностями численных расчетов. Также имеется несколько модификаций сингулярного спектрального анализа. Однако, в отличие от вариантов метода локальной аппроксимации, они различаются не столь принципиально и достаточно подробно рассмотрены в литературе.

Таким образом, в первую очередь возникает задача систематизации существующих разновидностей метода локальной аппроксимации и выбора из них наиболее оптимальной в каждом конкретном случае. Кроме того, при исследовании реальных систем, как правило, приходится иметь дело с зашумленными данными, что может затруднять использование метода локальной аппроксимации. Решение перечисленных задач, как представляется, должно способствовать расширению сферы применения рассматриваемых методов экстраполяции временных рядов.

Цели диссертационной работы Разработка математической модели метода локальной аппроксимации, позволяющей выбирать оптимальный вариант метода исходя из характеристик исследуемого временного ряда.

Анализ особенностей применения различных вариантов методов локальной аппроксимации и сингулярного спектрального анализа.

Исследование возможностей применения методов локальной аппроксимации и сингулярного спектрального анализа при обработке временных рядов с аддитивным шумом.

Разработка алгоритма выбора параметров локальной аппроксимации, не требующего визуального контроля и принятия решения исследователем.

Научная новизна 1. Исследован, расширен и систематизирован набор вариантов метода локальной аппроксимации.

2. Оценено качество прогнозов, получаемых различными вариантами метода локальной аппроксимации.

3. Предложен способ выбора оптимального варианта метода локальной аппроксимации.

4. Разработан метод снижения влияния шума на результаты прогноза.

5. Предложен критерий выбора параметров локальной аппроксимации.

Научная и практическая ценность 1. Предложен математический аппарат для аналитического исследования результатов прогноза.

2. Разработан программный комплекс, реализующий методы локальной аппроксимации и сингулярного спектрального анализа, в том числе с автоматическим выбором параметров и контролем получаемых результатов.

3. Выработаны рекомендации по численной реализации методов локальной аппроксимации и сингулярного спектрального анализа для обработки временных рядов.

Защищаемые положения 1. Общая математическая модель метода локальной аппроксимации и ее следствия.

2. Принцип предварительной SSA-фильтрации временного ряда для экстраполяции ряда по методу локальной аппроксимации.

3. Способ автоматического выбора параметров локальной аппроксимации.

Публикации Основные результаты диссертационной работы изложены в восьми публикациях, в том числе пяти рецензируемых, перечень которых приведен в заключительной части автореферата, и доложены на ряде научных семинаров, а также на XI Всероссийской научной школе «Нелинейные волны – 2002», Нижний Новгород, «The 2nd Shanghai International Symposium on Nonlinear Science and Applications», 2005, Shanghai, China и «2nd International Nonlinear Science Conference», 2006, Heraklion, Crete, Greece.

Содержание работы Диссертационная работа состоит из введения, 4 глав и заключения, включает 21 рисунок, список литературы из 114 наименований и одно приложение.

Во Введении обосновывается актуальность темы работы, сформулированы цели работы, кратко охарактеризованы научная новизна и практическая ценность полученных результатов и разработанных методик. Дана краткая аннотация каждой главы диссертационной работы.

Первая глава представляет собой основную часть литературного обзора работы. Здесь, в частности, проводится сравнение двух крайних подходов к описанию нерегулярности во временных рядах – описания в предположении нелинейного детерминированного поведения и линейного стохастического поведения. Эти два подхода рассматриваются наиболее часто из-за их ясного математического представления и наибольшего понимания и определяют границы проявления свойств нелинейности и стохастичности. На практике эти подходы оказываются взаимодополняющими: реальный мир временных рядов содержит все виды смесей нелинейности и стохастичности. Многие реальные источники нерегулярных сигналов, например, земная атмосфера, как установлено, являются принципиально нелинейными, но в некоторых случаях их эволюция может в результате усреднения сводиться к величинам, хорошо аппроксимируемым моделями типа ARMA. Для выявления «нелинейности» могут применяться специальные статистические тесты, которые заключаются, как правило, в формулировке некоторой нулевой гипотезы для порождающего процесса, которая может быть принята либо отклонена исходя из оценок выбранного нелинейного параметра.

Первая глава включает в себя также краткое изложение базовых принципов, подходов и определений теории динамических систем, в рамках которой рассматриваются теоретические основы обработки временных рядов.

Почти все методы анализа временных рядов, стандартные линейные или нелинейные, работают только для стационарных рядов. Это связано с тем, что любые изменения в динамике процесса во время измерений обычно сильно затрудняют анализ результатов. Тем самым вводятся определенные ограничения на обрабатываемые временные ряды. Для проверки стационарности ряд могут применяться специальные тесты на стационарность (нестационарность).

Использование теоретически обоснованных подходов при обработке реальных временных рядов сталкивается с весьма серьезной проблемой. Дело в том, что все теоретические результаты получены в предположении достижимости сколь угодно малых масштабов длины. А это возможно только при бесконечном количестве доступных данных. Кроме того, предполагается, что наблюдения доступны с произвольной точностью. Поэтому требуются специальные исследования применимости полученных теоретических результатов при наличии шума и в условиях конечной длины ряда.

Та же проблема возникает и при оценке количественных показателей по реальным временным рядам (в частности, показателей Ляпунова, корреляционной размерности – этим проблемам посвящено большое количество работ), используемых в теории детерминированного хаоса, при определении которых используется предельный переход. При работе с конечным рядом обеспечить предельный переход невозможно. Поэтому во многих случаях переходят к сравнительным исследованиям показателей, полученных с помощью стандартных измерительных процедур.

На основе теоретических подходов с учетом условий и ограничений работы с реальными временными рядами разработаны и представлены в литературе способы и модели обработки нелинейных сигналов, включающие в себя методы классификации и сравнения временных рядов, выявления свойств динамических систем, лежащих в их основе, предсказания будущих значений – экстраполяции временных рядов. Краткое описание основных принципов некоторых из них так же изложено в первой главе.

Описание и обзор литературы по двум основным подходам к анализу и прогнозу нерегулярных временных рядов на основе глобальных и локальных моделей вынесено во вторую главу. Деление методов на глобальные и локальные проводится по области определения параметров аппроксимирующей функции. В глобальных методах эти параметры идентифицируются с использованием всех известных значений ряда. Локальная аппроксимация предполагает отказ от явного использования для прогнозирования всех уже известных значений ряда и ограничивает количество объясняющих значений лишь наиболее близкими в некотором смысле к стартовой точке, после которой начинается прогноз.

Основное направление использования глобальных методов – это получение глобальных характеристик системы. Прогнозирование в этих методах используется в большой степени для выяснения долгосрочной динамики, чем для оценки ближайшего будущего. Локальные методы прогноза имеют преимущество в задачах, связанных с прогнозированием нерегулярных временных рядов.

«Глобальный» метод – сингулярный спектральный анализ (SSA) и метод локальной аппроксимации (LA) детально рассмотрены во второй главе. Там же даны подробные пошаговые описания этих методов.

В основе большинства подходов, связанных с обработкой временных рядов x1,…, xN, лежит построение множества векторов задержек { } T xt = xt xt-1 xt- p+1, t = p, p +1,…, N ( ). Метод задержек устанавливает переход от исходного одномерного (скалярного) временного ряда к многомерному (векторному) представлению. При этом каждый многомерный p вектор образуется из некоторого числа следующих друг за другом значений исходного ряда. Результат можно представить в виде набора «фотографий» ряда, сделанных через скользящее вдоль ряда окно, в которое одновременно p попадает лишь последовательных значений ряда:

xp+1 xp+xN xp xp+.

Xp(N - p+1) = xN - p+x2 x xN - p+x1 x2 x1 xN - p Принцип действия SSA во многом схож с Фурье-фильтрацией: здесь исходный ряд также представляется в виде набора составляющих, только в SSA эти составляющие не являются в общем случае гармоническими. Особенностью метода SSA является обработка матрицы X по алгоритму, близкому к методу главных компонент (МГК). Использование для обработки всей матрицы X сразу обуславливает отнесение этого метода к разряду глобальных.

Выбор составляющих осуществляется из условия максимизации разброса точек (каждый столбец матрицы X представляется в виде точки в M -мерном пространстве задержек) вдоль выбранной составляющей. Иллюстрация этого алгоритма представлена на рис. 1, где x(1), x(2), x(3) – первая, вторая и третья оси координат исходного базиса, y(1), y(2), y(3) – новый базис. Ось y(1) ( ) расположена вдоль прямой максимального разброса точек на графике; по оси y(2) разброс меньше, но он максимальный из всех возможных при заданной y(1) ; ось y(3) при заданных y(1), y(2) определятся единственным образом и на () ее долю разброса почти не остается.

x(3) y(1) y(3) P y(2) x(2) x(1) Рис. 1. Выбор новой системы координат методом главных компонент ( ).

Pages:     || 2 | 3 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»