WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 || 3 |

M = В SSA получающееся разложение используется для выделения наиболее значимых составляющих ряда и отсева случайных возмущений. Например, для случая, изображенного на рис. 1, можно ограничиться первыми двумя составляющими, так как вдоль третьей оси разброса почти нет и все точки можно приблизительно считать лежащими в плоскости двух первых составляющих – (P). Отклонения от этой плоскости как раз могут быть следствием случайных возмущений.

Анализ полученных составляющих позволяет выделять периодические и квазипериодические составляющие временного ряда. Этот метод может использоваться для улучшения соотношения сигнал/шум. Кроме того, в последнее время появились оригинальные варианты, расширяющие возможности SSA и позволяющее строить на его основе прогноз дальнейшей динамики ряда. Например, метод экстраполяции «Гусеница», в соответствии с которым предсказание ряда на один шаг по времени вперед определяется из условия минимизации проекции нового вектора на выбранную гиперплоскость (P).

Иллюстрацией алгоритма локальной аппроксимации в простейшем одномерном случае может быть следующий способ построения прогноза температуры на следующий день: сначала находится день, в который температура была максимально близка к сегодняшней и затем в качестве прогноза температуры на завтра берется ее значение в день, следующий за найденным. Аппроксимация более высокого порядка позволяет также учитывать влияние на прогноз отклонений «сегодняшней» температуры от температуры в день, наиболее похожий на сегодняшний.

Построение прогноза на один шаг по времени по методу LA проводится в три этапа. Сначала строится матрица задержек и выбирается локальное представление, т. е. вид функции, связывающей следующее значения ряда с xt+1 = f xt,a предыдущими: ( ), где a – вектор параметров представления.

Наиболее распространенный вариант – линейная аппроксимация (аппроксимация первого порядка), но используются еще два варианта: нулевого (аппроксимация константой) и второго порядков (аппроксимация полиномом второго порядка).

Затем производится выбор соседей – векторов, ближайших к последнему известному вектору в пространстве задержек (но не во времени). После этого производится оценка параметров представления исходя из известной динамики векторов-соседей. Оценив значения параметров аппроксимации, можно построить прогноз следующего значения ряда: xL+1 = f xL,. Индексом L ( ) обозначен последним известный (стартовый) вектор.

Для прогноза на несколько шагов обычно используются один из двух способов: итеративный и прямой. В работе предложен еще один способ – итеративный с пересчетом.

Итеративный способ состоит в последовательном построении прогноза на один шаг с добавлением его результата к исходным данным и повторным применением модели представления с параметрами, оцененными на первом шаге. Идея итеративного способа с пересчетом состоит в том, чтобы заново оценивать параметры представления на каждом шаге. Как показано в работе, это позволяет существенно повысить эффективность метода.

При прямом способе прогноза стартовый вектор и все его соседи остаются неизменными, а параметры представления оцениваются заново на каждом xL+t = f xL,(t). Здесь не требуется заново выбирать соседей и не шаге:

( ) происходит накопления ошибки за счет итераций.

Во второй главе на тестовых примерах дано предварительное качественное сравнение результатов получаемых при разных порядках аппроксимации при прогнозировании на один шаг вперед и разных способах аппроксимации при прогнозировании на большую длину.

Построению общей математической модели метода локальной аппроксимации и выбору оптимального варианта метода для условий конкретного временного ряда посвящена третья глава.

Предлагаемая в этой главе модель позволяет получить аналитической вид решения задачи прогноза методом LA. Исследование свойств этого решения позволяет выработать рекомендации по выбору способа прогноза (итеративный, итеративный с пересчетом, прямой) без проведения численных расчетов. Кроме того, на основе этого решения становится возможным изучение асимптотических свойств прогноза и критериев выбора порядка локальной аппроксимации.

Как показано в работе, уравнение LA любого порядка (локальное представление) может быть представлено в виде: xt+1 = a0 + xtT a, где a – обобщенный вектор коэффициентов – параметров модели.

Для оценки этих коэффициентов строится система уравнений Y= I a0 +Xa, где I1 – вектор из единиц, X – матрица соседей – транспонированный фрагмент матрицы задержек, состоящий лишь из одних соседей стартового вектора, а Y – вектор значений в которые переходят соседи стартового вектора за шагов. Требуется оценить параметры a0,a.

( ) Решение этой системы уравнений было получено с помощью метода наименьших квадратов (МНК). В результате была определена формула для прогнозируемого значения ряда: xL+ = Y + xT - X, где Y — среднее ( ) L значение вектора Y (вектор, совпадающий с результатом прогноза для нулевого порядка), X — вектор средних значений координат в матрице соседей X, т. е. «усредненный» сосед.

Как установлено в работе, прогноз, полученный методом локальной аппроксимации любого порядка, есть линейная комбинация прогноза нулевого порядка и отклонений стартового вектора от «усредненного» соседа. Отсюда можно сделать вывод, что поправка, обусловленная отклонением стартового вектора от «усредненного» соседа, корректирует неравномерность распределения соседей вокруг стартового вектора.

На основании общего аналитического решения были получены модельные уравнения прогноза для каждого из рассматривавшихся способов прогноза (итеративного, итеративного с пересчетом, прямого).

Было установлено, что итеративный вариант нулевого порядка дает аппроксимацию нулевого порядка, т. е. прогноз на любое количество шагов аппроксимируется значением прогноза на один шаг вперед. В то же время при прямом способе построения прогноза нулевого порядка сразу получается аппроксимация первого порядка, а при равномерном распределении соседей вокруг стартового вектора – второго порядка. Таким образом, при использовании прямого способа нулевого порядка прогноз тем точнее, чем ближе и равномернее относительно стартового вектора распределены соседи, тогда как итеративный способ подобен стоящим часам, которые иногда показывают точное время.

Для выбора оптимального способа прогнозирования на несколько шагов вперед были исследованы асимптотические свойства прогноза при итеративном и прямом способах прогноза. Установлено, что при прямой способ дает более приемлемые результаты, чем итеративный.

С той же целью была выполнена оценка ошибки прогноза, связанной с конечной точностью вычислений. Оказалось, что при итеративном способе экстраполяции ошибка не меньше, а, как правило, больше, чем при прямом.

Основным результатом проведенного сравнения стало установление факта, что наиболее универсальным методом при прогнозировании достаточно длинных стационарных нерегулярных временных рядов является прямой вариант LA нулевого порядка. С одной стороны, он может обеспечивать прогнозирование с величиной ошибки, убывающей пропорционально среднему квадрату отклонений соседей от стартового вектора. С другой стороны, расчет по этому методу является самым простым из всех рассмотренных. В случае ограниченного набора данных или их неравномерного распределения вокруг стартового вектора можно воспользоваться прямым вариантом LA первого порядка.

Представленные в третьей главе результаты численного сравнения подтвердили основные выводы, сделанные при анализе аналитического решения: из рассмотренных примеров следует, что для рядов, ограниченных по количеству исходных данных, в каждом случае лучшим оказался первый порядок аппроксимации.

При использовании различных способов прогноза худшие результаты получаются при итеративном способе. Итеративный способ с пересчетом дает в среднем результаты, сопоставимые по точности с прямым вариантом, однако реально он может применяться только в нулевом порядке, поскольку при использовании его старших порядков за счет погрешностей численных расчетов возможно появление неконтролируемых ошибок прогноза, значительно превосходящих среднее значение ряда.

В четвертой главе представлены результаты, полученные при использовании методов сингулярного спектрального анализа и локальной аппроксимации в обработке реальных временных рядов. Там также предложен способ подавления шума в обрабатываемом ряде и критерий автоматического выбора параметров локальной аппроксимации.

В качестве объекта исследований использовалась реальная последовательность чисел Вольфа, характеризующих солнечную активность.

Интерес к исследованию солнечной активности связан, кроме прочего, с заметной корреляцией пиков активности Солнца с проявлениями общественной активности. Достаточно отметить, что последние три максимума активности Солнца пришлись на 1979-1980, 1989 и 2000 годы. При этом даже весьма подробные модели не позволяют точно спрогнозировать момент и величину очередного пика активности Солнца.

Несмотря на сравнительно небольшую длину последовательности чисел Вольфа метод SSA позволил выявить ее компоненты, отвечающие уже известным солнечным циклам. В то же время SSA не позволяет точно оценить моменты наступления пиков активности (появления максимальных чисел Вольфа), хотя и дает при этом весьма точную оценку их величины. В целом можно сказать, что описанный метод SSA представляется достаточно эффективным и весьма перспективным методом предсказания динамики магнитной активности Солнца.

В случае сильно зашумленных временных рядов (к ним относятся почти все ряды внелабораторного происхождения) даже увеличение числа наблюдений не позволяет эффективно применять алгоритм LA, так как в этом случае высока вероятность появления большого количества ложных соседей и отсев соседей истинных.

Для целей обработки зашумленных временных рядов в работе предложено соединить оба рассмотренных метода (SSA и LA) в один, в котором SSA использовался бы только для фильтрации исходного временного ряда (подавления шума), а сам прогноз строится по методу LA.

Получившийся метод (SSA-LA) можно рассматривать как расширение метода LA, позволяющее применять его к сильно зашумленным временным рядам. В рамках этого метода для построения прогноза с учетом предшествующего анализа предложен прямой вариант LA первого порядка и SSA с центрированием.

Иллюстрация результатов применения этого метода при разных уровнях шума представлена на рис. 2. Исходя из этих результатов, можно ожидать, что предварительная SSA-фильтрация позволяет значительно повысить точность и устойчивость прогноза, получаемого методом LA. Причем такой результат не зависит от уровня шума, длины прогноза и системы, породившей исследуемый временной ряд.

IVa 0.IVb 0.E 0.IIIa IIIb 0.IIa IIb Ia Ib 0.020 40 60 80 Рис. 2. Ошибка прогноза методами LA (a) и SSA-LA (b) для уравнения Маккея-Гласса в зависимости от интервала прогнозирования в отсутствие шума (I) и при амплитудах шума 1.5% (II), 5% (III), 20% (IV). Медианное усреднение по стартовым точкам.

Основная техническая проблема, возникающая при прогнозировании реальных временных рядов методом LA (равно как и SSA) связана с выбором p размерности вложения и количества соседей. Для оптимизации выбора этих параметров в работе предложен критерий минимизации ошибок автопрогнозов соседей:

xs + - xs + () n n n= = min.

u p, - p Здесь для каждого значения размерности вложения из заданного интервала и каждого числа соседей из своего интервала оцениваются коэффициенты, задающие переход на шагов вперед. Затем по этим коэффициентам xs + = xL+ + xT - xT.

рассчитываются «будущие» значения соседей: () sn L n Окончательно выбирается тот набор соседей и размерность вложения, при которых достигается минимум величины.

u Применение предложенного критерия позволят определять параметры аппроксимации без эмпирического исследования различных вариантов прогноза, поэтому такой способ определения параметров может быть легко реализован программно и использоваться без необходимости визуального контроля, т.е. практически в автоматическом режиме.

Использование рассматриваемого критерия имеет еще два полезных приложения: возможность определения максимальной длины прогноза и возможность оценки числа соседей. При этом анализ найденных соседей может использоваться для выяснения характерного периода (если он есть) рассматриваемого временного ряда. Для этого достаточно проанализировать расстояния во времени между соседями.

Возможности алгоритма автоматического выбора параметров в методе локальной аппроксимации (автоLA) проиллюстрированы на тестовом и реальном примерах.

Результаты прогноза солнечной активности методами автоLA и SSA представлены на рис. 3. Черными кружками показаны реальные значения чисел Вольфа до середины 2004 года. Прогноз построен по данным до 1989 года.

Остальные значения использовались для проверки качества прогноза. Светлой линией на графике показан прогноз методом автоLA. Критерий определения максимальной длины прогноза показал, что дальше 1998 года прогноз автоLA не обоснован. Поэтому дальнейшие результаты, представленные лишь для сравнения с SSA, показаны штриховой линией. Сравнивая прогнозы LA и SSA можно отметить, что SSA точнее выделяет периодические составляющие и дает более точный долгосрочный прогноз для достаточно регулярных рядов (к которым относится и ряд чисел Вольфа), тогда как LA более эффективен для краткосрочных прогнозов.

Original data SSA (M=135, r=11) autoLA1 (p=6 auto(24), =18 auto(300)) 200.180.160.140.120.100.80.60.40.20.0.1990 1995 2000 2005 Год Рис. 3. Прогноз солнечной активности.

Числа Вольфа Заключение Методы и подходы, выдвинутые в рамках теории динамических систем, уже дано вышли за пределы самой дисциплины. Одним из важных направлений практического приложения теории динамических систем стали разработанные в ее рамках модели анализа временных рядов.

Основные результаты работы, которые выносятся на защиту.

1. Аналитически и на реальных данных изучены возможности и ограничения методов сингулярного спектрального анализа и локальной аппроксимации.

2. Разработана общая математическая модель метода локальной аппроксимации, на основе которой удалось выяснить существенные особенности получаемого решения задачи прогноза и предложить способ выбора варианта метода с учетом условий конкретной задачи и объема имеющихся данных.

3. Предложен способ предварительной фильтрации зашумленных временных рядов, позволяющий существенно повысить надежность прогноза.

Pages:     | 1 || 3 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»