WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


 

На правах рукописи

Мандрикова Оксана Викторовна

МНОГОКОМПОНЕНТНЫЕ МОДЕЛИ И АЛГОРИТМЫ АНАЛИЗА АНОМАЛЬНЫХ ГЕОФИЗИЧЕСКИХ СИГНАЛОВ

Специальность: 05.13.18 – математическое моделирование, численные

методы и комплексы программ

АВТОРЕФЕРАТ

диссертации на соискание ученой степени

доктора технических наук

Санкт-Петербург - 2009

Работа выполнена в Институте космофизических исследований и распространения радиоволн

Дальневосточное отделение Российской Академии наук (ИКИР ДВО РАН)

Официальные оппоненты:

доктор технических наук, профессор  Куприянов М.С.

доктор технических наук, профессор Нечаев Ю. И.

доктор технических наук, профессор Емельянов Г.М.

Ведущая организация – ОАО "Концерн "Океанприбор"

Защита диссертации состоится  "__" ______ 2009 г. в  часов  на  заседании  совета по защите докторских и кандидатских диссертаций Д 212.238.01 Санкт-Петербургского государственного электротехнического университета "ЛЭТИ" имени В.И. Ульянова (Ленина) по адресу: 197376, Санкт-Петербург, ул. Проф. Попова, 5.

С диссертацией можно ознакомиться в библиотеке университета.

Автореферат разослан "__" _________ 2009 г.

Ученый секретарь совета                         Пантелеев М.Г.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Настоящая работа посвящена разработке математических моделей для аналитического описания природных сигналов со сложной структурой и построению автоматизированных систем моделирования и прогноза на их основе. Наличие модели природного сигнала, несущего информацию об исследуемом процессе либо явления природы, значительно расширяет возможности их изучения, и позволяет решать задачу предсказания их поведения во времени. Наряду с другими методами исследований, анализ временных рядов систем геофизического мониторинга, регистрирующих вариации геофизических полей, имеет крайне важное значение для решения целого ряда фундаментальных научных задач физики атмосферы, ионосферы, магнитосферы, распространения радиоволн и практических задач обеспечения, в конечном счете, безопасной жизнедеятельности на Земле. На основе прямых экспериментальных данных и на основе соответствующих модельных построений этот подход позволяет получить количественную оценку процессам, формирующимся в той или иной геосфере. Эта тема лежит в общем русле работ фундаментальных научных исследований в области мониторинга и прогнозирования состояния атмосферы, гидросферы и литосферы и технологии снижения риска и уменьшения последствий природных и техногенных катастроф.

  Состояние среды является суперпозицией очень большого количества взаимодействий между различными процессами и перед исследователем стоит задача найти способ уменьшить размерность системы и выявить структурные компоненты, наиболее полно описывающие исследуемый природный процесс. В настоящее время наблюдается  рост сети станций регистрации геофизических сигналов и вследствие чего возникновение больших массивов статистических данных, развиваются методы их анализа. Это позволяет на принципиально новом уровне решить данную проблему.

В диссертации в первую очередь рассматривается класс задач, связанных с обнаружением и классификацией аномальных эффектов в сигналах регистрации геофизических параметров. Аномальное поведение регистрируемых сигналов может содержать резкие всплески, сопровождаться серией пиков, иметь ступенеобразный вид. Относительная величина и временная протяженность таких аномалий зависит от многих факторов. Эти аномальные особенности содержат полезную информацию об изучаемом процессе и должны быть отображены в модели. Сложная структура возникновения аномалии, а также наличие мешающих факторов различной природы делают невозможным непосредственное применение к ним существующих регрессионных и других статистических моделей временных рядов. Естественным и наиболее эффективным способом представления таких сигналов является построение нелинейных адаптивных аппроксимирующих схем на основе экстраполирующих фильтров. Инструментом, позволяющим реализовать такую процедуру для сигналов с подобными особенностями, является вейвлет-преобразование. В настоящее время ведутся интенсивные исследования по применению этого метода в различных прикладных задачах, связанных с анализом сложных сигналов, возникающих в физике, медицине, финансовом анализе и др. областях. Несмотря на то, что данный метод в последнее время имеет распространение при обработке сигналов в геофизике, общей теории по применению этого аппарата в анализе регистрируемых природных сигналов нет. Данная диссертация восполняет ряд пробелов в этой области. Вейвлет-преобразование в работе является инструментом, лежащим в основе построения моделей сигналов со сложной структурой. Расширяя область традиционных методов моделирования, в диссертационной работе введены математические конструкции, позволяющие построить адаптивную многокомпонентную модель сигнала с учетом внутренней структуры исходных данных и выполнить отображение как характерных, так и изолированных особенностей его структуры. Это играет важную роль в задачах анализа сложных природных сигналов в геофизике, физике, геоэкологии и др. областях. Способы идентификации предложенных моделей основаны на совместном применении моделей авторегрессии-проинтегрированного скользящего среднего и методов нейронных сетей с вейвлет-преобразованием.

Цель работы  заключается в разработке математических моделей для аналитического описания природных сигналов со сложной структурой, включающей локальные особенности различной формы и временной протяженности. Сигналы с такими особенностями имеют место в геофизике, физике, медицине, теории управления, финансовом анализе и др. областях.

Проведенные в работе исследования привели к созданию класса моделей, в основе которых лежит математическая конструкция, названная многокомпонентной моделью временного ряда, представляющая исходный временной ряд в виде разномасштабных компонент с различной формой и временной протяженностью. На основе данной конструкции построена общая теория построения модели временного ряда со сложной структурой. Разработаны методы идентификации и оценки моделей, описаны их свойства. Также разработан комплекс методов и алгоритмов обработки данных, основанный на предложенных моделях и служащий теоретической базой для построения автоматизированных систем анализа статистических данных и выполнения прогноза.

При этом решены следующие задачи:

  1. Разработана новая математическая конструкция – многокомпонентная модель временного ряда (ММВР), позволяющая идентифицировать локальные особенности различной формы и временной протяженности в структуре сложного сигнала.
  2. Разработаны способы идентификации ММВР для сигналов со сложной структурой, обеспечивающие выделение существенных компонентов структуры сигнала и эффективное вейвлетное подавление шума.
  3. Разработаны методы оценки параметров ММВР, основанные на совмещении методов авторегрессии-проинтегрированного скользящего среднего (АРПСС) и методов нейронных сетей с вейвлет-преобразованием.
  4. Разработаны численные методы и алгоритмы выявления и классификации изолированных особенностей в структуре сигнала и идентификации устойчивых характеристик временного ряда
  5. Построенный аппарат применен к исследованию геофизических сигналов с широким спектром флуктуаций различных масштабов.
  6. Предложено использование построенного аппарата для оценки плотности распределения случайной величины.
  7. Разработано  программное обеспечение для автоматического обнаружения и классификации локальных аномальных особенностей в геофизических сигналах на базе ПЭВМ.

Методы исследований. В развитых автором подходах использовались классические работы по теории вейвлетов, опубликованные на рубеже 90х S. Mallat, L.K. Meyer, D.J. Lemarie, I. Daubechies,  R.R. Chui и др., работы отечественных авторов, работы Donoho D. по минимаксным оценкам сигнала в смеси с шумом. В диссертационной работе также использовался аппарат теории случайных процессов, теории цифровой обработки сигналов, теории распознавания образов, теории построения математических моделей, методы вычислительной математики, основы функционального анализа. С целью проверки эффективности новых результатов и синтезируемых на их основе алгоритмов обработки данных, в среде МАТЛАБ выполнялись расчеты, и проводилось математическое моделирование с использованием реальных и модельных сигналов.

Научная новизна состоит в создании и исследовании класса моделей природных сигналов со сложной структурой, в основе которого лежит многокомпонентная модель временного ряда, представляющая исходный сигнал в виде разномасштабных компонент с различной формой и временной протяженностью, в частности:

  1. На основе нелинейных аппроксимирующих схем разработаны методы идентификации структурных компонентов природного сигнала, содержащего изолированные особенности различной формы и временной протяженности. В качестве пространства-образа сигнала определено пространство вейвлет-коэффициентов, обеспечивающее отображение разномасштабных структурных компонентов сигнала в элементы модели. В качестве базовых конструкций, используемых для построения отображения, определены кратномасштабный анализ и вейвлет-пакеты.
  2. Разработаны методы выделения устойчивых характеристик структуры сигнала и изолированных особенностей.
  3. Разработаны численные методы и алгоритмы построения наилучшей аппроксимирующей схемы сложного природного сигнала, обеспечивающие выделение существенных компонентов структуры сигнала и эффективное вейвлетное подавление шума.
  4. Предложен способ оценки многокомпонентной модели временного ряда на основе минимаксного подхода, разработаны способы диагностики и оптимизации модели.
  5. Разработаны два способа оценки параметров модели сигнала: первый основан на совмещении методов АРПСС и вейвлет-преобразования – позволяет выполнить оценку параметров модели в случае, когда компоненты сигнала имеют линейную структуру; второй базируется на совмещении методов нейронных сетей и вейвлет-преобразования – позволяет построить аппроксимирующую функцию частного вида на дискретном множестве значений в случае, когда структура компонент сигнала существенно нелинейная.

А также:

  1. На основе построенной аппроксимирующей схемы сигнала разработана техника идентификации характерных элементов структуры сигнала и выделения редковстречающихся особенностей.
  2. Разработаны способы классификации выделенных локальных особенностей в структуре сигнала.
  3. Впервые предложен метод оценки плотности распределения случайной величины на основе вейвлет-преобразования.

  Научная и практическая ценность работы заключается в том, что:

  1. созданы теоретические основы построения моделей сложных природных сигналов, содержащих локальные особенности различной формы и временной протяженности;
  2. разработаны конкретные модели природных сигналов;
  3. предложенный автором метод выделения изолированных особенностей в структуре сигнала стал заметным вкладом в компьютерные методы анализа сложных геофизических сигналов, применяемые в различных лабораториях;
  4. разработанные автором способы классификации локальных особенностей в структуре сигнала используются в программном обеспечении по обработке данных регистрации подпочвенного радона и сигнала критической частоты f0F2;
  5. на основе предложенных автором алгоритмов автоматического обнаружения  изменения параметров модели построены системы по обработке ионосферных данных;
  6. разработанный автором метод оценки плотности распределения случайной величины на основе вейвлет-преобразования нашел применение в обработке данных регистрации сейсмического каталога и позволил выявить аномальные изменения в распределении сейсмических событий по глубине накануне сильных землетрясений на Камчатке;
  7. проведены экспериментальные  исследования  разработанных методов и алгоритмов на  реальных  и модельных сигналах, подтвердившие их эффективность при обработке сигналов со сложной структурой; 
  8. разработанные методы значительно расширяют область применения традиционных методов анализа сложных сигналов, они позволяют идентифицировать те особенности структуры сигнала, которые не попадают в область этих методов, и могут быть использованы для широкого круга задач, в которых  необходим анализ сигналов со сложной структурой.

Результаты научных исследований, выполненные автором и представленные  в пунктах 1-5,  включены в важные научные достижения ДВО РАН в период 2005 – 2007 гг. 

Научные положения, выносимые на защиту:

1. Теоретические и методические основы построения многокомпонентной модели сложного природного сигнала, содержащего изолированные особенности различной формы и временной протяженности.

2. Численный метод построения наилучшей аппроксимирующей схемы сложного сигнала, лежащий в основе построения многокомпонентной модели.

3. Способ оценки параметров многокомпонентной модели сигнала на основе совмещения конструкции вейвлет-преобразования и регрессионных методов.

4. Способ оценки параметров многокомпонентной модели на основе совмещения конструкции вейвлет-преобразования и методов нейронных сетей.

5. Численные методы и алгоритмы классификации выделенных изолированных особенностей в структуре сложного сигнала.

6. Методики идентификации моделей природных сигналов применительно к задаче выделения и классификации аномальных особенностей в их структуре.

7. Метод оценки плотности распределения случайной величины на основе вейвлет-преобразования.

Внедрение результатов работы.

Работа выполнялась в рамках:

  1. Договора о научно-техническом сотрудничестве между Институтом вулканической геологии и геохимии ДВО РАН  с одной стороны, Камчатским государственным техническим университетом, с другой стороны, и Санкт-Петербургским государственным электротехническим университетом, с третьей стороны по теме “Разработка алгоритмов и методов выделения средне и краткосрочных предвестников сильных землетрясений Петропавловск-Камчатского геодинамического полигона по данным геохимического мониторинга”. Тематика работы связана с программой ГНТП №16 «Безопасность населения и народно-хозяйственных объектов с учетом риска возникновения природных и техногенных катастроф», программа Президиума РАН «Изменение окружающей среды и климата: природные катастрофы».
  2. Договора о научно-техническом сотрудничестве между Институтом космофизических исследований и распространения радиоволн ДВО РАН  с одной стороны и Санкт-Петербургским государственным электротехническим университетом, с другой стороны. Тематика работы связана с программами фундаментальных исследований Президиума РАН и находятся на пересечении трех направлений: научная программа № 18 «Теплофизика и механика интенсивных энергетических воздействий» в части «Солнечный ветер: генерация и взаимодействие с Землей и другими планетами», научная программа № 13 «Изменение окружающей среды и климата: природные катастрофы» и программа №30 «Солнечная активность и физические процессы в системе Солнце-Земля».

  Работа была поддержана грантом РФФИ №02-05-64467 «Выявление среднесрочных и краткосрочных предвестниковых аномалий перед сильными землетрясениями южной Камчатки с М>6 в вариациях динамики подпочвенного радона, водорода и пространственно – временных характеристик сейсмичности», грантом РФФИ для студентов, аспирантов и молодых ученых №03-05-06453а, грантом ДВО РАН №05-3-В-02-76 «Исследование механизмов ионосферного и литосферного взаимодействия», грантом ДВО РАН №06-3-В-02-059  «Исследование механизмов формирования вероятностной структуры распределения сейсмических событий на основе статистической модели сейсмического режима Камчатского региона».

Научные результаты и разработанное программное обеспечение внедрены в лаборатории ИКИР ДВО РАН, г. П.-Камчатский, а также используются в учебном процессе при проведении лабораторных и курсовых работ по курсу «Системы цифровой обработки сигналов», «Моделирование систем» для студентов специальностей «Управление и информатика в технических системах» и «Программное обеспечение вычислительной техники и автоматизированных систем» в КамчатГТУ.

Апробация полученных результатов. Основные  положения и результаты работы докладывались и обсуждались на научно-технических конференциях КамчатГТУ в 2000-2008 гг.; на Всероссийской научной конференции "Проектирование научных и инженерных приложений в среде Matlab".- Москва: ИПУ РАН 2002г; на Международной научно-практической конференции “Рыбохозяйственное образование Камчатки в XXI веке”. - Петропавловск-Камчатский, 15-16 октября 2002 г.; на Международной конференции по мягким вычислениям и измерениям, - С.-Петербург, 2003, 2005-2008 г.г.; на III международной конференции «Солнечно-земные связи и электромагнитные предвестники землетрясений», -П.-Камчатский, 2004г.; на IV международном совещании «Солнечно-земные связи и предвестники землетрясений», с. Паратунка , Камчатский р-он, 2007г.; на 8ой международной конференции «Pattern recognition and image analysis: new information technologies», Йошкар-Ола, 2007г.; на 10ой международной научной конференции «Проблемы эволюции открытых систем», Казахстан, Алматы, 2008г.; на 5ой научной конференции «Управление и информационные технологии», (УИТ-2008), Санкт-Петербург, 2008г.

Материалы диссертации докладывались на семинарах в институте вулканической геологии и геохимии ДВО РАН (П.-Камчатский); институте космофизических исследований и распространения радиоволн ДВО РАН (П.-Камчатский).

Публикации. По теме диссертации опубликовано 37 печатных работ, из них - 17 статей  (9 статей, рекомендованных в Перечне ВАК Минобрнауки России),  18 докладов на международных и всероссийских научно-технических конференциях и 2 монографии. 2 статьи, определенные ВАК, находятся в печати.

Структура и объем диссертации. Диссертация состоит из введения, шести глав, заключения и списка литературы, включающего 134 наименования и 3 приложения. Основная часть работы изложена на 270 страницах машинописного текста и содержит 91 рисунок  и 18 таблиц.

СОДЕРЖАНИЕ И ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

Во введении показана и обоснована актуальность работы, сформулированы основные цели и задачи, научная новизна и практическая ценность диссертационной работы.

Первая глава посвящена анализу основных подходов к построению модели временного ряда и постановке задачи. Приведены традиционные стохастические методы с указанием имеющихся недостатков и рассмотрен способ построения модели временного ряда с использованием нейронных сетей. Выполнен анализ современных методов аппроксимации сигналов, основанных на разложении функции по базису. Приводятся аргументы в пользу того, что нелинейные аппроксимирующие схемы в базисе вейвлетов является наиболее эффективным методом, позволяющим решить поставленную задачу. Введена новая математическая конструкция – многокомпонентная модель временного ряда, позволяющая выявить и исследовать те особенности структуры данных, которые не попадают в область традиционных методов.

Предметом исследований являются природные сигналы, которые содержат изолированные аномальные особенности различной формы и временной протяженности, возникающие в случайные моменты времени. Примером являются сигналы регистрации геофизических параметров, которые включают в себя различного характера аномальные эффекты, возникающие накануне сейсмических явлений, связанные с активностью Солнца и другими процессами различной природы. Время появления и интенсивность этих аномалий является полезной для исследователей информацией. Выделение аномалий в вариациях геопараметров является сложной задачей и сталкивается с серьезными трудностями. Это связано с большим  разнообразием и достаточно сложной формой аномалий и с отсутствием адекватных математических моделей. Анализ основных подходов к построению модели геофизических данных показывает, что традиционно для решения данной задачи применяют процедуру сглаживания, которая позволяет отфильтровать шум и  выделить регулярную составляющую. Причем регулярная составляющая рассматривается двух видов: либо тренд, либо сезонная составляющая. В случае отсутствия теоретических обоснований предположения о том, что поведение данных описывается некоторым полиномом, модель тренда теряет смысл. В области экстраполяции доверительные границы для построения оценки быстро расходятся и довольно сильно отклоняются от найденного полинома. Популярным методом анализа временных рядов также является метод авторегрессии-проинтегрированного скользящего среднего. Практика подтвердила его мощность и гибкость при решении многих прикладных задач. Но он тоже имеет ограничения как на возможность его использования для отдельных временных рядов, так и на выявляемые при этом закономерности. Допущение, что временной ряд может быть описан линейным стохастическим дифференциальным уравнением, не позволяет учитывать некоторые характеристики структуры данных, и влечет потерю и искажение важной информации. Недостатком перечисленных методов, по отношению к решаемой задаче, также является предположение, что сигналы имеют нормальное распределение, которое не всегда оправдано. Методы оценки параметров модели, а также ее диагностика и оптимизация полностью базируются на этом предположении, что автоматически исключает возможность отображения в модели изолированных локальных особенностей и делает непосредственное применение перечисленных методов неэффективным для решения поставленной задачи. Получающие развитие в настоящее время современные методы обработки сигналов, такие как вейвлет-преобразование и методы нейронных сетей, хотя и позволяют частично справиться с данной проблемой, но отсутствие общей теории по их применению для природных сигналов с подобными особенностями не дает возможность в полной мере использовать их аппарат.

Предложено представление сигнала в виде разномасштабных компонент с различной структурой:

  .  (1)

  Когда коэффициенты коррелируют между собой, вывод о том, какие аппроксимирующие функции использовать, сделать достаточно трудно. Естественным путем решения является представление сигнала в виде ортонормированных компонент:

  ,.  (2)

  Поскольку функции в (1) имеют разную структуру, подверженную изменению в случайные моменты времени, наиболее эффективным способом их идентификации является применение методов аппроксимации, основанных на разложении функции по базису:

  (3)

где,   –  базисные функции пространства  . 

  С целью возможности построения моделей, адаптирующихся к структуре сигнала, автором предложено использовать здесь нелинейные аппроксимирующие схемы. В этом случае приближение выполняется M векторами, зависящими от структуры сигнала:

, (4)

где - множество индексов, определяемое свойствами функции .

  Конструкция (1) с учетом свойств (2) - (4) названа многокомпонентной моделью временного ряда.

Учитывая локальный характер анализируемых особенностей, их разномасштабность и разнообразие по форме, наиболее подходящим пространством для их представления является пространство, натянутое на базис смещенных функций или вейвлет-базис. Вейвлет-коэффициенты

, – ортонормированный вейвлет-базис,

рассматриваются как результат отображения в пространство с разрешением .

Предложенный подход к построению модели временного ряда со сложной структурой и использование вейвлет-преобразования в качестве метода идентификации его структурных компонентов предоставляет широкие возможности в задачах анализа природных сигналов. Некоторые общие вопросы и методы построения моделей природных сигналов на основе нелинейных аппроксимирующих схем в вейвлет-базисе подробно рассмотрены в монографиях [20, 31].

Задача исследования состоит в разработке

  1. теоретических и методических основ построения многокомпонентной модели сложного природного сигнала;
  2. численных методов и алгоритмов построения аппроксимирующей функции для сигнала с описанной структурой на основе нелинейной аппроксимирующей схемы в базисе вейвлетов;
  3. методов оценки модели;
  4. алгоритмов автоматического обнаружения изменения параметров модели применительно к задаче обнаружения аномального поведения геофизических компонентов;
  5. методов и алгоритмов классификации выделенных аномальных особенностей;
  6. методик построения модели природного сигнала на основе разработанного аппарата.

Во второй главе, основываясь на понятиях вейвлет-преобразования, автор определяет в качестве базовых конструкций, используемых для построения многокомпонентной модели сигнала - кратномасштабный анализ (КМА) и вейвлет-пакеты (ВП). Предложены критерии выбора базиса, обеспечивающие построение наилучшей аппроксимирующей схемы (НАС) сигнала, лежащей в основе построения многокомпонентной модели и обеспечивающей выделение существенных компонентов структуры сигнала. Разработаны способы идентификации устойчивых характеристик структуры сигнала и изолированных особенностей. Разработаны численные методы и алгоритмы построения НАС сигнала.  Предложены методы диагностики и оптимизации полученной аппроксимирующей схемы сигнала.

  В утверждении 1 диссертационной работы доказано, что конструкция дискретного вейвлет-преобразования (ДВП), осуществляет разложение функции на ортогональные компоненты  и обеспечивает выполнение условия (2) ММВР, при условии, что , где - коэффициенты вейвлет-разложения.

Случайный сигнал представляет зависимость

,

где - истинное значение измеряемой величины, - ошибки измерений.

Вейвлет-образ случайной функции определен как

,, – базисный вейвлет.

  Показано, что компоненты модели (1) в пространстве вейвлет-образов имеют вид

.

тогда вейвлет-образ функции определяется как

где .

  Используя утверждение 1, доказано, структурные компоненты сигнала с шумом, принадлежащего пространству с разрешением

,

отображаются в компоненты ММВР вида

, где ,

  Показано, на основе процедуры КМА, случайный сигнал в пространстве вейвлет-образов может быть представлен в виде:

  ,  (5)

где , , , – белый шум, , , .

  Каждая компонента (5) единственным образом определяется последовательностями  коэффициентов , и : , и .

  Этот способ идентификации компонентов модели (1) назван в работе конструкцией 1-го типа.

  Конструкция 1-го типа построена на предположении, что полезная информация о сигнале находится в низкочастотной его составляющей. В случае необходимости идентификации различных типов частотно-временных структур более эффективным методом является конструкция вейвлет-пакетов (ВП).

  В работе показано, аналогично конструкции 1-го типа, процедура разложения сигнала по базисам ВП позволяет идентифицировать компоненты ММВР. На основе  конструкции ВП случайный сигнал имеет представление:

,  (6)

где , , – пространства вейвлет-пакета.

  Каждая компонента (6) единственным образом определяется последовательностями  коэффициентов  , и : , и .

Эта процедура идентификации компонентов ММВР названа в работе конструкцией 2-го типа.

  Методы выделения изолированных особенностей в структуре сигнала  построены на основе теоремы Жаффара. Используя эту теорему, в работе доказано утверждение 2:

Для случайной функции , имеющей вид (6), при уменьшении масштаба абсолютные значения коэффициентов , определяющих компоненту , являются малыми за исключением окрестностей, содержащих изолированные особенности структуры сигнала.

Постепенное уменьшение масштабного параметра позволяет фокусироваться на локальных структурах сложного сигнала и исследовать его структуру. Для каждого компонента дает локализованную частотно-временную информацию об в -й октаве (частотном диапазоне).

Метод выделения устойчивых характеристик в структуре случайного сигнала базируется на анализе компоненты . Скалярные произведения функции с функциями эквивалентны выполнению операции свертки с фильтром высоких частот. Когда функция имеет нулевых моментов и , то для вблизи

.

Получаем, что в компоненте сигнала мы имеем приближение аппроксимируемой функции с разрешением . Изолированные особенности структуры случайного сигнала отображаются в пространства и . Автокорреляционная функция от определяется как

,

где – автокорреляционная функция компоненты.

  Следовательно, коэффициенты , соответствующие компоненте , содержат устойчивые характеристики структуры сигнала.

Вейвлет-преобразование предоставляет широкий спектр базисных функций, но качество обработки, определяется их свойствами. Решение проблемы выбора базисной функции является нелегким. В зависимости от задачи возможны различные способы формирования критериев.

С целью обеспечения численно устойчивых разложений сигнала, в диссертации, в качестве первого критерия, определено условие:  является функцией.

Решая задачу аппроксимации сигнала в базисе ортогональных функций в качестве следующих критериев логично определить:

  1. минимизацию числа аппроксимирующих слагаемых;
  2. минимизацию погрешности аппроксимации.

Минимизация числа аппроксимирующих слагаемых и минимизация погрешности аппроксимации достигается на основе выбора вейвлет-базиса, обеспечивающего как можно большее число вейвлет-коэффициентов , которые являются пренебрежимо малыми. Нелинейная аппроксимирующая схема, удовлетворяющая этим требованиям, определена в работе как наилучшая аппроксимирующая схема (НАС).

  Показано, в этом случае определяющими, при выборе семейства базисов, будут характеристиками: гладкость, размер носителя, число нулевых моментов.

  Предложена методика построения НАС сигнала, включающая операции:

1. удаление шума;

2. выбор  базиса;

3. идентификация структурных компонентов сигнала.

  В основе данной методики лежит следующий численный алгоритм:

  1. построение полного дерева разложения: ,  есть  базис пространства ;
  2. определение ветвей дерева, соответствующих структурным компонентам сигнала путем выбора «наилучшего» базиса: «наилучший» базис пространства   есть базис

,

где множества  индексов определяются следующим образом:

индекс , порог .

Доказано, выделенные, на основе этих операций, детализирующие вейвлет-коэффициенты соответствуют изолированным особенностям структуры сигнала и определяют компоненты ММВР, а вейвлет-коэффициенты аппроксимирующей компоненты сигнала соответствуют устойчивым характеристикам его структуры и определяют компоненту ММВР.

    1. Оценка модели в диссертационной работе выполняется на основе минимаксного подхода. Сигнал оценивается преобразованием зашумленных данных с помощью оператора решения . Результирующая оценка есть

.

Погрешность оценки составляет

.

Минимаксный риск – это нижняя граница, вычисленная по всем линейным и нелинейным операторам :

.

Оптимизация оценки выполняется в работе путем улучшения порога на основе алгоритма НОРШ-порога.

Также в работе предложен метод оптимизации модели путем определения наилучшего базиса. Определение наилучшего базиса основывается на результатах работы  S. Mallat. Оценка получается пороговой обработкой разложения сигнала длины в базисе , :

,

где –  пороговая функция.

Идеальный базис –  это такой, который минимизирует погрешность оценки

Тогда, оценив погрешность в каждом базисе , логично определить в качестве наилучшего базиса тот, который ее минимизирует.

В основе метода диагностики модели лежит естественное предположение, что полезные составляющие сигнала более скоррелированы, чем случайные возмущения. Когда возрастает, есть вероятность, стремящаяся к 1, что

.

Корреляция сигнала с базисом определяется как

.

.

  Тогда диагностика модели может быть построена на проверке условия:

,

где – множество векторов из , для которых не выполнено условие , - их количество.

В третьей главе описаны методы оценки параметров ММВР на основе совместного применения вейвлет-преобразования и модели АРПСС. Расширяя область традиционных методов анализа временных рядов, автором предложена новая математическая модель, представляющая собой линейную комбинацию составляющих двух видов: детализирующую и аппроксимирующую. Детализирующая составляющая модели аппроксимирует изолированные особенности в структуре сигнале. Методы оценки параметров данной составляющей основаны на вейвлет-теории. Аппроксимирующая составляющая содержит устойчивые  характеристики структуры сигнала, оценка которых основана на методах АРПСС. Разработаны численные методы и алгоритмы идентификации новой модели, описаны ее свойства.  Предложены методы автоматического обнаружения и классификации аномальных особенностей в структуре сложного сигнала, основанные на введенной математической конструкции. 

Модель (6) может быть представлена в виде линейной комбинации составляющих двух видов:

,

где , , ,, – множество индексов, определяемое свойствами функции .

Компоненты , соответствующие составляющей модели, являются детализирующими и включают в себя приращения порядка . Данная составляющая нацелена на выделение изолированных особенностей в структуре сигнала. Методы выделения и классификации этих особенностей  основаны в работе на анализе наибольших абсолютных значений коэффициентов , которые определены в качестве параметров составляющей модели.

Для оценки параметром сглаженной компоненты модели в работе предложены методы АРПСС.

Общий вид модели сигнала, получаемый на основе совместного применения конструкции вейвлет-преобразования и методов АРПСС, имеет вид:

,

где  , – множество индексов, определяемое свойствами функции ; – коэффициенты авторегрессии, ,

Эта модель названа в работе вейвлет-преобразование авторегрессия (ВПАР).

Показано, совместное применение методов вейвлет-преобразования и модели АРПСС обеспечивает выполнение следующих важных свойств:

  • позволяет выделить изолированные особенности в структуре сигнала и идентифицировать их на основе вейвлет-преобразования;
  • позволяет выделить стационарные характеристики временного ряда и идентифицировать их на основе модели АРПСС;
  • обеспечивает понижение порядка модели АРПСС.

Таким образом, предложенная конструкция – ВПАР не только расширяет область использования класса моделей АРПСС, но и улучшает свойства результирующей АР-модели. Этапы идентификации модели ВПАР могут быть представлены в виде схемы, показанной на рис. 1.

Рис. 1. Этапы идентификации модели вейвлет-преобразование авторегрессия.

Формальная постановка задачи обнаружения и классификации аномальных особенностей в сигнале следующая:

Пусть дана случайная последовательность значений функции , обладающая набором свойств. Предположим, что в момент времени последовательность меняет одно (или несколько) из своих свойств. Наблюдая , необходимо:

  • обнаруживать момент изменения свойств ;
  • классифицировать вид особенности и ее временную протяженность;
  • формулировать заключение о поведении объекта исследования.

  Методы обнаружения и классификации высокочастотных аномальных особенностей в сигнале построены на  обработке детализирующие составляющей модели:

1. Обнаружение аномалии:

1.1. на каждом уровне детализации сохранение коэффициентов , абсолютные значения которых превышают пороговое значение : , если ;

1.2. в случае выполнения условия:

,

где – порог, определяющий наличие аномалии в сигнале, – пределы временного окна,

в момент времени имеем аномалию;

2. Классификация особенности:

2.1. по виду: на каждом уровне детальности для аномальной точки определяется гладкость Липшица по максимальному наклону как функции ;

2.2. по энергии: на каждом уровне детальности производится расчет энергии в пределах скользящего временного окна:

,

где – пределы временного окна;

2.3. по масштабу: для всех уровней детальности производится расчет общей энергии в пределах скользящего временного окна:

,

где – пределы временного окна;

Методы обнаружения и классификации аномальных особенностей в сигнале, соответствующих длительным периодам времени, построены на  обработке сглаженной составляющей модели:

   Пусть дана последовательность значений функции . Рассмотрим следующие гипотезы:

  • порождаются – образуют конечное число изолированных точек наблюдаемой последовательности;
  • порождаются порождаются моделью ;
  • порождаются моделью порождаются моделью порождаются моделью , где – семейство моделей, параметризованных вектором .

  В случае выполнения гипотезы дополнительной задачей становится задача определения моментов времени . В случае выполнения гипотезы помимо оценки времени изменения возникает задача определения . Поскольку  обработка данных предполагается по мере их поступления, мы можем ограничиться рассмотрением гипотез .

  Для получения оценки времени изменения в случае обработки блоков данных  разумнее всего применять метод максимального правдоподобия.  В соответствии с идеей Е.С. Пейджа проверяются гипотезы , состоящие в том, что , где – момент изменения свойств процесса. Вероятность ошибочной классификации будет минимальной, если гипотеза принимается при выполнении условия

,

где  – функция правдоподобия, соответствующая гипотезе , – плотность распределения  наблюдений . Все значения предполагаются равновероятными. Оценка получается заменой неизвестной  величины оценкой максимального правдоподобия. Применительно к  модели АРСС имеем:

В случае гауссовской модели, следуя Боксу и Дженкинсу, имеем:

где – ковариационная матрица последовательности авторегрессии, – матрица квадратичной формы нормального закона.

  Общая схема решения задачи обнаружения и классификации аномальных особенностей в сигнале на основе модели вейвлет-преобразование  авторегрессия представлена на рис.2.

Рис. 2. Схема решения задачи обнаружения и классификации аномальных эффектов в сигнале на основе конструкции ВПАР.

Четвертая глава посвящена описанию методов оценки параметров ММВР на основе совместного применения вейвлет-преобразования и методов нейронных сетей (НС). Предложена новая математическая модель – вейвлет-преобразование нейронная сеть (ВПНС), позволяющая идентифицировать многокомпонентную модель сигнала, в случае, когда компоненты вейвлет-преобразования имеют нелинейную структуру.  Синтезируются методы и алгоритмы формирования обучающего и тестового множеств для обучения НС, обеспечивающие адекватность модели для сигналов со сложной структурой.

В случае, когда для  временного ряда сложной структуры идентифицировать модель общего вида не представляется возможным, стоит задача аппроксимации частного вида функций, принимающих дискретное множество значений.  Существенная особенность НС состоит в том, что вид аналитической зависимости между переменными находится в процессе обучения сети. Показатели качества отображения во многом определяются характеристиками обучающего множества. В работах большинства авторов основное внимание уделено выбору архитектуры  и способу обучения сети, а этап предобработки рассматривается, к сожалению,  только в контексте решаемой задачи. Авторы этих работ не учитывают, что задача предобработки данных определяет не только конечный результат, но и влияет на все остальные этапы разработки НС. Удаляются избыточные и шумовые данных, понижается размерность пространства признаков, следовательно, сокращается размерность обучающего множества, упрощается архитектура сети и сокращается время ее обучения.

В диссертационной работе предложены следующие методы формирования обучающего и контрольного множеств:

  1. понижение размерности пространства признаков на основе удаления шумовой компоненты;
  2. выделение характерных особенностей структуры сигнала;
  3. устранение несущественных и редковстречающихся признаков.

  Первая процедура базируется на построении НАС сигнала  и применению операции вейвлет-фильтрации. Для реализации второй процедуры общий массив данных  делится на блоков длины :

.

  Далее выполняется отображение каждого блока  данных в пространство вейвлет-образов:

,

где –  номер блока, . 

Каждая выделенная компонента сигнала определяет подпространство пространства признаков сигнала: , . Компоненты, из которых далее будет сформирована обучающая выборка, определяются следующим образом: сравниваются структуры , соответствующие различным блокам данных : компонента является характерной для сигнала, если она выделена в каждом блоке , т.е. . Последовательный анализ узлов дерева вейвлет-пакета снизу вверх на основе этой методики позволяет определить характерные для аппроксимируемого сигнала компоненты.

Устранение несущественных и редковстречающихся признаков выполняется на основе анализа выделенных компонент сигнала : для каждой компоненты выполняется анализа гистограмм вейвлет-коэффициентов, построенных по данным всех блоков. Признак считается редковстречающимся и несущественным, если плотность вероятности в соответствующей точке пространства меньше, чем некоторое наперед заданное число . Для устранения такого признака вейвлет-коэффициенты, которые попадают в окрестность этих точек, заменяются нулями.

  Предложенные методы выделяют информативные составляющие сложной функции с учетом ее внутренней структуры и не нарушает вероятностную структуру исходных данных.

  Полученные на основе описанных процедур реконструированные сигналы :

,

где , – множество существенных признаков,

аппроксимируются нейронной сетью. Изолированные особенности сигнала отображаются в детализирующую компоненту модели. Общий вид модели временного ряда, получаемый на основе совместного применения конструкции вейвлет-преобразования и методов НС, имеет вид:

,

где– функция активации НС, – весовые коэффициенты НС, – коэффициенты вейвлет-преобразования, – вейвлет-базис, , – множество существенных признаков, - детализирующие коэффициенты вейвлет-преобразования, , – множество изолированных  особенностей сигнала, превышающих пороговое значение , – вейвлет-базис.

  Полученная модель названа в работе моделью вейвлет-преобразование нейронная сеть (ВПНС). Этапы ее идентификации представлены на рис. 3.

Рис. 3. Этапы идентификации модели сигнала на основе совместного применения конструкции вейвлет-преобразования и методов НС.

В качестве приложения вейвлетов к обработке экспериментальных данных в пятой главе рассматривается метод оценки плотности распределения случайной величины на основе вейвлет-преобразования.

  Оцениваемая функция представлена в виде:

,

где – шум, - гистограмма, построенная на основе выборки.

  Функция оценивается преобразованием с помощью оператора решения . Результирующая оценка есть

.

  Наша цель – это минимизация погрешности оценки. Оптимизация оператора зависит от априорной информации, имеющейся в нашем распоряжении. Освободившись от предположения о нормальности можно использовать минимаксную процедуру.

  В работе, в качестве аппроксимирующей функции, рассматривается нелинейная аппроксимирующая схема. В этом случае, используя метод вейвлет-преобразования,  на основе обширного словаря ортонормированных вейвлет-базисов мы имеем возможность подобрать функции, обеспечивающие наилучшую оценку функции .

Процедура выделения структурных составляющих функции выполняется на основе пороговой функции.

Оценка погрешности вычисляется по зашумленным данным и оптимизируется минимизацией . 

Если

,

где , – вейвлет-базис,

то пороговая обработка делает этот коэффициент равным нулю, что приводит к погрешности равной.

Так как

,

то можно оценить с помощью .

  Если , то погрешность равна энергии шума. Она оценивается величиной  . 

  Результирующая оценка есть

, где .

Предложенный подход  является весьма полезным в случае наличия малого числа наблюдений. Получение оценок в среднем на основе вейвлет-аппроксимации дает здесь более ценную информацию о законе распределения случайной величины, чем конкретные значения частот имеющейся выборки.

В случае наличия нескольких выборок, в работе предложены методы улучшения полученной оценки путем выделения характерных для функции признаков.

В качестве одного из примеров использования предложенного подхода в работе рассмотрена задача обработки данных сейсмического каталога п-ова Камчатка.

  Рассматривая сейсмические события слабого энергетического класса в локальной области региона, произошедшие в пределах некоторого интервала времени и предполагая, что условия возникновения землетрясений не изменяются за анализируемый период, мы можем определить статистическое распределение этих событий по глубине. Можно сделать предположение, что пространственные характеристики землетрясений за анализируемый период отражают в среднем его сейсмический режим. Определив статистическое распределение событий по глубине  для различных сейсмически активных областей, мы получаем возможность сравнить сейсмические режимы отдельных участков за различные периоды времени, и проанализировать реальные изменения в этих режимах, проявившиеся в локальной области за некоторый период времени.

На основе данной методики обработаны данные сейсмического каталога Камчатского региона за период 1990-1997гг. Обработке были подвержены 12 сейсмически активных восточных областей полуострова. Было выбрано временное окно – 1 год, и с шагом, равным  одному году, осуществлялось скольжение по каталогу событий.

  Используя предложенный метод оценки плотности распределения случайной величины, для каждого района определены аппроксимирующие функции за весь анализируемый период и в пределах временных окон:

и ,

где - номер района, - номер временного окна.

  Результаты расчетов, произведенные для различных районов полуострова, показали наличие существенных вариаций функций в определенные периоды времени. На основе сравнения сейсмических режимов отдельных участков региона за различные периоды времени выделены признаки возрастания сейсмической активности в различных районах полуострова, которые проявлялись в виде значительного увеличения значений функции на определенных глубинах по сравнению со значениями функции .

Выделенные таким способом аномальные периоды предшествовали двум периодам резкого возрастания сейсмической активности на Камчатке. В период с 1992 по 1993 гг. в разных районах полуострова произошло 12 землетрясений энергетического класса 13. Наиболее сильные события произошли на глубине 40км, два события с =14,6 и одно с =14,9. Второй, наиболее сильный поток землетрясений наблюдался на Камчатке в период с 1996 по 1997 гг. В этот период на полуострове произошло 26 землетрясений энергетического класса 13, самым сильным из которых было Кроноцкое землетрясение (5 декабря 1997г, =14,9). В 1990г., накануне первого потока землетрясений, в шести районах полуострова, в окрестности глубин от 20-ти до 40 км, произошло превышение значений функции более чем в 2 раза. В 1996г. в восьми районах полуострова, в окрестности глубин от 5 до 10 км, также произошло превышение значений функции более чем в 1,5 раза.

  На рис. 4, в качестве примера, показаны результаты расчета значений функций и для одного из анализируемых районов. Из графика значений функции (рис.4 (а)) видно, что в среднем большинство событий в этом районе происходит на малых глубинах. В период 1991-1992 гг. можно отметить значительное увеличение значений функций  в окрестности глубины 40 км. В период 1996-1997 гг. в данном районе также наблюдается значительное увеличение значений функций , но в окрестности глубин от 5 до 10 км.

Рис.4. Значения функций (а)  и , рассчитанные за период 1990-1997гг. для района с координатами 51-52 град.с.ш., 158,5-160 град.в.д.

Значения коэффициентов вейвлет-преобразования

,

где ,

характеризуют распределение энергии процесса по масштабам . С целью анализа распределения энергии функции по глубине, для каждого района был выполнен расчет суммы абсолютных значений вейвлет-коэффициентов по всем масштабным уровням:

и

На основе этой методики была проанализирована область Кроноцкого землетрясения (параллелепипед с основанием 100x100 км и высотой H=100 км, центр основания имел координаты [54,2 – 162,2 град]). На рис.5 представлены результаты непрерывного вейвлет-преобразования функций

и ,

где –  глубина, - номер района, - номер временного окна,

и, соответствующие им, значения функций и .

  Результат обработки статистических данных показал, что наибольшая плотность распределения сейсмических событий в данном районе наблюдается на глубинах 20 – 40 км. Непосредственно перед  Кроноцким землетрясением отмечено ярко выраженное резкое увеличение энергии сигнала на глубине 5 км, что указывает на область будущего события.

Рис.5. Вейвлет-преобразования значений (вверху, слева) и (внизу слева). Соответствующие им значения функций и показаны на рисунке справа.

Шестая глава полностью посвящена исследованию эффективности предложенных моделей и алгоритмов на примерах обработки реальных и модельных сигналов.

В диссертационной работе выполнена обработка геофизических сигналов с широким спектром флуктуаций различных масштабов. Рассмотрена эффективность предложенных методов и алгоритмов в сравнении с некоторыми другими известными подходами. Сущность обработки сигналов сводилась к задаче обнаружения и классификации аномальных особенностей в их структуре.

В процессе экспериментов синтезировались модельные сигналы, характеристики которых максимально приближены к характеристикам изучаемых процессов.

Структурная схема формирования модельного сигнала показана на рис.6. Она состоит из следующих элементов:

  • ;
  • - локальные особенности масштаба , имеющие вид:1)прямоугольный импульс высоты ;2) синусоида с амплитудой , модулированная функцией Гаусса;3)треугольное колебание с уровнем ;
  • - линейный процесс;
  • - генерация данных со сложной нелинейной структурой;
  • - операция вейвлет-восстановления сигнала .

Временная протяженность локальных  особенностей является случайной величиной, имеющей равномерное распределение на интервале . Высота аномалии также является случайной величиной, имеющей равномерное распределение на интервале .

Рис.6. Структурная схема модели проведения экспериментов.

В процессе формирования модельных сигналов временной интервал , содержащий аномалию, принимает значения от 2 до 120, а высота аномалий принимает значения, начиная с уровня фоновых вариаций и заканчивая значением, превышающим в два раза фоновый уровень.

В работе доказано, аномалия с амплитудой, превышающей фоновый уровень в 1,3 раза, позволяет себя обнаруживать с вероятностью 0,99. На рис.7 показан график зависимости вероятности обнаружения аномалии от ее относительной величины. График подтверждает достаточно устойчивый характер вероятности обнаружения аномалии при  . В таблице 1, в качестве примера, приведены результаты экспериментов по обнаружению и классификации аномалий, соответствующих масштабному уровню . В ходе экспериментов рассматривались аномалии, позволяющие себя обнаруживать с вероятностью 0,99 и более. Коэффициент отношения среднего максимального значения вейвлет-коэффициентов аномальной окрестности к фону рассчитывался по формуле:

где выборочное среднее максимального значения вейвлет-коэффициентов аномальной окрестности; выборочное среднее вейвлет-коэффициентов окрестности, не содержащей аномальных эффектов; длина доверительного интервала значения с коэффициентом доверия 0,99.

Рис.7. График зависимости вероятности обнаружения аномалии от ее относительной величины.

Таблица 1. Результаты экспериментов по обнаружению и классификации аномалий (масштабный уровень 1)

Временная протяженность аномалии

Временная протяженность выявленной аномальной окрестности в сигнале

Коэф-ент отношения высоты аномалии к фону

Коэф-ент отношения среднего максимального значения вейв-коэф. аномальной окрестности к фону

4

4

1,3

1,7879

8

8

1,3

1,9864

16

16

1,3

2,0350

32

32

1,2

2,2576

Данные таблицы 1 подтверждают эффективность предложенных методов и алгоритмов по выявлению аномалий, и показывают хорошую детектирующую способность используемых базисных функций: при коэффициенте отношения высоты аномалии к фону равному 1 или 1,3 (в зависимости от длины аномалии) коэффициент отношения максимального значения вейвлет-коэффициентов аномальной окрестности к фону колеблется в районе значения 2.

На основе предложенной в работе методики построения наилучшей аппроксимирующей схемы (НАС) сигнала, выполнена идентификация структурных компонентов сигнала магнитного поля Земли, что позволило решить задачу автоматического определения индекса геомагнитной активности K (К-индекса). К-индекс является одной из характеристик магнитного поля Земли. Он характеризует меру интенсивности геомагнитных возмущений в месте регистрации и используется при решении широкого ряда  научных и прикладных задач. К-индекс введен Дж. Бартельсом в 1938 г. и представляет собой значения от 0 до 9 для каждого трехчасового интервала мирового времени. Он вычисляется из магнитограмм по специальной методике, которая предполагает высокий уровень профессиональной подготовки персонала магнитной обсерватории. Основные требования данной методики предъявляются к выделению не возмущенной вариации геомагнитного поля, которая называется Sq-кривой. На основе разницы между наибольшим и наименьшим отклонениями в течение  трехчасового интервала реальной магнитограммы от значения Sq-кривой определяют амплитуду возмущения в нТл. Далее эта амплитуда переводится по квазилогарифмической шкале в К-индекс. Шкала для каждой обсерватории определяется в соответствии с геомагнитной широтой индивидуально.

Создание автоматических методов определения К-индекса является серьезной проблемой, трудности решения которой связаны с выполнением процедуры определения Sq-кривой, максимально приближенной к ручному способу ее выделения. Существующие методы  автоматизации данной процедуры не удовлетворяют основному требованию, поскольку не включают в себя средства адаптации, тем самым не учитывают возможность изменчивости Sq-кривой с течением времени.

На основе построения НАС сигнала выделены регулярные составляющие процесса и компоненты, содержащие в себе информацию о величине отклонений от среднего уровня в локальные моменты времени. В качестве регулярных составляющих процесса определены ветки дерева ВП, показанные на рис.8. На основе анализа и обработки этих компонент разработана методика идентификации спокойного дня, определяющего Sq-кривую. Процедура идентификации спокойного дня заключается в выполнении следующих операций: определяется суммарное значение вейвлет-коэффициентов выделенных веток для текущего дна, и производится его сравнение с соответствующим значением спокойного дня, не превышение которого служит характеристикой того, что текущий день является спокойным. Данная методика позволила получить алгоритм, адаптирующийся к сигналу по мере его изменения. Преимуществом этого способа адаптации служит тот факт, что при этом не требуется процедуры обучения и знания статистических свойств сигнала.

На основе этой методики обработаны магнитные данные, полученные на обсерватории «Паратунка» (с. Паратунка, Камчатская область). Сравнение полученных результатов определения К-индекса с ручным методом показывает, что отличия составляют 18 процентов и в своем большинстве не превышают 1 балла. Данный результат позволяет считать предлагаемую методику удовлетворительной по точности и допустимой для проведения автоматических расчетов по определению индекса геомагнитной активности К.

Рис. 8. Ветки вейвлет-пакета, отобранные для идентификации спокойного дня по данным магнитного поля Земли.

Оценка модели ВПАР производилась на основе обработки модельных и природных сигналов. В качестве природных сигналов использовались данные подпочвенного радона AORn и критической частоты foF2.

  Для исследования свойств модели ВПАР генерировались процессы авторегрессии порядка , , и производилась их обработка на основе модели ВПАР. Результаты сравнения характеристик исходного авторегрессионного процесса и полученной, после его обработки, модели ВПАР показали:

  • на основе применения конструкции вейвлет-преобразования шумовые составляющие авторегрессионного процесса отображаются в пространства  деталей ;
  • структура исходного сигнала упрощается,  вследствие чего понижается порядок авторегрессионной модели;
  • наблюдается значительное уменьшение остаточных ошибок авторегрессионной модели.

На рис.9 показаны графики остаточных ошибок моделей авторегрессии до обработки (рис.9.а) и после обработки (рис.9.в), и спектральные характеристики этих процессов (рис.9.б и рис.9.г). До обработки вейвлетами модель авторегрессии имела 5-ый порядок, после обработки вейвлетами идентифицирована модель порядка 4.

Рис.9. Остаточные ошибки моделей авторегрессии до обработки (а) и после обработки (в). Спектральные характеристики процессов до обработки (б) и после обработки (г).

 

  В процессе обработки данных подпочвенного радона AORn идентифицирована модель ВПАР вида:

где коэффициенты являются детализирующими коэффициентами вейвлет-разложения, – базисный вейвлет, – коэффициенты авторегрессии,, коэффициенты являются аппроксимирующими коэффициентами 4-го масштабного уровня вейвлет-разложения.

  Анализ модели позволил выявить разномасштабные аномальные особенности в структуре сигнала AORn, предшествующие сильным сейсмическим событиям на Камчатке. На основе составляющей модели выявлены короткопериодные аномальные особенности, наблюдающиеся непосредственно перед землетрясениями, что имеет важное значение для краткосрочного оперативного прогноза. С целью выявления возможных среднесрочных аномальных особенностей, произведен анализ составляющей модели . Анализ остаточных ошибок этой компоненты позволил обнаружить краткосрочные аномальные особенности перед сильными землетрясениями. Выявленные аномальные области показаны на рис.10, 11 пунктирными линиями, стрелками показаны моменты возникновения сильных сейсмических событий.

  1997г. 1998г. 1999г.  2000г

 

 

Рис. 10. Данные регистрации подпочвенного радона OARn (a); детали 1-4-го уровней вейвлет-разложения (б, в, г, д); суммарные значения вейвлет-коэффициентов в скользящем временной окне (е). Стрелками отмечены моменты возникновения сейсмических событий, пунктирной линией показаны аномальные области.

  1997г. 1998г. 1999г. 2000г. 2001г.  2002г. 2003г.

Рис.11. Модель сглаженной составляющей сигнала AORn (a) и ошибки модели (б). Стрелками показаны моменты возникновения землетрясений, пунктирной линией выделены аномальные области.

 

Рис. 12. Сигнал подпочвенного радона OARn (a); сглаженная компонента  сигнала OARn (б); остаточные ошибки модели АРПСС сглаженной компоненты сигнала OARn (в).

    1. Выполнено сравнение эффективности предложенного метода с традиционными подходами. С этой целью была произведена процедура сглаживания сигнала подпочвенного радона OARn на основе метода скользящего среднего с последующей попыткой идентификации модели АРПСС. Процесс идентификации модели АРПСС оказался безуспешным: наблюдалась существенная автокорреляция остатков, свидетельствующая о неадекватности полученной модели. На рис.12 показан исходный сигнал подпочвенного радона OARn и результаты его обработки: (a) сигнал подпочвенного радона OARn; (б) сглаженная компонента  сигнала OARn; (в) остаточные ошибки модели АРПСС сглаженной компоненты сигнала OARn.
    2. Анализ сигнала критической частоты foF2 показал, что он имеет сложную структуру, существенное влияние на данные регистрации оказывают внешние факторы. Для сейсмически спокойных лет идентифицированы модели ВПАР. Параметры моделей оказались достаточно близки между собой. В результатах моделирования проявил себя солнечный двенадцатилетний цикл. Модели этих лет имеют наибольшее сходство друг с другом: константы, характеризующие средний уровень процесса, и параметры моделей.
    3. Общий вид модели сигнала критической частоты foF2 в сейсмически спокойные периоды времени имеет вид:

где коэффициенты являются детализирующими коэффициентами вейвлет-разложения, – базисный вейвлет, – коэффициенты авторегрессии,, коэффициенты являются аппроксимирующими коэффициентами 4-го масштабного уровня вейвлет-разложения.

Анализ модели показал, что в большинстве случаев накануне сейсмических событий наблюдается резкое увеличение амплитуды колебаний (область увеличения амплитуды колебаний показана на рис.13 пунктирной линией), в отдельных случаях наблюдается незначительное увеличение остаточной ошибки модели (момент увеличения остаточной ошибки модели показан на рис.14 стрелкой).

       

Рис. 13. Модель авторегрессии сглаженной компоненты 4-го уровня вейвлет-разложения сигнала foF2 за 1985 г.

Рис. 14. Остаточные ошибки авторегрессионной модели сигнала foF2 за 1985 г.

Оценка модели ВПНС выполнена в работе на основе обработки модельных и природных сигналов. В качестве природных сигналов использовались сигналы критической частоты foF2.

  В процессе обработки сигнала foF2 показано, предложенные в работе методы формирования обучающего множества для нейронной сети позволяют:

  1. сократить время обучения сети в 5 раз;
  2. уменьшить ошибку сети в 40 раз;
  3. увеличить шаг упреждения в 3 раза.

На рис.15, 16 показаны результаты работы нейронной сети при подаче на ее вход сигнала foF2 за 1977г.: (рис.15.а) вектор ошибки сети до обработки вейвлетами; (рис.15.б) вектор ошибки сети после обработки вейвлетами; (рис.16.а) дисперсия ошибки сети в скользящем временном окне до обработки вейвлетами; (рис.16.б) дисперсия ошибки сети в скользящем временном окне после обработки вейвлетами.

Рис. 15. Сравнение двух методов обработки: метод НС и метод ВПНС: вектор ошибки сети до обработки вейвлетами (а); вектор ошибки сети после обработки вейвлетами (б).

Рис. 16 Сравнение двух методов обработки: метод НС и метод ВПНС: дисперсия ошибки сети в скользящем временном окне до обработки вейвлетами (а); дисперсия ошибки сети в скользящем временном окне после обработки вейвлетами (б).

  На основе модели ВПНС разработана система прогнозирования данных критической частоты f0F2, полученных автоматической ионосферной станцией, расположенной в п.Паратунка п-ов Камчатка). Для экспериментов были взяты результаты измерений за период с 1971 по 2006 гг.

Формальная модель сигнала критической частоты имеет вид:

,

где ; – весовые коэффициенты первого слоя нейронной сети, – весовые коэффициенты второго слоя нейронной сети, – базисный вейвлет.

Анализ работы системы, построенный на основе сопоставления выявляемых аномальных особенностей сигнала с данными каталога сейсмический явлений показал: накануне сильных сейсмических событий на Камчатке в большом числе случаев наблюдается значительное увеличение ошибки сети. На рис.17, в качестве примера, показан результат работы сети, в качестве тестовой выборки использовались данные критической частоты f0F2 зимнего периода 1973г. Момент произошедшего землетрясения отмечен на рисунке стрелками.

Рис.17 Результат работы нейронной сети: компонента сигнала критической частоты  за 1973г. (а); ошибка сети (б); дисперсия ошибки сети, рассчитанная в скользящем временном окне, равном одним суткам (с).

Основные теоретические и прикладные результаты работы:

1. Предложена и исследована новая математическая конструкция - многокомпонентная модель временного ряда (ММВР), лежащая в основе построения модели сложного природного сигнала и позволяющая, 

  • выполнить оценку модели в случае, когда данные имеют сложное априори неизвестное распределение процесса;
  • дает возможность адаптивного определения аппроксимирующих функций в зависимости от структуры исходных данных;
  • позволяет отобразить в модели изолированные особенности структуры моделируемых данных, что важно при решении задач выявления и классификации аномалий.

2. На основе конструкции кратномасштабного анализа и вейвлет-пакетов построено отображение компонентов сложного сигнала в пространство вейвлет-образов и доказано, что полученные компоненты являются компонентами ММВР.

3. Предложены критерии выбора базисной функции, обеспечивающие построение наилучшей аппроксимирующей схемы (НАС) сигнала. Разработаны численные методы идентификации компонентов ММВР, в основе которых лежит НАС сигнала, обеспечивающая минимизацию числа аппроксимирующих слагаемых и минимизацию погрешности аппроксимации для сложных сигналов.

  1. На основе минимаксного подхода разработаны способы оценки и оптимизации модели. Оптимизация модели выполняется путем выбора наилучшего порога, адаптируемого к данным, и путем выбора наилучшей базисной функции.
  2. Разработаны методы идентификации изолированных особенностей и устойчивых характеристик структуры сложного сигнала.
  3. Предложены и исследованы два способа оценки параметров ММВР: первый, основанный на совмещении методов АРПСС и вейвлет-преобразования, позволяет выполнить оценку параметров модели в случае, когда компоненты имеют линейную структуру; второй, базирующийся на совместном использовании методов нейронных сетей и вейвлет-преобразования, позволяет построить аппроксимирующую функцию в случае, когда структура компонент существенно нелинейная. Разработаны методы и алгоритмы идентификации новых моделей, описаны их свойства. Показано, совместное применение конструкции вейвлет-преобразования и модели АРПСС позволяет понизить порядок авторегрессионной модели и улучшить ее характеристики. Данный факт подтвержден результатами экспериментов. На основе экспериментов с природным сигналом показано, совместное применение конструкции вейвлет-преобразования и нейронных сетей позволяет оптимизировать процедуру обучения сети и улучшить качество ее работы.
  4. Предложены и реализованы численные алгоритмы автоматического обнаружения  изменений параметров многокомпонентной модели применительно к задаче обнаружения аномальных эффектов в структуре сложного сигнала. Эффективность предложенных алгоритмов подтверждена теоретически и результатами экспериментов.
  5. На основе построенной НАС сигнала разработана техника выделения редковстречающихся особенностей и характерных элементов его структуры. На примере обработки природных сигналов показано, что применение данной техники позволяет улучшить качества обучающей выборки для нейронной сети, и обеспечивает уменьшение ошибки сети.
  6. Разработаны и исследованы способы и алгоритмы классификации изолированных особенностей в структуре сигнала. На основе обработки модельных сигналов показано, что, многомасштабная изолированная особенность с амплитудой, превышающей фоновый уровень в 1,3 раза, позволяет себя обнаруживать с вероятностью 0,99.
  7. На основе разработанного аппарата предложен метод автоматического определения индекса геомагнитной активности K, построены модели сигналов подпочвенного радона OARn и критической частоты f0F2. Анализ модели сигнала подпочвенного радона OARn показал, что перед сильными землетрясениями в сигнале наблюдаются короткопериодные аномальные особенности, которые выявлены на основе детализирующей составляющей модели. Анализ сглаженной компоненты модели позволил обнаружить краткосрочные аномалии продолжительностью от нескольких дней до полутора месяцев, предшествующие сильным сейсмическим явлениям. Анализ структуры сигнала критической частоты f0F2 показал, что в периоды повышения сейсмической активности на Камчатке он имеет сложную структуру, поэтому идентификация модели базировалась на совместном использовании вейвлет-преобразования и нейронных сетей. На основе полученной модели разработана система прогнозирования. Анализ работы системы показал, что накануне сильных сейсмических событий на Камчатке наблюдается значительное увеличение ошибки сети.
  8. Предложен метод оценки плотности распределения случайной величины на основе вейвлет-преобразования, позволяющий адаптивно подобрать аппроксимирующую функцию и выполнить оценку в случае, когда распределение оцениваемой функции имеет сложную форму. Анализ результатов обработки данных сейсмического каталога п-ова Камчатка подтвердил эффективность предложенного метода и позволил выделить периоды сильного повышения сейсмической активности на Камчатке, которые предшествовали сильным землетрясениям.

ОПУБЛИКОВАННЫЕ РАБОТЫ ПО ТЕМЕ ДИССЕРТАЦИИ

книги:

1. Богданов В.В., Геппенер В.В., Мандрикова О.В. Моделирование нестационарных временных рядов геофизических параметров со сложной структурой. – С.-Петербург: ЛЭТИ.2006. – 108с.

2. Мандрикова О.В. Моделирование геохимических сигналов на основе вейвлет-преобразования.  – Владивосток: Дальнаука.2007. – 123с.

статьи из изданий, рекомендованных ВАК:

3. Мандрикова О.В. Непараметрическое моделирование сейсмических данных с использованием сплайн-вейвлетов //Известия СПбГЭТУ "ЛЭТИ" (Известия Государственного электротехнического университета), Серия "Информатика, управление и компьютерные технологии". — С.-Петербург. 2002 г. №4. С.77-81.

4. Фирстов П.П., Филиппов Ю.А., Мандрикова О.В. Предвестниковые аномалии сильных землетрясений в динамике подпочвенного радона на  Петропавловск-Камчатском геодинамическом полигоне в 1997-2001гг // Доклады РАН. 2003.Т.389.№6. С.810-813.

5. Геппенер В.В., Мандрикова О.В. Совмещение параметрического и непараметрического подходов к построению моделей нестационарных временных рядов, имеющих сложную структуру, с целью повышения качества их обработки //Известия СПбГЭТУ "ЛЭТИ", (Известия Государственного электротехнического университета), Серия "Информатика, управление и компьютерные технологии". — С.-Петербург. 2003 г. №2. С.14-17.

6. Мандрикова О.В. Многоструктурная модель геофизического сигнала. //Известия вузов, Северо-Кавказский регион, — Ростов-на-Дону, Серия естественные науки.-2007 г.-№6.- С.47-50.

7. Мандрикова О.В., Богданов В.В. Исследование сигнала критической частоты на основе конструкции вейвлет – разложения. //Известия вузов, Северо-Кавказский регион, — Ростов-на-Дону, Серия естественные науки. Науки о Земле. Спецвыпуск. 2007 г. С.90-93.

8. Мандрикова О.В., Богданов В.В. Полозов Ю.А. Моделирование сигналов со сложной структурой на основе конструкции вейвлет-преобразования. // Информационные технологии. —Москва. 2008 г. №4. С.12-19.

9. Мандрикова О.В., Богданов В.В. Аппроксимация статистического распределения случайной величины на основе конструкции вейвлет-преобразования. //Известия вузов, Северо-Кавказский регион, — Новочеркасск, Серия технические науки. №3. 2008 С.53-57.

10. Мандрикова О.В., Портнягин Н.Н., Полозов Ю.А. Способ построения модели временного ряда на основе совместного применения методов нейронных сетей и конструкции вейвлет-преобразования.// Известия вузов, Северо-Кавказский регион, — Новочеркасск, Серия технические науки. №4. 2008 г. С.5-8.

11. Богданов В.В., Мандрикова О.В. Анализ распределений вероятностей потока сейсмических событий перед сильными землетрясениями на основе метода вейвлет-разложения. // Автоматизация и современные технологии. — Москва. 2008 г. №6. С.14-17.

из других изданий:

12. Мандрикова О.В. Тристанов А.Б. Исследование локальных особенностей временного ряда с использованием пакета Wavelet Toolbox. // труды Всероссийск. научн. конф. "Проектирование научных и инженерных приложений в среде Matlab". — Москва: ИПУ РАН, 28-29 мая 2002г., С.242-261

13. Мандрикова О.В., Тристанов А.Б., Фирстов П.П. Представления о вейвлет-анализе и возможность его использования для рядов мониторинга подпочвенного радона на Петропавловск-Камчатском геодинамическом полигоне //сбор. ст. «Проблемы современной науки» Труды КамчатГТУ. Вып. 16 — Петропавловск-Камчатский: Издательство КамчатГТУ, 2002г., С.139-153.

14. Мандрикова О. В., Фирстов П. П.  Сплайн-вейвлеты как инструмент обработки и анализа краткосрочных вариаций геохимических компонентов.  // Матер. Междунар. научн.-практич. конф. “Рыбохозяйственное образование Камчатки в XXI веке”. — Петропавловск-Камчатский, 15-16 октября 2002 г.: Издательство КамчатГТУ , С.261-270.

15. Геппенер В.В., Мандрикова О.В., Фирстов П.П. Прогнозирование сейсмической активности с использованием многоструктурной модели геохимических данных // Междунар. конф. по мягким вычислениям и измерениям (SCM'2003): [сб. докл.]. — Санкт-Петербург, 23-24 июня 2003г.:Издательство СПбГЭТУ "ЛЭТИ",  СПб, Т.2., С. 194-197.

16. Богданов В.В., Мандрикова О.В. Вариации в распределении вероятностей потока сейсмических событий по глубине и времени перед сильными землетрясениями (на примере Кроноцкого землетрясения) // Солнечно-земные связи и предвестники землетрясений: III международное совещание 16-21 августа 2004г. с. Паратунка: [сб. докл.]. – П.-Камчатский, 2004. С.31-35.

17. Богданов В.В., Мандрикова О.В. Непараметрическое моделирование ионосферных данных в базисе вейвлетов на примере критической частоты fOF2 // Солнечно-земные связи и предвестники землетрясений: III международное совещание 16-21 августа 2004г. с. Паратунка: [cб. докл.]. – П.-Камчатский. 2004. С.35-42.

18. Богданов  В.В.,  Мандрикова О.В.  Исследование временных рядов распределений вероятностей сейсмических событий методом вейвлет-разложения (Кроноцкое землетрясение, 05.12.97,  Камчатка)  // Междунар. конф. по мягким вычислениям и измерениям (SCM'2005): [сб. докл.]. — Санкт- Петербург: Издательство СПбГЭТУ "ЛЭТИ", СПб , 2005. Т.2 С.162-164.

19. Богданов В.В., Мандрикова О.В., Корнев Е.В., Шумилова А.Л., Конюхов А.В. Об аномалиях в ионосферных процессах Камчатского региона накануне сейсмических событий // Вестник КамчатГТУ. Выпуск 4. — П.-Камчатский, 2005. С.52-56.

20. Богданов В.В., Мандрикова О.В. Вейвлет-анализ распределений вероятностей сейсмических событий Камчатского региона накануне Кроноцкого землетрясения // Вестник КамчатГТУ. Выпуск 4. — П.-Камчатский, 2005. С.56-59.

21. Мандрикова О.В., Богданов В.В., Конюхов А.В. Оптимизация обучения нейронной сети на основе вейвлет-преобразования на примере модельного представления ионосферного сигнала // Междунар. конф. по мягким вычислениям и измерениям (SCM'2006): [сб. докл.]. — Санкт- Петербург: Издательство СПбГЭТУ "ЛЭТИ", СПб , 2006. Т.1. С.223-226.

22. Мандрикова О.В., Богданов В.В., Павлов А.В. Изменения в распределении вероятностей возникновения землетрясений по глубине накануне Кроноцкого землетрясения (05.12.97 г.) // Междунар. конф. по мягким вычислениям и измерениям (SCM'2006): [сб. докл.]. — Санкт- Петербург: Издательство СПбГЭТУ "ЛЭТИ", СПб, 2006. Т. 2. С.153-157.

23. Мандрикова О.В., Богданов В.В., Полозов Ю.А. Моделирование сигнала критической частоты на основе нейронных сетей с целью поиска аномального поведения // Междунар. конф. по мягким вычислениям и измерениям (SCM'2006): [сб. докл.]. — Санкт- Петербург: Издательство СПбГЭТУ "ЛЭТИ", СПб,  2006. Т.2. С.158-160.

24. Мандрикова О.В., Богданов В.В., Полозов Ю.А. Анализ изменений, происходящих в ионосферных параметрах накануне сильных землетрясений на Камчатке, на основе вейвлет-преобразования сигналов критической частоты. // Междунар. конф. по мягким вычислениям и измерениям (SCM'2007): [сб. докл.]. — Санкт- Петербург: Издательство СПбГЭТУ "ЛЭТИ",  СПб, 2007, С. 213-216.

25. Богданов В.В., Мандрикова О.В., Павлов А.В., Шумилова А.Л. Вероятностная интерпретация закона Гуттенберга-Рихтера и оценка времени повторений сильных Камчатских землетрясений с магнитудой 9 и 9,5 баллов. // Междунар. конф. по мягким вычислениям и измерениям (SCM'2007): [сб. докл.]. — Санкт- Петербург: Издательство СПбГЭТУ "ЛЭТИ", СПб, 2007, С.177-181.

26. Мандрикова О.В., Богданов В.В. Исследование вариаций распределения сейсмических событий по глубине на основе применения конструкции вейвлет-преобразования // Междунар. конф. по мягким вычислениям и измерениям (SCM'2007): [сб. докл.]. — Санкт- Петербург: Издательство СПбГЭТУ "ЛЭТИ",  СПб, 2007, С. 209-212.

27. Мандрикова О.В., Богданов В.В., Полозов Ю.А. Выявление аномальных изменений в ионосферных параметрах на основе модельного представления сигналов критической частоты foF2 // Солнечно-земные связи и предвестники землетрясений: IV международное совещание 16-21 августа 2007г. с. Паратунка: [сб. докл.]. – П.-Камчатский. 2007. С. 213-216.

28. Богданов В.В., Мандрикова О.В. Анализ изменений в распределении вероятностей сейсмических событий по глубине на основе вейвлет-разложений. // Солнечно-земные связи и предвестники землетрясений: IV международное совещание 16-21 августа 2007г. с. Паратунка: [сб. докл.]. – П.-Камчатский. 2007. С. 260-263.

29. Богданов В.В., Родткин М.В., Мейстер К.В., Силина А.С., Липеровская Е.В., Мандрикова О.В. Статистический анализ возмущений критической частоты foF2 ионосферы за несколько суток до и после землетрясения по материалам станции «Петропавловск-Камчатский» и «Токио» Солнечно-земные связи и предвестники землетрясений: IV международное совещание 16-21 августа 2007г. с. Паратунка – П.-Камчатский. 2007. С.378-384.

30. Мандрикова О.В., Богданов В.В. Multistructural models of geophysical signals. 8th International Conference on PATTERN RECOGNITION and IMAGE ANALYSIS: NEW INFORMATION TECNOLOGIES, October 8-12, 2007, (PRIA-8-2007): Conference Proceedings. Vol. 3. – Yoshkar-Ola, 2007. С.81-84.

31. Мандрикова О.В., Богданов В.В., Полозов Ю.А. Автоматизированный метод выделения аномальных изменений в ионосферных параметрах накануне сильных землетрясений на Камчатке // Междунар. конф. по мягким вычислениям и измерениям (SCM'2008): [сб. докл.]. — Санкт- Петербург: Издательство СПбГЭТУ "ЛЭТИ",  СПб, 2008. С.122-125.

32. О.В. Мандрикова Многокомпонентная модель временного ряда. // Междунар. конф. по мягким вычислениям и измерениям (SCM'2008): [сб. докл.]. — Санкт- Петербург: Издательство СПбГЭТУ "ЛЭТИ",  СПб, 2008. С.152-155.

33. Мандрикова О.В., Горева Т.С. Построение модели сигнала критической частоты на основе вейвлет-пакетов // Вестник КамчатГТУ. Выпуск 7  — П.Камчатский. 2008. С.53-59.

34. Мандрикова О.В. Многокомпонентная модель временного ряда. // Вестник КамчатГТУ. Выпуск 7 — П.Камчатский, 2008. С.41-46.

35. Мандрикова О.В., Богданов В.В., Полозов Ю.А. Автоматический алгоритм выделения аномальных изменений в ионосферных параметрах на основе обработки сигналов критической частоты  foF2  и индексов геомагнитной активности K // Вестник КамчатГТУ. Выпуск 7. —П.Камчатский, 2008. С. 47-52.

36. Мандрикова О.В., Смирнов С.Э. Автоматический метод определения К-индекса по магнитным данным на основе вейвлетов. // Вестник КамчатГТУ. Выпуск 7. — П.Камчатский, 2008. С. 60-63.

37. Мандрикова О.В., Богданов В.В., Полозов Ю.А. Метод обработки сигналов со сложной структурой на основе совмещения конструкции вейвлет-преобразования и нейронных сетей // 5-я научная конференция «Управление и информационные технологии» (УИТ-2008) [сб. докл.]. — Санкт-Петербург: Издательство СПбГЭТУ "ЛЭТИ",  СПб, 2008. С.207-209.







© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.