WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


На правах рукописи

Елисеев Владимир Леонидович

Разработка и исследование нейросетевых алгоритмов управления стационарными и нестационарными объектами

05.13.01 – Системный анализ, управление и обработка информации

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Москва – 2012

Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования “Национальный исследовательский университет “МЭИ”.

Научный консультант: доктор технических наук, профессор, Филаретов Геннадий Федорович

Официальные оппоненты: доктор физико-математических наук, профессор, Лохин Валерий Михайлович доктор технических наук, профессор, Ермуратский Петр Васильевич

Ведущая организация: ОАО “Газпром автоматизация”

Защита состоится « » 2012 г. в часов на заседании диссертационного совета Д 212.157.08 при ФГБОУ ВПО “НИУ МЭИ” в малом актовом зале, расположенном по адресу: 111250, Москва, Красноказарменная улица, дом 14.

С диссертацией можно ознакомиться в библиотеке ФГБОУ ВПО “НИУ МЭИ”.

Автореферат разослан « » 2012 г.

Отзывы и замечания по автореферату в двух экземплярах, заверенные печа­ тью, просьба высылать по вышеуказанному адресу на имя ученого секретаря диссертационного совета.

Ученый секретарь диссертационного совета, кандидат технических наук, доцент Анисимов Д. Н.

Введение



Актуальность работы Искусственные нейронные сети (ИНС) в настоя­ щее время находят широкое применение в самых разных предметных обла­ стях. Они используются для идентификации статических и динамических объектов, для построения ассоциативной памяти и моделей временных ря­ дов, сжатия информации, в системах поддержки принятия решений, для це­ лей прогнозирования, классификации и распознавания образов, а также как средство решения некоторых задач вычислительного характера.

Одним из важных направлений использования искусственных нейрон­ ных сетей являются системы автоматического управления (САУ) различных типов. Работы по данной проблеме велись и ведутся весьма интенсивно как отечественными (А. И. Галушкин, В. А. Терехов, А. Н. Горбань, В. И. Кома­ шинский, Д. А. Смирнов, Т. А. Бондарь, А. С. Логовский и др.), так и зару­ бежными учеными (К. Нарендра, О. Сигеро, С. Хайкин, М. Гупта, С. Осов­ ский и др.).

Вместе с тем, необходимо отметить, что многие вопросы, в первую оче­ редь связанные с практическим использованием ИНС в САУ, исследованы еще недостаточно полно. Большинство работ либо носят постановочный аб­ страктный характер, где основное внимание уделяется доказательству прин­ ципиальной возможности использования нейросети некоторой разновидности в определенной предметной области, либо посвящены решению относительно узких прикладных задач и не содержат обобщений, позволяющих использо­ вать полученные результаты для решения схожих задач. В частности, отсут­ ствуют работы, посвященные задаче замены классических регуляторов на нейросетевые, обобщающие накопленный к настоящему времени опыт их ис­ пользования. Очень слабо освещены вопросы синтеза нейросетевого регулято­ ра по критерию минимума среднеквадратической ошибки в сопоставлении со свойствами традиционного линейного регулятора. Достаточно ограничен пе­ речень работ по нейросетевому управлению нестационарным объектом, где, как правило, рассматривается только случай достаточно плавного непрерыв­ ного изменения свойств объекта управления. Всё это свидетельствует о необ­ ходимости дальнейшего развития исследований по данной проблематике, в первую очередь направленную на конкретизацию процедур синтеза нейросе­ тевых регуляторов, корректное сопоставление их свойств со свойствами ана­ логичных классических регуляторов. Из изложенного вытекает актуальность темы диссертационной работы.

Цель исследований Целью диссертационной работы является разработ­ ка и исследование нейросетевых алгоритмов управления стационарными и нестационарными объектами Задачи исследований В соответствии с указанной целью в рамках дис­ сертационной работы поставлены и решались следующие задачи:

1. Обзор и анализ известных вариантов применения ИНС в системах управ­ ления, используемых для этих целей методов и программных средств.

2. Разработка методики построения нейросетевого регулятора – аналога П, ПИ и ПИД регуляторов и сопоставительный анализ их свойств.

3. Исследование возможностей нейросетевого подхода при построении САУ по критерию минимума среднеквадратической ошибки.

4. Разработка нейросетевых алгоритмов управления нестационарными объ­ ектами для случая спонтанного скачкообразного изменения их свойств.

5. Применение полученных методических, математических и программноалгоритмических результатов при решении практических задач управ­ ления подвижным роботом и в учебном процессе.

Научная новизна 1. Разработана методика построения нейросетевого регулятора — анало­ га П, ПИ и ПИД регуляторов, впервые позволившая формализовать решение задачи его проектирования, включая выбор внутренней архи­ тектуры и структуры входов используемой ИНС, оптимальное форми­ рование обучающей выборки, процедуру обучения ИНС и анализ его возможностей для линейного и нелинейного динамических объектов.

2. Сопоставление свойств классического и предложенного в работе нейро­ сетевого регуляторов, синтезированных по критерию минимума СКО, впервые позволило показать существенно меньшую чувствительность нейросетевого варианта к отклонениям параметров объекта и сигналов от использовавшихся при их синтезе.

3. Разработан алгоритм управления нестационарным объектом для слу­ чая спонтанного скачкообразного изменения его характеристик, в ко­ тором впервые предложено комбинировано использовать нейросетевые и статистические подходы, когда статистическая компонента обеспечи­ вает наискорейшее обнаружение значимого изменения характеристик объекта на фоне помех и запуск механизма адаптации (дообучения).

Методы исследования Полученные результаты исследования базируют­ ся на использовании методов и средств теории искусственных нейронных се­ тей, теории автоматического управления, математической статистики, ими­ тационного моделирования.

Обоснованность и достоверность научных положений, выводов и рекомендаций подтверждаются результатами имитационного моделирова­ ния, которые для классических САУ совпадают с известными теоретически­ ми результатами, данными о применении разработанных методов, алгорит­ мов и прикладных программ в рамках натурных экспериментов по управле­ нию подвижным роботом, апробацией полученных результатов среди квали­ фицированных специалистов на Международном научном коллоквиуме, Гер­ мания, 2010 г., научном семинаре кафедры “Робототехнические системы и комплексы” в МГТУ им. Н.Э. Баумана (сентябрь, 2011 г.).

Практическая значимость работы Результаты исследований, выполнен­ ных в диссертационной работе, использованы при синтезе нейросетевого ал­ горитма управления подвижным роботом и опробованы на практике. Разра­ ботанный подход позволяет легко адаптировать нейросетевой алгоритм для управления широким классом мобильных устройств с различными массога­ баритными характеристиками и динамическими свойствами без проведения их аналитической идентификации. Созданные алгоритмы легли в основу про­ граммного комплекса моделирования нейросетевых систем управления, кото­ рый может использоваться для синтеза и исследования нейросетевых алго­ ритмов управления и их сравнения с альтернативными подходами. Данный комплекс является интерактивным, модульным, легко расширяется под спе­ цифические задачи. Его адаптированный вариант предназначен для приме­ нения в учебном процессе в качестве программного стенда при проведении лабораторных работ.

Реализация результатов Результаты работы были использованы:

для разработки алгоритма нейросетевого управления автономным мо­ бильным роботом в Московском государственном техническом универ­ ситете им. Н.Э. Баумана;

при создании учебно-практического лабораторного комплекса по курсу “Нейрокомпьютеры и их применение” в Национальном исследователь­ ском университете МЭИ.

Апробация работы Результаты работы и ее основные положения докла­ дывались на российских и международных конференциях “Информационные технологии в науке, образовании, телекоммуникации и бизнесе” – IT+SE (Ялта-Гурзуф, 2010 г., 2011 г.), “Информационные средства и технологии” (Москва, 1999 г., 2000 г.), “Актуальные проблемы защиты и безопасности” (Санкт-Петербург, 2006 г.), “International Scientific Colloquium” (Ильменау, Германия, 2000 г., 2010 г.), на заседании кафедры “Управление и информати­ ка” Национального исследовательского университета МЭИ.





Публикации По результатам исследований опубликовано 12 научных ра­ бот, в том числе, 2 публикации в рецензируемых журналах, входящих в спи­ сок ВАК РФ.

Структура и объем работы Диссертационная работа состоит из введе­ ния, шести глав, заключения и списка литературы из 85 наименований, вклю­ чает 207 страниц текста, 73 рисунка, 14 таблиц.

Содержание работы Во Введении обоснована актуальность диссертационной работы, сфор­ мулирована цель и аргументирована научная новизна исследований, показана практическая значимость полученных результатов, представлены выносимые на защиту научные положения.

Первая глава содержит обзор литературы и анализ современных тен­ денций применения нейронных сетей в задачах автоматического управления.

Отмечено частое использование нейронных сетей (НС) для управления про­ мышленными технологическими процессами, а также в робототехнике. Клю­ чевыми преимуществами нейронных сетей в этих случаях являются обуче­ ние на примерах, не требующее аналитической идентификации, и нелинейная природа, адекватная нелинейным объектам.

Основными и наиболее перспективными ролями НС общепризнано счи­ тается их использование в качестве регулятора (в том числе, с регулятором другого типа) и модели объекта управления. Прочие варианты (настройка регулятора другого типа, классификация состояний объекта и пр.), судя по публикациям, используются существенно реже. Тем не менее, задача сопо­ ставления нейросетевых регуляторов с другими подходами, в частности, с ПИД регуляторами, систематически не решалась. В публикациях данная те­ ма, как правило, затрагивается только с позиций показа преимуществ ней­ росетевых регуляторов, в то же время очевидно, что любой подход должен иметь свои ограничения и недостатки.

Другим неисследованным объектом сопоставления является линейный винеровский оптимальный регулятор. Критерий его синтеза — минимум сред­ неквадратической ошибки управления (СКО) — совпадает с критерием обуче­ ния нейросетевого регулятора в контуре управления во многих публикациях как в стационарных, так и нестационарных условиях. Однако такого сопостав­ ления никто не проводил, несмотря на его корректность, а также очевидное научное и практическое значение.

Проблема нейросетевого управления нестационарным объектом, как пра­ вило, рассматривается исследователями в постановке с гладким изменением параметров. Важный в теоретическом и практическом плане случай ступен­ чатого изменения параметров в опубликованных работах рассматривается редко и недостаточно систематически, что оставляет много вопросов по ме­ тодике, быстродействию и устойчивости процесса адаптации нейросетевого регулятора к изменившемся условиям.

Незавершенность теории НС делает обоснованным использование разно­ образных эвристик, а также применение имитационного эксперимента как основного метода исследований. Это характерно для большинства опублико­ ванных работ. В то же время, авторы редко аргументируют причины приня­ тия тех или иных решений, а некоторые аспекты, например, формирование обучающей выборки, почти всегда остаются за рамками публикации.

Учитывая эвристический характер проектирования нейросетевых систем управления, особое значение приобретают программные инструментальные средства, позволяющие быстро и удобно настраивать и моделировать такие системы, а также оценивать качество управления в сравнении с традицион­ ными подходами. Для использования в учебном процессе такие программы должны быть просты в освоении, иметь скромные требования к производи­ тельности компьютера и, что весьма желательно, базироваться на открытых и бесплатных технологиях.

Вторая глава посвящена разработке методики синтеза нейросетевого аналога ПИД регулятора в системе управления с одномерным линейным объ­ ектом. Пусть ek — ошибка управления в момент времени tk, uk — управляю­ щее воздействие на объект, а f(ek, s) — функция ПИД регулятора (s — его состояние). Для обучения нейросетевого аналога ПИД регулятора вне конту­ ра управления решалась оптимизационная задача вида:

p f(ek, s) - N (ik) min (1) ikI k p где N — функция НС со структурой многослойного персептрона, ik — зна­ чения на входах нейросети, I — область возможных значений входов для ре­ гулятора. Данная задача нейросетевой аппроксимации неизвестной таблично заданной функции f имеет типовое решение градиентным методом (напри­ мер, b ack-propa gation of error), однако говорить о методике синтеза можно только при обоснованном выборе набора входов НС, внутренней архитекту­ ры и обучающих данных.

Эксперименты с различными наборами входов НС–Р выявили зависи­ мость ошибки имитации от вида рабочего изменения уставки. Для постоянной уставки rk = const оптимальным выбором являются ek... ek-d и ek, ek, где d — длительность переходного процесса в исходной САУ в отсчетах. Для пере­ менной уставки наилучший результат дают входы rk, ek. Для кусочно–посто­ янной уставки наилучшим является вариант rk, ek... ek-d.

При использовании правильно подобранной структуры входов зависимо­ сти качества имитации от количества слоев НС–Р и нейронов в них не бы­ ло обнаружено. В этой связи представляется целесообразным использовать простые двух- и трехслойные сети, теоретически обеспечивающие аппрокси­ мацию произвольной функции. Выбор алгоритма обучения НС также не ока­ зывает существенного влияния на ошибку имитации и управления НС–Р, а определяет только скорость самого обучения.

В проведенных имитационных экспериментах было обнаружено, что наи­ лучшим пробным сигналом для формирования обучающего множества явля­ ется стохастический ряд, распределенный в диапазоне рабочих уставок. Ис­ пользование моногармонического сигнала дает худший результат, а ступен­ чатый пробный сигнал совсем не позволил настроить НС–Р подобно ПИД.

Важным аспектом при формировании обучающей выборки является такое распределение амплитуд сигналов на входе и выходе регулятора, которое охватывает диапазон этих сигналов в основных рабочих режимах контура.

Анализ результатов экспериментов показал, что малая ошибка имитации вне контура не всегда обеспечивает малую ошибку управления в контуре синтезированным НС–Р. В этом проявляется нелинейная природа НС–Р. В частности, как уже отмечалось, настройка НС–Р по ступенчатому пробному сигналу не обеспечивает устойчивое управление в контуре по причине малой площади покрытия обучающими точками рабочего диапазона.

Отмечено, что синтезированный НС–Р в отличие от ПИД не обеспечивал нулевую ошибку управления даже по окончании переходного процесса. Эта ошибка в проведенных экспериментах не превышала 2% от ширины рабочего диапазона уставок. В то же время, сам переходный процесс под управлени­ ем НС–Р становился короче вследствие отсутствия памяти состояния и об­ ратных связей у многослойного персептрона. Также было отмечено меньшее перерегулирование.

Предложенная методика замены ПИД регулятора на нейросетевой при­ менена для управления объектом третьего порядка в присутствии аддитив­ * ной помехи в канале наблюдения. Структура и параметры объекта P (z), * исходного ПИД-регулятора CP ID(z), а также формирующего фильтра стоха­ Рис. 1. Архитектура нейросетевого регулятора с входами rk, ek стической уставки R*(z) и помехи N*(z) перечислены ниже:

z3 - 0.* P (z) = (z - 0.8)(z2 - 0.06z + 0.58) z z2 - 2z + * CP ID(z) = 0.01 1 + + (2) 0.05(z - 1) 0.1(z2 - z) 3z R*(z) = z - 0.N*(z) = 0.Архитектура предложенного НС–Р представлена на рис. 1.

В результате проведенной процедуры обучения был получен НС–Р, обес­ печивший на стохастической выборке снижение среднеквадратической ошиб­ ки управления на 33%, а максимальной ошибки управления — на 34% по сравнению с исходным ПИД регулятором.

Разработанная методика не опирается на предположение о линейности объекта, поэтому она была проверена на существенно нелинейном объекте — химическом реакторе непрерывного действия с перемешиванием (continuous stirred-tank reactor). Синтезированный нейросетевой аналог ПИД регулято­ ра обеспечил устойчивость контура управления, лучшее перерегулирование, более короткий переходный процесс, а также меньшую СКО управления.

В третьей главе предложен метод синтеза нейросетевого регулятора, минимизирующего СКО управления в контуре. Данный метод является раз­ витием косвенного адаптивного управления, однако, в отличие от него, в ка­ честве начального приближения берется НС–Р, полученный в результате ими­ тации некоторого линейного регулятора по методике, изложенной в главе 2.

Критерий синтеза для объекта с наблюдаемой функцией g(uk, s) и адди­ тивной помехой в канале наблюдения nk:

rk - g(uk, s) - nk 2 min (3) k p где uk = N (ik) — управляющее воздействие НС–Р. Приведение ошибки управления к выходу НС–Р можно осуществить с помощью нейросетевой мо­ дели объекта (НС–О) по схеме, показанной на рис. 2.

ek uk yk rk ^ НС–Р НС–О z-ek ^ yk Объект z-ek Рис. 2. Обучение нейросетевого регулятора с помощью инвертирования модели объекта.

Обратное распространение ошибки управления через НС–О к НС–Р, обо­ значаемое как Bo(uk, yk+1, rk+1), неявно вычисляет якобиан объекта Jk:

Bo(uk, yk+1, rk+1) = z-1(uk) + (rk+1 - yk)/Jk (4) Задача сформулирована в предположении фиксированной архитектуры НС–Р. В этом случае, вопросы выбора набора входов и архитектуры реша­ лись только для НС–О. Поскольку нейросетевая модель объекта с обратны­ ми связями имеет известные сложности в использовании (необходим анализ устойчивости, существует проблема исчезающего градиента при обучении), за основу был взят многослойный персептрон, реализующий модель предска­ зания выхода объекта за счет информации о прошлых выходах объекта и управляющем воздействии (рис. 3).

yk+^ yk z-НС–О yk-uk z-yk+Объект o Рис. 3. Пример модели с повторением прошлых состояний yk+1 = N (uk, yk, yk-1).

^ Обучение НС–О вне контура управления осуществлялось по критерию:

o g(uk, s) + nk - N (uk,..., uk-n, yk,..., yk-d) min (5) k Эксперименты с устойчивыми минимальнофазовыми линейными объек­ тами первого-третьего порядков показали, что существенным для обучения НС–О является не порядок объекта, а его инерционность, то есть, длитель­ ность переходного процесса. Обучающее множество должно формироваться из временных рядов длины, не меньшей времени установления переходного процесса объекта. Глубина регрессии n = 1, d = 1 для объектов второго и более высоких порядков оказалась достаточной, чтобы обеспечить обучение НОР в контуре.

Увеличение количества слоев с одного до двух и трех в проведенных экс­ периментах позволило ускорить обучение НС–О и увеличить точность ими­ тации. Число входных нейронов в случае многослойной сети в 1.5–3 раза превышало число входов, а каждый последующий слой состоял из меньшего числа нейронов, чем предыдущий.

Систематически исследовался вопрос формирования выборки для обу­ чения НС–О. Было выявлено, что определяющим требованием к выборке является распределение амплитуд, соответствующее рабочей области возму­ щений и наблюдаемых выходов объекта. Пробный сигнал при этом может быть ступенчатым, гармоническим или стохастическим.

Для исследования влияния НС–О и параметров обучения нейросетевого оптимального регулятора в контуре управления был проведен ряд имитаци­ онных экспериментов в специальных идеальных ус ловиях повторяющегося псевдослучайного ряда уставки и помехи. Данный прием позволил устано­ вить ряд закономерностей, в частности, в противоположность результату из главы 2, было обнаружено, что более сложные архитектуры нейросетевого оптимального регулятора (НОР) оптимизируются быстрее, чем простые од­ нослойные. В случае двух- и трехслойных НОР скорость обучения не зависит от архитектуры НС модели. Коэффициент скорости обучения при пакетном обновлении коэффициентов НОР в контуре управления целесообразно выби­ рать обратно пропорционально периоду обновления.

На рис. 4а показаны среднее значение и отклонение ошибки для финаль­ ной достигнутой СКО (при скорости спада СКО меньше 10-5), а на рис. 4б — среднее и отклонение ошибки на тестовой выборке после обучения.

1 Mean Mean StdDev StdDev 0.1 0.управления а 0.01 0.ошибк а Ошибк 0.001 0.0Финальная 0.0001 0.001 10 100 1000 10000 1 10 100 1000 100Длина эпохи Длина эпохи а) б) Рис. 4. Зависимость 2 от длительности эпохи по завершении обучения (а) и на тестовой выборке (б).

Анализ графиков свидетельствует, что в условиях эксперимента длитель­ ность эпохи (период обновления весов НС–Р при обучении) целесообразно выбрать в пределах от 200 до 400. При меньшем значении обучение НОР подвержено случайным факторам и помехам, а при большем — увеличение длительности обучения не дает снижения СКО управления.

Учитывая стохастический характер СКО управления в реальных услови­ ях и результаты исследований в идеальных условиях, для останова обучения НОР в контуре проверялась гипотеза постоянства среднего значения с по­ мощью статистического критерия серий, основанного на медиане. Выявлено, что оптимальное линейное управление или близкое к нему является худшим стартом для синтеза НОР, чем управление значительно худшего качества.

Сравнительные эксперименты обученного НОР и винеровского оптималь­ ного регулятора, рассчитанного для заданного объекта и сигналов, показали, что НОР с входами rk, ek обеспечивает меньшую абсолютную и СКО управле­ ния как в номинальных условиях, так и при других видах сигналов уставки.

В частности, отмечена меньшая зависимость ошибки управления от частоты гармонической уставки в контуре с НОР по сравнению с винеровским регу­ лятором (рис. 5).

3 2.Винеровский Винеровский Нейросетевой Нейросетевой 2. 1. 1. 0. 0. 0.01 0.1 0.01 0.Частота, 1/отсчеты Частота, 1/отсчеты а) б) Рис. 5. Зависимость максимальной (а) и среднеквадратической ошибки управления (б) от частоты гармонической уставки при винеровском и нейросетевом оптимальном управле­ нии.

В четвертой главе рассматривается задача нейросетевого управления нестационарным объектом. В качестве модели нестационарности было взя­ то ступенчатое изменение параметров объекта. Предложены и исследованы два подхода адаптации НС–Р к изменившимся условиям — метод постоянной СКО управления Ошибка управления адаптации (ПА) и метод адаптации по обнаружению разладки (АР). В рам­ ках первого метода реализована схема косвенного адаптивного управления с постоянно обучающейся моделью объекта, таким образом, подстраиваются весовые коэффициенты как НС–Р, так и НС-О независимо от того, изменил­ ся объект управления или нет. Второй подход подразумевает, что НС–Р и НС–О в стационарном режиме неизменны. При этом ошибка идентификации нейросетевой модели используется для обнаружения разладки по дисперсии с помощью алгоритма кумулятивных сумм (АКС).

При изменении параметров объекта в схеме с постоянной адаптацией под обеих НС начинается со следующей эпохи. В схеме с обнаружением разладки необходимо собрать данные для перенастройки нейросетевой модели объекта вне контура управления, обучить её и, вернув в контур, начать обучение НС–Р подобно тому, как это описано в главе 3. При этом важно чтобы, с одной стороны, обучающая выборка для модели была как можно короче, чтобы быстрее начать подстройку НС–Р, с другой стороны, выборка должна быть достаточного объема для обучения НС–О. Разработан оригинальный подход, позволяющий сформировать обучающую выборку оптимального размера и основанный на оценке параметров двумерного распределения точек (uk, yk+1).

Сравнительные испытания обоих адаптивных подходов проиллюстриро­ ваны на рис. 6.

На графиках рис. 6а видно, что при постоянной адаптации реакция на изменение объекта происходит быстрее, не допускается значительного увели­ чения ошибки управления, однако уровень СКО снижается достаточно мед­ ленно. Адаптация по разладке имеет задержку, вызванную сбором данных для перенастройки НС–Р, однако СКО управления после этого снижается значительно быстрее. Кроме того, рассмотрение обоих подходов на длитель­ ном временном интервале выявляет неустойчивость подхода с постоянной адаптацией (периоды роста ошибки на рис. 6б).

Пятая глава посвящена нейросетевому решению одной из актульных прикладных задачач — управлению мобильным роботом при движении к 1 Без адаптации НС-Р Постоянная адаптация НС-Р Ошибка управления (ПА) Адаптация НС-Р по обнаружению разладки Ошибка идентификации (ПА) 0.8 Ошибка управления (АР) 0.0.0.0.0 0.0 2000 4000 6000 8000 10000 12000 14000 0 5e+05 1e+06 1.5e+06 2e+06 2.5e+06 3e+Дискретное время Дискретное время а) б) Рис. 6. Среднеквадратическая ошибка управления сразу после изменения параметров объ­ екта (а) и во время длительного периода стационарности (б).

неподвижной цели (маяку). Мобильный робот представляет собой тележку с тремя колесами, два из которых являются ведущими, расположены спе­ реди и одно рояльное сзади. Управление движением робота осуществляется подачей одинакового или различающегося напряжения на ведущие приводы.

Сенсором выступает видеокамера, с помощью которой определяется горизон­ тальное отклонение положения робота от направления на маяк.

Задача управления является нелинейной геометрически и динамически, имеет место ошибка в определении направления на маяк, кроме того, пара­ метры приводов не известны точно. В таких условиях имевшийся на роботе линейный П регулятор давал существенную ошибку попадания в цель. По методикам, изложенным в главах 2 и 3 был сначала синтезирован НС–Р, функционирующий подобно исходному П регулятору, а потом с помощью на­ строенной нейросетевой модели НС–Р был обучен в контуре управления для минимизации СКО. Поскольку постановка задачи подразумевает поддержа­ ние постоянного уровеня уставки rk = 0, а объект управления нелинейный, для НС–Р была выбрана трехслойная архитектура с пятью и тремя нейро­ нами в скрытых слоях и входами ek, ek. Модель объекта имела в качестве входов uk, uk-1, yk, yk-1 и один скрытый слой с пятью нейронами.

Адаптация по разладке Среднеквадратическая ошибка Изменение параметров объекта Среднеквадратическая ошибка управления Эксперименты показали, что нейросетевое управление позволило суще­ ственно увеличить точность попадания в маяк по сравнению с исходным П регулятором: средняя ошибка уменьшилась с 49.6 мм до 19.1 мм, а средне­ квадратическое отклонение уменьшилось с 206.6 мм до 33.0 мм. Графики изменения горизонтальной координаты маяка в поле зрения сенсора робота по времени приведены на рис. 7.

250 31st test 2nd test 2200 3rd test 4th test 5th test 2150 6th test а а 11150 маяк маяк а а --динат динат -1-1-1Коор Коор -1-2-2-250 -20 10 20 30 40 50 60 70 80 0 10 20 30 40 50 60 70 Время, отсчеты Время, отсчеты а) б) Рис. 7. Траектория координаты маяка в поле зрения сенсора робота под управлением П регулятора (а) и нейросетевого регулятора по окончании его настройки в контуре (б).

В шестой главе описывается программный пакет для моделирования и обучения методам нейросетевого управления, разработанный для реализации методик, описанных в главах 2-4 и использовавшийся при проведении всех экспериментов включая управление мобильным роботом. Пакет обеспечивает полный комплекс инструментов для моделирования САУ включая нелиней­ ные и нестационарные элементы, а также обладает средствами формирова­ ния архитектуры и обучения нейронных сетей регулятора и модели.

Состав программного обеспечения включает комплекс вычислительных программ, написанных на языке C++ и реализующих алгоритмы моделирова­ ния и обучения нейронных сетей, а также интерактивные программы, напи­ санные на языке Tcl/Tk, обеспечивающие простую и удобную для пользовате­ ля среду взаимодействия. Такая структуризация обеспечивает максимальную гибкость программного обеспечения при минимальных требованиях к аппа­ ратной и программной среде выполнения. В частности, пакет, разработанный для ОС Linux может быть легко адаптирован для ОС Windows и MacOS X.

Для моделирования САУ и обучения нейронных сетей в различных схе­ мах их использования в рамках пакета разработана объектно-ориентирован­ ная библиотека, использующая в качестве базовой абстракции сети Петри.

Программный пакет открыт для интеграции с другими программами, так как использует текстовый формат для представления данных, парамет­ ров вычислительных программ и нейросетей. Кроме того, возможна разра­ ботка сторонних модулей для реализации нелинейных объектов управления и регуляторов любых видов (например, нечетко-логических) и их использо­ вания в среде моделирования САУ.

На основе программного пакета разработаны лабораторные работы для использования в учебном курсе по изучению нейронных сетей по темам:

Синтез нейросетевого оптимального регулятора для замены линейного.

Сравнительный анализ нейросетевого, винеровского и ПИД регулято­ ров.

Нейросетевое управление нестационарным объектом.

Основные результаты 1. Разработана и успешно опробована в ряде имитационных эксперимен­ тов методика замены линейных П, ПИ, ПИД регуляторов на нейросете­ вой. В рамках методики решены актуальные вопросы выбора архитек­ туры нейронной сети регулятора, параметров экспериментальных выбо­ рок и алгоритма обучения. Исследовано влияние указанных аспектов, а также вида и длины пробных сигналов на качество имитации тради­ ционного регулятора нейросетевым. Показана применимость методики для управления линейными объектами до 3-го порядка включительно и существенно нелинейным объектом.

2. Предложен алгоритм синтеза нейросетевого регулятора, минимизирую­ щий среднеквадратическую ошибку управления. Алгоритм использует нейросетевую инверсию по модели предсказания объекта и рассматри­ вается в случае стохастических сигналов уставки и помехи. Экспери­ ментально проведен сравнительный анализ нейросетевого оптимально­ го и винеровского оптимального регуляторов. Отмечена большая ро­ бастность нейросетевого оптимального регулятора по сравнению с ви­ неровским при сравнимом и лучшем качестве управления. Ещё одним преимуществом нейросетевого оптимального регулятора перед винеров­ ским является удобство синтеза, так как нет ограничений на физиче­ скую реализуемость и нет необходимости в аналитической идентифика­ ции объекта и сигналов.

3. Разработаны два нейросетевых алгоритма управления нестационарным объектом: с постоянной адаптацией регулятора и модели, и с адапта­ цией по обнаружению разладки с помощью алгоритма кумулятивных сумм. Исследован вопрос накопления обучающей выборки для подстрой­ ки модели объекта. Проведено сравнение обоих алгоритмов. Отмечено, что алгоритм с обнаружением разладки обеспечивает большую эконо­ мичность и устойчивость управления, чем метод с постоянной адапта­ цией регулятора.

4. В рамках натурных экспериментов успешно решена задача нейросетево­ го управления автономным мобильным роботом при движении на непо­ движный маяк. При этом использовались предложенные методики по замене линейного регулятора на нейросетевой и синтеза нейросетевого оптимального регулятора.

5. Развитые методы нейросетевого управления реализованы в оригиналь­ ном модульном интерактивном программном комплексе, обеспечиваю­ щем полную среду для изучения и сопоставления нейросетевых алгорит­ мов в системах автоматического управления. Данный комплекс адапти­ рован для использования в учебном процессе в качестве базового для проведения лабораторных и исследовательских работ студентами.

Публикации по теме диссертации 1. Елисеев В. Л., Филаретов Г. Ф. Методика синтеза нейросете­ вой системы управления нестационарным объектом // Вестник МЭИ. 2010. № 3. С. 100–106.

2. Елисеев В. Л., Филаретов Г. Ф. Программный пакет для мо­ делирования и обучения методам нейросетевого управления // Открытое образование. 2011. № 2(86), Ч.2. С. 98–101.

3. Елисеев В. Л. Нейросетевое оптимальное управление движением мобиль­ ного робота // Доклады 10-го Всероссийского семинара “Нейроинформа­ тика и ее приложения”. Красноярск: 2002. — октябрь.

4. Елисеев В. Л. Методика построения обучающей выборки при нейросе­ тевой идентификации в условиях стохастических сигналов // Труды XXXVII международной конференции “Информационные технологии в науке, образовании, телекоммуникации и бизнесе”. Алушта: 2010. — май.

5. Елисеев В. Л. Нейросетевой аналог ПИД регулятора при управлении нелинейным объектом // Труды XVI всероссийской научно-технической конференции студентов, молодых ученых и специалистов “Новые ин­ формационные технологии в научных исследованиях”. Рязань: 2011.

С. 199–201.

6. Елисеев В. Л., Зенкевич С. Л. Метод нейросетевого оптимального управ­ ления // Труды Девятой Всероссийской научно-практической конферен­ ции “Актуальные проблемы защиты и безопасности”. Т. 5. Санкт-Петер­ бург: 2006. — апрель. С. 251–256.

7. Елисеев В. Л., Филаретов Г. Ф. Моделирование ПИД-контроллера с по­ мощью искусственной нейронной сети // Перспективные технологии ав­ томатизации. Вологда: 1999. С. 108.

8. Елисеев В. Л., Филаретов Г. Ф. Особенности настройки нейросетевого регулятора в контуре управления // Труды XV международного научно­ технического семинара “Современные технологии в задачах управления, автоматики и обработки информации”. Алушта: 2006. — сентябрь. С. 155.

9. Филаретов Г. Ф., Елисеев В. Л. Нейросетевой оптимальный регулятор // Доклады международной конференции “Информационные средства и технологии”. Т. 3. Москва: 2000. — октябрь. С. 64–67.

10. Филаретов Г. Ф., Елисеев В. Л. Особенности применения нейронных сетей в системах управления // Доклады международной конференции “Ин­ формационные средства и технологии”. Москва: 2003. — октябрь.

11. Филаретов Г. Ф., Елисеев В. Л., Аверченков Е. О. Разработка программ­ ных средств нейросетевого моделирования случайных процессов и систем управления // Доклады международной конференции “Информационные средства и технологии”. Москва: 1999. — октябрь.

12. Eliseev V. L., Filaretov G. F. Software tool for neural network control algo­ rithm research // 45h International Scientific Colloquium,. Ilmenau Technical University: 2000. — October.

13. Filaretov G. F., Eliseev V. L. Modified Algorithm of Neural Network Con­ trol for Non-stationary Object // 55h International Scientific Colloquium.

Ilmenau University of Technology: 2010. — September.






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.