WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


На правах рукописи

СТАРИЦЫН МАКСИМ ВЛАДИМИРОВИЧ

ПРИНЦИП МАКСИМУМА ДЛЯ ЗАДАЧ ИМПУЛЬСНОГО УПРАВЛЕНИЯ С ОГРАНИЧЕНИЯМИ СМЕШАННОГО ТИПА И ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА ЭКСТРЕМАЛЕЙ

05.13.01 – Системный анализ, управление и обработка информации (в технике, экологии и экономике)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-математических наук

Иркутск – 2012

Работа выполнена в Федеральном государственном бюджетном учреждении науки Институте динамики систем и теории управления Сибирского отделения РАН (ИДСТУ СО РАН).

Научный консультант: кандидат физико-математических наук, доцент Гончарова Елена Владимировна,

Официальные оппоненты: доктор физико-математических наук, профессор Сесекин Александр Николаевич УрФУ им. Б.Н. Ельцина, зав. кафедрой кандидат физико-математических наук, доцент Антипина Наталья Валерьевна, БГУЭП, доцент

Ведущая организация: Институт программных систем им. А.К. Айламазяна РАН (г. Переславль-Залесский)

Защита состоится 17 мая 2012 г. в 13:00 ч. на заседании диссертационного совета Д 003.021.01 в ИДСТУ СО РАН по адресу: 664033, Иркутск, ул. Лермонтова, 134.

С диссертацией можно ознакомиться в библиотеке и на официальном сайте www.idstu.irk.ru ИДСТУ СО РАН.

Автореферат разослан 16 апреля 2012 г.

Ученый секретарь диссертационного совета д.ф.-м.н. А.А. Щеглова

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Диссертационная работа посвящена исследованию задач оптимального управления импульсными гибридными системами. Этот класс моделей описывается дифференциальными уравнениями с мерами при ограничениях смешанного типа, связывающих фазовую траекторию и управляющую меру.



Актуальность темы. Объектом исследования теории оптимального импульсного управления являются задачи оптимизации с разрывными траекториями и управлениями типа мер, или более широко, типа обобщенных функций (распределений). Задачи импульсного управления появляются при расширении так называемых вырожденных классических задач оптимального управления, решение которых не существует в классе обычных измеримых управлений (в первую очередь речь идет о системах с линейной зависимостью от неограниченного управления). На практике такие вырожденные задачи (иногда сразу в расширенной, импульсной постановке) возникают в таких высокотехнологичных отраслях, как ракетодинамика, лазерная технология, телекоммуникация, энергетика, робототехника, квантовая электроника, экономика, экология и др.

Основы теории импульсного управления были заложены в работах Н.Н. Красовского, С.Т. Завалищина, А.Б. Куржанского, В.Ф. Кротова, В.И. Гурмана, Р. Ришела, Дж. Варги. Дальнейшее развитие этой теории связано с именами А.В. Арутюнова, А. Брессана, Р. Винтера, В.А. Дыхты, Б.М. Миллера, М. Мотта, Ф.Л. Перейра, Ф. Рампаццо, А.Н. Сесекина, Ж.Н. Силва, Т.Ф. Филипповой, А.Г. Ченцова и др.

Наибольшую сложность и практический интерес представляют задачи импульсного управления с траекториями ограниченной вариации и управлениями типа векторной меры. Разные классы таких задач при фазовых ограничениях и некоторых типах смешанных ограничений изучались в работах Б.М. Миллера и Е.Я. Рубиновича1), А.В. Арутюнова, Д.Ю. Карам2) зина и Ф.Л. Перейра, В.А. Дыхты и О.Н. Самсонюк3) и др. Важной спецификой подобных моделей является неоднозначная интерпретация условий фазового и смешанного типа, что порождает различные возможные 1) Миллер Б.М., Рубинович Е.Я. Оптимизация динамических систем с импульсными управлениями. M.: Наука, 2005. 429 с.

2) Arutyunov A.V., Karamzin D.Yu., Pereira F.L. On Constrained Impulsive Control Problems. Journal of Mathematical Sciences. 2010. V. 165, № 6. P. 654–688.

3) Дыхта В.А., Самсонюк О.Н. Оптимальное импульсное управление с приложениями. М.: ФИЗМАТЛИТ, 2000. 256 c.

постановки задач, типы локального оптимума и условия оптимальности.

В исследовании различных классов задач импульсного управления нелинейными системами с траекториями ограниченной вариации весьма эффективным оказался метод разрывной замены времени. В оптимальном импульсном управлении этот метод ведет свою историю от работ Р. Ришела и Дж. Варги, хотя еще на рубеже 20-х гг. XX века он, фактически, применялся А.М. Размадзе при исследовании нерегулярных вариационных задач. При исследовании нерегулярных задач оптимального управления важную роль играют и другие методы — преобразование Гурмана4) к производной задаче и нелинейный вариант преобразования Гоха3), которые (как и метод замены времени) позволяют свести задачу импульсного управления к классической.

Необходимые и достаточные условия оптимальности в теории импульсного управления были получены как для задач без ограничений на распределения (когда траектории являются функциями класса L), так и при наличии таковых (с траекториями ограниченной вариации). Первые и наиболее полные результаты по необходимым условиям оптимальности в задачах с траекториями ограниченной вариации получены в серии работ Б.М. Миллера. В дальнейшем теория принципа максимума для различных классов таких задач развивалась в работах А.В. Арутюнова, А. Брессана, Р. Винтера, В.А. Дыхты, С.Т. Завалищина, Б.М. Миллера, Ф.Л. Перейра, А.Н. Сесекина, Ж.Н. Силва.

В диссертации исследуется задача импульсного управления при смешанных ограничениях на траекторию и управляющую меру, которые отличаются от других известных типов смешанных ограничений. Подобные модели подходят для формализации некоторых процессов из робототехники (например, при описании движения манипуляторов с блокируемыми степенями свободы), а также систем мониторинга и контроля экологических и эпидемиологических процессов. Таким образом, получение необходимых условий оптимальности для таких задач и развитие методов их эквивалентного преобразования к классическим задачам оптимального управления являeтся актуальным направлением исследования.

На фоне внушительного списка работ по численным методам для классических задач оптимального управления библиография, посвященная вычислительным методам решения задач импульсного управления, является довольно скромной. В работах В.И. Гурмана, В.А. Батурина, Е.В. Да4) Гурман В.И. Вырожденные задачи оптимального управления. М.: Наука, 1977. 304 c.

нилиной, В.А. Дыхты, Н.В. Деренко, Е.В. Гончаровой, И.О. Верхозиной и др. предложены алгоритмы улучшения для задач оптимального управления системами с траекториями класса L. Методы градиентного спуска для задач оптимального управления импульсными гибридными системами с конечным числом автономных переключений разработаны В.В. Ажмяковым и его коллегами. В статьях А.Б. Куржанского, А.Н. Дарьина развиты численные алгоритмы синтеза импульсных управлений для линейных задач с траекториями ограниченной вариации. Разработка вычислительных методов решения нелинейных задач импульсного управления с траекториями ограниченной вариации является актуальной задачей.

Предмет и объект исследования. Объектом исследования являются задачи оптимального управления импульсными гибридными системами (ИГС), которые описываются дифференциальными уравнениями с мерами при ограничениях вида Q(t, x(t-)) = 0, Q(t, x(t)) = 0, (t, x(t)) 0 dµ-п.в.

Здесь x(·) — фазовая траектория, удовлетворяющая дифференциальному уравнению с мерами, dµ — скалярная неотрицательная мера ЛебегаСтилтьеса (импульсное управление). Предмет исследования — необходимые условия оптимальности для задач оптимального управления ИГС и численные методы решения нелинейных задач оптимального импульсного управления с траекториями ограниченной вариации.

Целью работы является доказательство принципа максимума для задач оптимального управления импульсными гибридными системами и построение вычислительных методов импульсного управления в некоторых классах задач с траекториями ограниченной вариации.

Методы исследования базируются на принципе максимума для классических задач оптимального управления с фазовыми ограничениями5), серии методов численного решения классических задач оптимального управления6), методе разрывной замены времени7), а также модифицированном преобразовании времени (адаптированном для задач оптимального управления ИГС). Метод разрывной замены времени сводит задачу импульсного управления к классической, а окончательные результаты 5) Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука, 1974. 480 с.

6) Срочко В.А. Итерационные методы решения задач оптимального управления. М.: ФИЗМАТЛИТ, 2000. 160 с.

7) Миллер Б.М. Метод разрывной замены времени в задачах управления дискретно-непрерывными системами // Автоматика и телемеханика. 1993. № 12. C. 3–32.





получаются путем расшифровки в терминах исходной модели принципа максимума и алгоритмов улучшения в соответствующих преобразованных классических задачах.

Кроме того, в работе используются теория функции вещественного переменного и аппарат дифференциальных уравнений с мерами.

Научная новизна. В работе предложена новая модификация метода разрывной замены времени, подходящая для задачи оптимального управления ИГС. Отметим, что другие реализации метода замены времени не применимы в этой задаче. Полученный в работе принцип максимума является первым из известных автору результатов по необходимым условиям оптимальности первого порядка для задач оптимального импульсного управления со смешанными ограничениями на меру и траекторию.

Разработанные в диссертации процедуры численного решения нелинейных задач импульсного управления с траекториями ограниченной вариации при ограничении на полный импульс управляющего воздействия являются новыми.

Предложены новые формализации задач оптимального импульсного управления динамикой численностей конкурирующих популяций и быстродействия в двух моделях манипуляторов с блокируемой степенью свободы.

Достоверность и обоснованность результатов диссертационной работы обусловлена строгостью доказательств, адекватными результатами вычислительных экспериментов, апробацией и обсуждением на научных конференциях, а также экспертизой публикаций в ведущих научных журналах.

Теоретическая и практическая значимость. Полученные в работе результаты по преобразованию задачи оптимального управления ИГС к классической могут применяться для разработки методов качественного исследования задач оптимального управления ИГС (например, для получения условий оптимальности, инвариантности и др.). Принцип максимума может применяться при решении задач оптимального управления ИГС.

Практическое значение полученных результатов определяется широким спектром прикладных задач импульсного управления, которые описываются классом моделей ИГС, и возможностью их численного решения на базе разработанных методов.

Проблематика работы является составной частью исследований, выполнявшихся в ИДСТУ СО РАН по базовому проекту “Методы оптимального управления при структурных воздействиях и неопределенностях с приложением к техническим и социально-эколого-экономическим системам” (№ гос. регистрации 01.2.007 08580) в рамках программы фундаментальных исследований СО РАН, 2007–2009 гг., по проекту III.24.1.3.“Методы и вычислительные технологии исследования задач управления с приложениями к социальным, экономическим, природным и техническим системам” (№ гос. регистрации 01.2.010 01345), 2010, 2011 гг., а также по проектам РФФИ 05–01–00477, 08–01–00156.

Соответствие диссертации паспорту научной специальности.

В соответствии с паспортом специальности 05.13.01 в диссертации проведено теоретическое исследование сложных задач динамической оптимизации (задач импульсного управления при нестандартных смешанных ограничениях); предложен конструктивный метод сведения этих задач к классическим, использующий технику разрывной замены времени; разработано специальное математическое и программное обеспечение для решения оптимизационной задачи (пп. 1, 4, 5 области исследований).

Апробация работы. Результаты диссертации докладывались на 5-й Международной научной конференции по физике и управлению (PhysCon 2011), Леон, Испания, 2011; 18-м Всемирном конгрессе Международной федерации по автоматическому управлению (The 18th IFAC World Congress), Милан, Италия, 2011; Российско-монгольской конференции молодых ученых по математическому моделированию, вычислительноинформационным технологиям и управлению, Иркутск, Россия — Ханх, Монголия, 2011; 2-й Международной школе-семинаре “Нелинейный анализ и экстремальные задачи”, Иркутск, 28 июня – 4 июля 2010; X Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям, Ханх, Монголия, 2009; XIV и XV Байкальских международных школах-семинарах “Методы оптимизации и их приложения”, Иркутск — Северобайкальск, 2008, и Иркутск — Листвянка, 2011; 8-й Португальской конференции по автоматическому управлению (CONTROLO’2008), Вила Реал, Португалия, 2008; IV Международном симпозиуме “Обобщенные решения в задачах управления” (GSCP’08), Улан-Удэ, 2008; 9-й школе-семинаре “Математическое моделирование и информационные технологии”, Иркутск, 2007; 7-й Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям, Новосибирск, 2007, а также на ежегодных конференциях “Ляпуновские чтения”, Иркутск, 2008–2010. Результаты диссертации обсуждались на семинаре в Институте математики Университета г. Севилья, Испания (май, 2010) и регулярно — на семинарах ИДСТУ СО РАН.

Публикации и личный вклад автора. По материалам диссертации опубликовано 15 работ, в том числе статьи [1–5] в журналах, рекомендованных ВАК РФ. На защиту выносятся результаты, полученные автором самостоятельно. В статьях [1–3, 7, 8] Е.В. Гончаровой принадлежат постановки задач оптимального импульсного управления со смешанными ограничениями на меру и траекторию и модифицированное преобразование времени для учета такого типа ограничений. Автором диссертации в этих работах получен вид редуцированной задачи, дано обоснование метода преобразования исследуемой задачи к классической на основе модифицированного преобразования времени и доказан принцип максимума. В работах [4, 5] Е.В. Гончаровой принадлежит идея построения методов приближенного решения нелинейных задач импульсного управления с траекториями ограниченной вариации с использованием метода разрывной замены времени. Расшифровка алгоритмов и доказательства теорем о сходимости получены автором. В публикациях [6, 9] автору принадлежит техническая реализация общего вычислительного метода оптимального управления дискретно-непрерывными процессами. Программная реализация вычислительных методов и численный анализ модельных и прикладных задач проведены автором работы.

Структура и объем диссертации. Диссертация состоит из введения, трех глав, заключения и списка литературы, включающего 194 наименования. Общий объем диссертации составляет 143 страницы, из которых 124 страницы основного текста, включающего 29 рисунков и 2 таблицы. Результаты главы 1 опубликованы в работах [1–3, 7, 8], результаты главы 2 — в работах [4–6, 9], результаты главы 3 — в работах [1, 6].

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во Введении обосновывается актуальность темы исследования, дается краткий обзор имеющейся литературы и характеризуются основные результаты диссертационной работы.

Первая глава содержит основные теоретические результаты. В § 1.приводится постановка задачи оптимального управления импульсной гибридной системой (ИГС) следующего вида:

dx = f(t, x, u) dt + g(t, x, u) dµ, (1) x(0-) = x0, (2) u(t) U L, dµc-п.в., (3) (t, x(t)) 0, (4) Q-(t, x(t-)) = 0, Q+(t, x(t)) = 0 dµ-п.в., (5) (t, x(t-)) 0, (t, x(t)) 0 dµ-п.в., (6) µ(T ) M. (7) + Здесь x0 Rn; x(·) BV ([0, T ], Rn) являются непрерывными справа функциями ограниченной вариации; u(·) — измеримые по Борелю функции; dµ — регулярная неотрицательная мера, порожденная (неубываю+ щей) функцией µ(·) BV ([0, T ], R), µ(0-) = 0, dµc — непрерывная компонента разложения Лебега меры dµ; M — положительное число. Предполагается, что (0, x0) 0.

Приняты следующие предположения: множество U Rm выпукло и компактно; функции f и g непрерывны по совокупности переменных, удовлетворяют локальному условию Липшица и линейного роста по x;

вектор-функции и непрерывны по (t, x); Qi, i {-, +}, — непрерывные неотрицательные вектор-функции; множество F(t, x, U, [0, 1]) := {F(t, x, u, )| u U, [0, 1]}, где F(t, x, u, ) = (1 - )f(t, x, u) + g(t, x, u), выпукло при всех (t, x).

Под траекторией системы (1), (2) при управлениях u(·), dµ понимается непрерывная справа функция x(·) ограниченной вариации, удовлетворяющая всюду на отрезке времени [0, T ] интегральному соотношению t t x(t) = x0 + f(, x, u)d + g(, x, u)dµc() + [x()]. (8) 0 Cуммирование в (8) ведется по Dµ [0, t]. Здесь Dµ = { [0, T ] :

[µ()] = 0} — множество точек разрыва функции µ(·). Интеграл по мере понимается в смысле Лебега–Стилтьеса. Скачки функции x(·) в точках Dµ определяются равенствами [x()] = (T) - x(-), где T = [µ()], а функции (·) AC([0, T], Rn) удовлетворяют системе () = g(, (), u()), u() U L-п.в. [0, T], (0) = x(-). (9) Систему (9) назовем предельной, а семейство X(·) = {(·), u(·)}D буµ дем называть пополнением графика разрывной траектории x(·). Скажем, что пополнение X(·) графика траектории x(·) является допустимым, если при каждом Dµ оно удовлетворяет ограничениям (, ()) 0, [0, T]. (10) Рассмотрим задачу оптимального управления импульсной гибридной системой (P ) I = F (x(T )) inf при ограничениях (3)–(10).

Здесь функция F (x) непрерывна. Набор = (x(·), u(·), dµ(·), X(·)), удовлетворяющий всем условиям (3)–(10), будем называть допустимым процессом задачи (P ). Совокупность всех допустимых процессов задачи (P ) обозначим через (P ).

Раздел 1.2 посвящен модификации метода разрывной замены времени для задач оптимального управления ИГС. Эта модификация приводит к следующей редуцированной классической задаче оптимального управления на нефиксированном отрезке времени [0, S], S T :

(RP ) J = F (y+(S)) inf при ограничениях =, ± =f(, y+, v)+(1-)± g(, y±, v), ± =(1-)±, (11) (0)=±(0) =0, y±(0)=x0, (12) (S)=T, +(S) = -(S) M, y+(S) = y-(S), (S, y+(S)) 0, (13) v(s) U, (s), ±(s) [0, 1], +(s)+-(s)=1, (14) (s)((s), y+(s)) 0, (15) (1 - (s))-(s)((s), y-(s)) 0, (16) S -(s) - +(s) 0, Jj = j(s) ds = 0, j = 1, 3. (17) Здесь траектории (·), yi(·) и i(·), i {+, -}, являются абсолютно непрерывными функциями, управления v(·), (·) и i(·) — измеримые по Борелю, условия (14)–(16) выполняются L-п.в. на [0, S], функции j в (17) имеют вид 1 = (+ - - + (y+ - y-)), где (x) = x, x, 2 = (1 - )+Q-(, y-) и 3 = (1 - )-Q+(, y+). Остальные входные данные в (RP ) — те же, что и в задаче (P ). Через (RP ) будем обозначать множество процессов = (z(·), (·); S), допустимых в задаче (RP ), т.е. удовлетворяющих условиям (11)–(17). Здесь z = (, y, ) и = (v, , ), y = (y+, y-), а и определяются аналогично.

Редуцированная задача (RP ) эквивалентна (P ) в следующем смысле.

Теорема 1. Пусть = (x, u, dµ, X) (P ). Тогда существует процесс = (z, ; S) (RP ) такой, что S = (T ), (t) = t + 2µ(t), t [0, T ], и равенства y+((t)) = y-((t)) = x(t), +((t)) = -((t)) = µ(t) (18) выполняются всюду на отрезке времени [0, T ].

Теорема 2. Пусть (RP ). Тогда существует (P ) такой, что выполняются равенства (18), где (t) = inf{s [0, S] : (s) > t}, t [0, T ), и (T ) = S.

Теорема 3. Оптимальные процессы и в задачах (P ) и (RP ) существуют одновременно, причем I() = J().

В § 1.3 получены необходимые условия оптимальности в задаче (P ) путем анализа условий понтрягинского минимума в редуцированной задаче (RP ).

Во избежание громоздкости будем считать, что , и Q± — скалярные функции и , не зависят явно от времени t. Предположим дополнительно, что функции f, g, Q± имеют непрерывные частные производные по t, x; F, и непрерывно дифференцируемы. Введем в рассмотрение функции Понтрягина вида Ha(t, x, t, x, u)=x, f(t, x, u) + t, Hs(t, x, x, µ, u)=x, g(t, x, u) + µ, расширенные функции Понтрягина Ha(t, x, t, x, u; l)=Ha(t, x, t, x, u) - l(x), s H±(t, x, x, µ, u; ) = Hs(t, x, x, µ, u) - Q±(t, x), s s H±(t, x, x, µ, u; , q) = H±(t, x, x, µ, u; ) - q(x), s а также соответствующие гамильтонианы Ha = maxuU Ha и Hs,..., H±, определяемые аналогично. Здесь = (t, x, µ) — вектор переменных, сопряженных к (t, x, µ) (µ формально считается фазовой переменной), l, , q — скалярные множители Лагранжа, = max{0, } и обозначение имеет аналогичный смысл.

Теорема 4. Пусть (P ) — оптимальный процесс. Тогда существует нетривиальный набор = ({k}, b(·), {c}, d, d, d, (·)) множи телей Лагранжа, такой что выполнены следующие условия:

+ a) k R, k = 0, 7, 0, 2, 6 0, 8 Rn; b(·) BV ([0, T ], R) — неубывающая функция, b(0-) = 0; c [b()], Dµ, — неотрицательные числа; d и d — скалярные неотрицательные меры, определенные на B[0,T ]8) и абсолютно непрерывные относитель но мер Лебега и dµ соответственно; d, Dµ, — скалярные c неотрицательные меры, каждая из которых определена на B[0,T ], T = [µ()], и абсолютно непрерывна относительно меры Лебега;

+ (·) BV ([0, T ], R2n+3), = (t, x, x, µ, µ ).

+ - + b) Справедливы равенства 2(µ(T ) - M) = 0, 6(x(T )) = 0, меры d и d локализованы соответственно на множествах {t [0, T ] : (x(t)) = 0} и {t [0, T ] : (x(t)) = 0}, при любом Dµ мера d локализована на множестве { [0, T] : (()) = 0}.

c) Компоненты µ(·), i {+, -}, вектор-функции (·) имеют вид i µ (t) = 3(t - T ) + b(T ) - b(t) - 2 - 7, + µ (t) = 3(T - t) + b(t) - b(T ) + 7, t [0, T ].

Функции t(·), x(·) удовлетворяют системе дифференциальных i уравнений с мерами s s dt = - Hadt - (H+ + H-)dµ, t t s dx = - Hadt - H+dµ + 4 d, (19) + x x s dx = - H-dµ + 5 d x при условиях t(T ) = -1, x (T ) = -F (x(T ))-6(x(T ))-8, + x (T ) = 8. В уравнениях (19) производные функций Ha, His подсчитываются вдоль наборов (t, x, t, x + x, u) и (t, x, x, µ, u; 3) + - i i соответственно, а производные функций и вычисляются в точке x. Скачки функций t(·), x(·) в точках Dµ определяi ются соотношениями [t()] = t() - pt,+(0), [x()] = x() - px,i(0).

i i 8) B[0,T ] — -алгебра борелевских подмножеств [0, T ].

Функции pt,i(·) и px,i(·), i {+, -}, удовлетворяют на отрезке [0, T] сопряженной предельной системе dpt,i =- Hs(, , px,i, µ(), u) d, i t dpx,i =- Hs(, , px,i, µ(), u) d+5() di i x при условиях pt,-(T) = t (), pt,+(T) = pt,-(0), px,i(T) = x().

i Здесь d- = d, d+ — нулевая мера.

d) Равенства Ha(t, x, t, x + x, u) = Ha(t, x, t, x + x ), + - + s s max{H-(t, x, x, µ, u; 3), H+(t, x, x, µ, u; 3)} = + + - s s = max{H-(t, x, x, µ ; 3), H+(t, x, x, µ ; 3)} + + - выполняются соответственно L-п.в. и dµ-п.в. на [0, T ].

c e) Неравенство s s Ha max{H-, H+} выполняется L-п.в. на [0, T ] \ supp{dµ}, а неравенство c s s Ha max{H-, H+} s справедливо dµ-п.в. на [0, T ]. Здесь функции Ha и H± вычисляются c вдоль наборов (t, x, t, x +x ) и (t, x, x, µ ; 3, 5) соответствен+ - s но, а функции H± — в точках (t, x, x, µ ; 3).

f) При каждом Dµ условия Hs(, , px,i, µ(), u) = Hs(, , px,i, µ()), i {-, +}, i i Ha(, , pt,+, px,+ + px,-(T); 4) Hs(, , px,+, µ ()+c, u) + + +3( + ( -x(-))), Ha(, x(), pt,-, px,- + px,+(T)) Hs(, , px,-, µ ()-c, u) + - +3([µ()] - + (x() - )) выполняются L-п.в. на [0, T].

Полученные условия оптимальности близки по форме к принципу максимума для слабых решений в задачах импульсного управления с фазовыми ограничениями и необходимым условиям оптимальности обобщенных решений гибридных систем с односторонними ограничениями9).

Возникновение в качестве множителя Лагранжа неизвестной функции b(·) ограниченной вариации, а также повышение размерности сопряженных переменных связаны со смешанными ограничениями (5), (6). Условия e) оптимальности носителя непрерывной компоненты управляющей меры устанавливают приоритеты между возможными режимами поведения системы. Группа условий f) отвечает за локализацию моментов импульсов и правильный выбор пополнения X(·) = {(·), u(·)}D графика тра µ ектории x(·).

Вторая глава посвящена методам приближенного решения задач оптимального импульсного управления. Здесь предлагается конструкция методов оптимизации импульсных управлений на основе редукции к классическим задачам оптимального управления с помощью сингулярных пространственно-временных преобразований. Для приближенного решения задачи (P ) применяется общая “концептуальная” схема: 1) преобразование импульсного процесса к процессу классической задачи оптимального управления с помощью методов редукции; 2) применение подходящей базовой процедуры для приближенного решения преобразованной задачи;

3) восстановление искомого импульсного процесса с помощью обратного преобразования времени. Полученные в работе аналитические соотношения, описывающие прямой и обратный переход между допустимыми процессами задач (P ) и (RP ), позволяют использовать готовые программные продукты для численного решения задачи оптимального управления ИГС, в частности в диссертационной работе применяется пакет OPTCON III10).

В §2.1 рассматривается задача оптимизации управления простейшей гибридной системой — моделью “с толчками” (дискретно-непрерывной си9) Miller B.M., Bentsman J. Optimal control problems in hybrid systems with active singularities // Nonlinear Anal. 2006. V. 65, № 5. P. 999–1017.

10) Зароднюк Т.С. Вычислительные технологии поиска глобального экстремума в задаче оптимального управления с параллелепипедными ограничениями: Дис... канд. тех. наук: 05.13.01; ИДСТУ СО РАН. Иркутск, 2011. 138 с.

стемой, ДНС) I = F (x(T )) inf, (20) = f(t, x, u), x(0-) = x0, (21) [x(i)] = g(, x(i-), i), (22) i u U, i M. (23) Здесь t [0, T ], x(·) BV ([0, T ]; Rn), u(·) — борелевские функции со значениями в выпуклом компактном множестве U Rr. Моменты i приложения импульса не фиксированы и вместе с векторами i Rm подлежат определению в результате оптимизации критерия качества (20). Для данной задачи дана конструкция общего вычислительного метода оптимизации. Конструкция включает процедуру аппроксимации обобщенных решений ДНС (слабых- пределов последовательностей траекторий системы (21)–(23)) траекториями дискретно-непрерывной системы.

Подход к численному решению задачи (P ) может состоять в переходе к задаче оптимального управления нелинейным дифференциальным уравнением с мерами, в которой ограничения вида (4)–(6), (10) предварительно сняты с помощью метода штрафов. В § 2.2 исследуется простейшая задача такого типа:

I = F (x(T )) min, (24) dx = f(t, x, u)dt + G(t, x)d, x(0-) = x0, (25) T u(t) U, |d| M, (26) где мы дополнительно предполагаем, что векторные поля, определяемые столбцами матрицы G, коммутируют (модель удовлетворяет условиям корректности типа Фробениуса).

Решена задача о расшифровке (базовых) вычислительных алгоритмов поиска субэкстремальных процессов, основанных на процедурах слабого и игольчатого (понтрягинского) варьирования управлений5) в соответствующей редуцированной задаче1). Формулируются вычислительные алгоритмы для задачи (24)–(26), исследуются их свойства. В алгоритмах присутствует этап построения модифицированного преобразования времени, которое представляет собой результат “варьирования” временных шкал и отвечает в конечном итоге за изменение носителя управляющей меры.

Обозначим через (A1) вычислительный алгоритм, полученный в результате расшифровки базового метода, использующего процедуру слабого варьирования.

Теорема 5. Пусть 0 = (x0(·), u0(·), d0) — допустимый процесс задачи (24)–(26), не удовлетворяющий условиям линеаризованного принципа максимума1). Тогда алгоритм (A1) определяет новый допустимый процесс 1 = (x1(·), u1(·), d1) задачи (24)–(26) со свойством улучшения I(1) < I(0).

Введем в рассмотрение неотрицательную величину T (0) = (t)d0(t) + |[0()]| ()d, c 0 Dкоторая определяет меру уклонения процесса 0 от выполнения условий линеаризованного аналога (в части условий максимума по ограниченному управлению u) принципа максимума в задаче (24)–(26). Через d0 мы обоc значаем непрерывную компоненту разложения меры Лебега–Стилтьеса d0, порожденной функцией 0(t) = t + Var[0,t] 0(·), t [0, T ], = max H(t, x0, , 0), - 0, U 0 () = max H(, (), q(), p(), 0()), -0(), D, U H = Ha + (1 - )Hs, [0, 1], Ha(t, x, p, q, u) = p, f(t, x, u) + q и Hs(t, x, p, l) = p, G(t, x)l — функции Понтрягина. Здесь = (u, , l), U = U [0, 1] B, а функции 0(·) и l0(·) заданы соотношениями 0(t) = 0(0(t)), l0(t) = d0(t)/|d0(t)|, t [0, T ], где 0(·) — функция, обратная к 0(·), d0/|d0| означает производную Радона–Никодима меры d0 по мере полной вариации |d0|, D0 = { [0, T ] : |[0()]| > 0} — множество точек разрыва функции 0(·). Под управлением u0(·) понимается фиксированный представитель соответствующего класса эквивалентности — борелевская функция, такая что u0(t) U всюду на [0, T ]. Функция (·) = (t(·), x(·)) определяется на одном из этапов алгоритма (A1) как решение сопряженной системы дифференциальных уравнений с мерой dt = -tHadt - Hs|d0|, t(T ) = -, t dx = - Hadt - Hs|d0|, x(T ) = -F (x0(T )), x x где производные функций Понтрягина вычисляются вдоль (x0, u0, l0). При 0 каждом D функция (·) удовлетворяет на [0, 1] предельной системе () = G(, ())[0()], (0) = x0(-), а функции q(·) и p(·) — сопряженной предельной системе q() = -tHs(, 0(), p(), l0())|[0()]|, q(1) = t(), () = - Hs(, 0(), p(), l0())|[0()]|, p(1) = x().

x Следующая теорема характеризует сходимость итерационного процесса алгоритма (A1) по невязке линеаризованного принципа максимума.

Теорема 6. Пусть k — последовательность допустимых процессов задачи (24)–(26), генерируемая алгоритмом (A1), тогда (k) 0 при k .

Критерием остановки алгоритма (A1) является достаточная малость невязки (0).

Алгоритм (A2), основанный на процедуре игольчатого варьирования управлений в редуцированной задаче, улучшает процессы, не удовлетворяющие принципу максимума в задаче (24)–(26), и сходится по соответствующей невязке. В отсутствие ограниченного управления процедуры (A1) и (A2) порождают в исходной задаче улучшения итеративный процесс, который сходится по невязке принципа максимума для импульсных управлений.

Третья глава посвящена апробации разработанного метода редукции и предложенной вычислительной процедуры. Здесь идеи и методы, изложенные в предыдущих главах, применяются для численного исследования ряда иллюстративных и прикладных моделей.

В § 3.1 описывается вычислительный эксперимент, приводятся результаты расчетов для набора тестовых задач оптимального управления ДНС. Для тестирования численных методов была разработана программная реализация общей процедуры, в качестве базового применялся алгоритм проекции градиента. Программа реализована в среде Visual Basic 6.0. В ряде примеров получены процессы, отвечающие обобщенным решениям ДНС (т.е. слабым- пределам последовательности дискретнонепрерывных траекторий).

Параграф 3.2 посвящен анализу трех моделей из математической теории биологических систем и робототехники. Первая задача — оптимальное управление популяцией паразитических организмов с помощью их естественных биологических врагов. Предполагается, что популяционная динамика отвечает импульсной модели типа Лотки–Вольтерра, а критерием качества управления выступает компромисс между суммарным ущербом, который популяция вредителей причиняет в течение всего периода управления, и расходами на мероприятия по борьбе с ней. Численное исследование проводилось для набора входных данных, идентифицированных для популяции гусениц Anticarsia gematalis, паразитирующих на сельскохозяйственной культуре сои. Естественными врагами (хищниками) выступают осы. В ходе численного эксперимента для различных начальных данных получены режимы, отвечающие чисто импульсным управлениям. При этом число импульсов, их локализация и интенсивность существенно зависят от численности видов к началу периода управления и величины этого периода.

Найдено численное решение задачи быстродействия для двух моделей манипуляторов с блокируемой степенью свободы11). Первый представляет собой поступательную пару, прикрепленную к основанию с помощью шарнира. Поступательное движение внутреннего звена телескопического механизма может быть мгновенно заблокировано с помощью фрикционного тормоза (импульсное управление). Другой манипулятор имеет вид двойного маятника, причем одна из степеней свободы (та, что связана с шарниром, соединяющим звенья) подлежит управляемому блокированию.

Для каждого из манипуляторов рассмотрено два маневра. Численно найдены управления, рекордные по быстродействию. Результаты вычислительных экспериментов подтверждают, что методы улучшения, использующие разрывную замену времени, успешно работают в различных классах задач оптимального импульсного управления.

РЕЗУЛЬТАТЫ, ВЫНОСИМЫЕ НА ЗАЩИТУ 1. Построено преобразование задачи оптимального управления импульсными гибридными системами в форме дифференциальных уравнений с мерами при смешанных ограничениях на меру и траекторию к эквивалентной классической задаче оптимального управления.

2. Доказан принцип максимума для задачи оптимального управления импульсной гибридной системой.

11) Yunt K. Impulsive optimal control of hybrid finite-dimensional lagrangian systems: Ph.D. thesis.

Zurich, 2008. 221 p.

3. Разработаны численные алгоритмы поиска экстремалей в классе слабых и понтрягинских вариаций управления для нелинейных задач импульсного управления. Получено численное решение задач оптимального импульсного управления динамикой конкурирующих популяций и быстродействия в моделях движения манипуляторов с блокируемыми степенями свободы.

СПИСОК ОСНОВНЫХ ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ 1. Goncharova E., Staritsyn M. Optimization of Measure-Driven Hybrid Systems // JOTA. 2012. V. 153, № 1. (Published online: 18 October 2011, DOI 10.1007/s10957-011-9944-x).

2. Гончарова Е.В., Старицын М.В. Задача оптимального импульсного управления с фазовыми и смешанными ограничениями // ДАН. 2011.

Т. 441, №1. С. 29–32.

3. Гончарова Е.В., Старицын М.В. Метод разрывной замены времени в задачах оптимального управления импульсными гибридными системами // Известия РАН. ТиСУ. 2011. № 3. С. 41–51.

4. Гончарова Е.В., Старицын М.В. Метод улучшения управления импульсными системами // Известия РАН. ТиСУ. 2010. № 6. С. 53–60.

5. Гончарова Е.В., Старицын М.В. Градиентные методы улучшения для задач оптимального импульсного управления // Управление большими системами. 2010. Вып. 31. С. 35–48.

6. Goncharova E., Ovseevich A., Staritsyn M. Control Improvement Problem for Discrete-Continuous Dynamic System // Intern. J. of Mathematics and Statistics (IJMS). 2009. V. 5, № A09. P. 71–82.

7. Goncharova E., Staritsyn M. Optimal Control of Impulsive Hybrid Systems // Proc. of the 18th IFAC World Congress. Milan (Italy), 2011.

P. 10255–10260.

8. Гончарова Е.В., Старицын М.В. Задача импульсного управления при ограничениях на пределы траектории в точках разрыва // Тр. XV Байкальской междунар. шк.-семинара “Методы оптимизации и их приложения”. Иркутск, 2011. С. 56–60.

9. Goncharova E., Ovseevich A., Staritsyn M. Control Improvement Problem for Discrete-Continuous Dynamic System // Proc. of the 8th Portuguese Conf. on Automatic Control (CONTROLO’2008. Vila Real (Portugal), 2008. P. 130–135.

Редакционно-издательский отдел Федерального государственного бюджетного учреждения науки Института динамики систем и теории управления СО РАН 664033, Иркутск, ул. Лермонтова, д. 1E-mail: rio@icc.ru Подписано к печати 05.04.2012 г.

Формат бумаги 6084 1/16, объем 1,2 п.л.

Заказ 4. Тираж 120 экз.

Отпечатано в ИДСТУ СО РАН






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.