WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Московский государственный университет имени М.В. Ломоносова Факультет вычислительной математики и кибернетики

На правах рукописи

Мазуренко Станислав Сергеевич

Уравнение эволюции невыпуклых множеств в задаче достижимости и управление потоками

01.01.02 - Дифференциальные уравнения, динамические системы и оптимальное управление

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-математических наук

Москва 2012 г.

Работа выполнена в МГУ имени М. В. Ломоносова на кафедре системного анализа факультета ВМК.

Научный руководитель - доктор физико-математических наук, академик Александр Борисович Куржанский.

Официальные оппоненты - доктор физико-математических наук, член-корреспондент РАН, профессор Сергей Миронович Асеев;

доктор физико-математических наук, профессор Николай Леонтьевич Григоренко.

Ведущая организация - Институт математики и механики УрО РАН.

Защита состоится 26 декабря 2012 г. в 15:30 на заседании Диссертационного совета Д 501.001.43 при Московском государственном университете имени М.В. Ломоносова, расположенном по адресу: 119991, Российская Федерация, Москва, ГСП-1, Ленинские горы, Факультет ВМК МГУ имени М.В.Ломоносова, аудитория 685.

С диссертацией можно ознакомиться в научной библиотеке Факультета ВМК МГУ имени М.В. Ломоносова

Автореферат разослан “ ” 2012 г.

Ученый секретарь совета доктор физико-математических наук, профессор Евгений Владимирович Захаров

Общая характеристика работы

Актуальность темы. Задачи управления и оптимизации ставились исследователями с давних пор, однако активное изучение этих задач началось в 30х - 40х годах прошлого столетия. Современная проблематика теории управления затрагивает многие научные области: разработка систем автоматизации и роботостроения, управления процессами в физике, биологии, моделирование экономических процессов и т.д.

Толчок к развитию математической теории процессов управления был получен благодаря результатам академика Л.С. Понтрягина и его сотрудников. В частности, были выведены необходимые условия оптимальности для функционалов различного вида, получившие название Принципа максимума Понтрягина [1]. Примерно в те же годы Р. Беллманом был создан метод динамического программирования для решения задач синтеза управления в терминах гамильтонова формализма, а также получены достаточные условия оптимальности [2].

С тех пор круг задач, к которым применимы результаты теории управления, ровно как и методы решения таких задач, стремительно расширялся.

Н. Н. Красовский активно занимался решением задач синтеза управления для различных классов возмущений в динамических уравнениях. Им и его сотрудниками были исследованы основные свойства ситем с неопределенностями и их разнообразные приложения [3],[4]. Р. Калман исследовал вопросы фильтрации и предсказания поведения динамических процессов в рамках вероятностных моделей, а также ввел понятия наблюдаемости и управляемости [5]. Широкий класс подобных задач решался при использовании понятий множества достижимости и разрешимости: соответственно куда и откуда может передвигаться объект, описываемый системой дифференциальных уравнений. Теория оптимального управления получила свое продолжение для уравнений в частных производных в работах Ж.-Л. Лиониса [6].

В дальнейшие годы, математическая теория процессов управления достигла широкого распространения с различными приложениями. А.Б. Куржанским и его сотрудниками были продолжены исследования задач управления в условиях неопределенности [7], синтеза управления, оценки и нахождения множеств достижимости и разрешимости при различных типах ограничений на состояния и параметры системы [8].

Настоящая диссертация продолжает исследования А.Б. Куржанского и его сотрудников в области задач синтеза управлений по реально доступной информации в широком смысле этого слова [9]. Ими была развита теория множеств и трубок достижимости [10]. Эти результаты были также представленны в совместных работах с О.И. Никоновым [11] и Т.Ф. Филипповой [12].

В частности, был получен результат для нахождения множества достижимости дифференциального включения в терминах эволюционного уравнения в общем случае, а также, в терминах опорных функций в случае выпуклого решения задачи дифференциального включения.

Современное развитие технологий ставит перед исследователями все более нестандартные задачи, требующие выработки новых методов решения.

Так, например, в билинейных по управлению и позиции системах наряду с выпуклыми задачами динамического программирования возникает необходимость перейти к невыпуклому случаю. Это может произойти, если имеется неопределенность в коэффициентах матрицы движения линейной системы.

В результате этого, множества достижимости системы представляют собой звездную структуру даже при выпуклом начальном множестве. Разработанный к настоящему времени аппарат исследования таких задач при помощи выпуклого анализа и теории двойственности не может описать точное решение.

Альтернативный подход к задачам управления был предложен Р. Брокеттом [13], который обратил свое внимание на необходимость изучения задач управления потоками с заданными начальными распределениями состояний системы, которые могут быть сосредоточены и на невыпуклых множествах. Р. Брокетт рассматривает динамическую задачу управления потоком не в терминах отдельных объектов - фазовых переменных пространства Rn и соответствующих траекторий движения, а в терминах эволюции всей плотности распределения состояний системы. Исследование динамики всего распределения проведено с использованием уравнения Лиувилля - уравнения в частных производных для функции плотности. Помимо абсолютно непрерывного случая, уравнение верно и для более широкого класса распределений из пространства обобщенных функций. В результате, с помощью методов динамического программирования стало возможным нахождение в явном виде оптимального управления системой, сосредоточенной, например, в конечном числе точек, или на границе эллипсоида.

Представленная работа дополняет исследования задач теории управления при помощи эволюционного уравнения [12] и задания динамики системы в терминах уравнения Лиувилля [13].

Целью работы была разработка механизма нахождения невыпуклых множеств достижимости эволюционных систем, описываемых системами обыкновенных дифференциальных уравнений с начальными условиями в виде распределений, и оптимального управления такими системами, который бы позволил численно находить соответствующие множества и оптимальное управление.

Научная новизна работы. Полученные результаты являются новыми.

В работе рассмотрены ранее мало изученные динамические задачи с невыпуклой динамикой.

В частности, в дополнение к результатам [13] была формализована постановка задачи управления системой в случае, когда состоянием системы являются не координаты в n-мерном пространстве, а распределение координат.

Данная постановка уравнения Гамильтона-Якоби-Беллмана была проделана для случая функции цены, зависящей от обобщенной функции распределения.

Настоящая работа продолжила исследования [12] в области систем со звездной динамикой. В данной работе эволюционные уравнения для множества достижимости дифференциальных включений были преобразованы и записаны для функций Минковского, что позволило численно находить калибровочную функцию и восстанавливать по ней всю звездную трубку достижимости.

Наконец, в диссертации представлены новые результаты по нахождению связующей нити между функцией цены в задаче поиска множества достижимости и калибровочной функцией Минковского.

Теоретическая и практическая ценность работы. Полученные результаты могут служить основой для дальнейших исследований и позволят далее перейти к практически реализуемым численным алгоритмам, то есть к решению задачи до конца. В частных случаях (квадратичный интегральный функционал для систем с распределениями и двумерные линейные системы для задачи нахождения звездных множеств достижимости) были построены численные решения.

Методы исследования. Решение рассматриваемых в диссертации задач было получено в рамках упомянутых выше подходов, основанных на методах динамического программирования, а также на методах вариационного анализа и теоремах о дифференцировании условного максимума. Работа носит преимущественно теоретический характер.

Апробация работы. Результаты работы были представлены в виде докладов на семинаре кафедры системного анализа факультета ВМиК МГУ (рук. академик РАН А. Б. Куржанский), а также на конференции Ломоносов 2009.

Публикации. По теме диссертации опубликовано 4 работы, из них статьи в рецензируемых журналах, рекомендованных ВАК.

Структура и объём диссертации. Диссертация состоит из введения, трёх глав, заключения и библиографии. Общий объём диссертации 85 страниц. Библиография включает 57 наименований.

Содержание работы Во введении раскрываются цели работы, ее актуальность, а также кратко описаны основные результаты, полученные в диссертации.

В первой главе рассматривается задача управления в случае, когда множество начальных состояний системы характеризуется функцией распределения. В первом разделе приведена общая постановка подобной задачи: рассматривается система = f(t, x, u), t T = [t0, t1], где x Rn, u(t) Rp – управление из некоторого класса кусочнонепрерывных функций U, функция f(t, x, u) удовлетворяет стандартным свойствам для существования, единственности и продолжаемости решения на отрезок T. Начальное состояние системы задается функцией распределения p(t0, x) - в общем случае - обобщенным линейным функционалом над пространством непрерывных функций с компактным носителем. Такие распределения часто используются в физике, где, например, вещество или заряд могут быть сосредоточены на границе некоторого множества, или в конечном числе точек, для чего вводится понятие -функции.

Помимо задания рассматриваемого класса обобщенных функций, в разделе приводится теорема Рисса-Радона, позволяющая отождествить функции распределения с мерами Радона. Поэтому такая постановка задачи может говорить о вероятностном распределении начальных состояний системы и/или о плотности потока в различных точках пространства в начальный момент времени. Под позицией системы в первой главе будем подразумевать пару (t, p(t, ·)).

В разделе 1.1 выводится уравнение Лиувилля, являющееся линейным по позиции и задающее закон её изменения:

p(t, x) = -, p(t, x)f(t, x, u).

t x В разделе 1.2 показывается, как зная вид решения исходной системы можно получить решение уравнения Лиувилля: в случае, когда отображение каждому значению x0 ставит в соответствие решение системы x(t, t0, x0) с начальным условием x(t0) = x0, плотность распределения x в момент времени t :

p(t0, -1(x)) t p(t, x) =, |J (x)| t где J - Якобиан преобразования .

Далее ставится задача оптимизации:

t L(t, x, u)p(t, x)dxdt + (x)p(t1, x)dx - inf, uU tRn Rn в которой обе функции L(t, x, u) и (x) непрерывно дифференцируемы по совокупности переменных. Оптимальное решение ищется при помощи метода динамического программирования: определение функции цены распространяется на случай, когда фазовая переменная - не вектор в Rn, а обобщенная функция (мера):

t V (t0, p0) = inf L(t, x, u)p(t, x)dxdt + (x)p(t1, x)dx p(t0, ·) = p0(·) F, uU tRn Rn где множество F задает меры, для которых сходятся несобственные интегралы в целевом функционале.

При таком задании функции цены выполняется полугрупповое свойство, из которого в представленной работе выводится принцип оптимальности и соответствующий ему аналог системы Гамильтона-Якоби-Беллмана:

V (t, p(t, ·)) + inf -Vp , p(t, x)f(t, x, u) + L(t, x, u)p(t, x)dx = t x uU Rn V (t1, p(t1, ·)) = (x)p(t1, ·), Rn которая рассматривается в области T F.

Также, доказывается теорема, согласно которой достаточно найти частное решение полученной системы Гамильтона-Якоби-Беллмана, которое будет оценкой снизу функции цены, а при дополнительных условиях совпадет с её точным значением.

В разделе 1.4 для начального условия с распределением ставится задача нахождения оптимального управления линейной системой с линейноквадратичным интегралом, зависящим от определенной выше позиции системы. Для такой задачи находится решение в замкнутом виде с использованием уравнений Риккати. Также в этом разделе рассматриваются частные примеры начальных условий с многомерным нормальным распределением, равномерным распределением на параллелепипеде и эллипсоиде, а также с равномерным распределением на границе эллипсоида.

Последний раздел Главы 1 описывает модификацию исходной задачи оптимизации, в которой целевой функционал зависит от распределения уже нелинейно:

t F (t, u, p(t, ·))dt + (t1, p(t1, ·)) - inf.

uU tДля такого функционала выводится соответствующий аналог принципа оптимальности и уравнений Гамильтона-Якоби-Беллмана. Также решение задачи управления линейной системой с функционалом, квадратичным по распределению, приводится к замкнутому виду.

Тем не менее, несмотря на универсальность подхода динамического программирования, применимого для задача с распределениями на невыпуклых множествах, нахождение функции цены представляется весьма трудоемкой, а иногда и трудно разрешимой задачей. В частности, если управление заложено в саму матрицу динамики линейной системы, то аналогичное уравнению с аддитивным управлением решение в замкнутом виде построить не удается.

Поэтому в дальнейшем в работе акцентируется внимание на задаче нахождения множества достижимости, которое в общем случае также можно искать как линии уровня функции цены специального вида [7]. Здесь уже известны методы, затрачивающие намного меньшее количество вычислительных мощностей, чем прямое интегрирование уравнений ГЯБ [12]. Например, в выпуклом случае возможно выразить динамику множеств достижимости при помощи опорных функций. Однако как показывает практика, даже в системах с изначальной линейной структурой по фазовой переменной множества достижимости могут оказаться невыпуклыми. В начале второй главы диссертации рассматривается система, билинейная по (x, u), в которой управление (или неопределенность) заложено в саму матрицу движения. В разделе 2.1.3 в явном виде ищется частное решение простейшей двумерной линейной системы и на примере показано, что множество достижимости для системы не выпуклое, а звездное, т.е. x X[t], [0, 1] x X[t].

В разделе 2.2 рассматривается общая постановка задачи управления F (t, x) = f(t, x; a), t T = [t0, t1], x0 X0, (1) aA(t) для которой выполнены стандартные условия существования, единственности и продолжаемости решения ([14]), а также предположение Предположение 1. Существует малое > 0, такое, что система (1) удовлетворяет свойствам:

1. Начальное множество X0 St(Rn), 2. График системы (1) graphtF St(R2n) для любого момента времени t T, 3. Окрестность нуля B0,1 X[t] для любого момента времени t T.

Здесь graphtF = {(x, y) R2n|y F (t, x)} - график многозначного отображения F (t, x), и B0,1 - шар единичного радиуса в Rn с центром в начале координат. При таком предположении, множество достижимости будет оставаться звездным, причем ноль будет всегда лежать строго внутри. Из [12] известно, что многозначная функция X[t] - множество достижимости системы - является тогда единственным решением следующего эволюционного уравнения:

X[t + ], {x + F (t, x)} = 0, t T, lim -1h +xX[t] X[t0] = X0, где h(A, B) - метрика Хаусдорфа.

В выпуклом случае для дифференциального включения при выполнении некоторых дополнительных ограничений ([12]) это уравнение можно записать в терминах опорных функций. Целью настоящей главы было выйти за рамки выпуклых множеств и вывести дифференциальное уравнение для калибровочной функции Минковского:

r(l|Z) = max{ R|l Z}, r(0|Z) = +, которая, как и опорная функция, позволяет однозначно восстановить само множество:

Z = {l Rn : r(l|Z) 1}, в случае, когда множество Z является звездным.

Раздел 2.3 приводит необходимые для данной работы свойства калибровочной функции, а также в этом разделе доказывается результат касательно непрерывной дифференцируемости функции r(l|Z()) по параметру , который сформулирован в виде Теоремы 2.1. В результате, в разделе 2.4 доказывается основная теорема второй главы:

Теорема 2.5.

Пусть для системы (1) выполнено Предположение 1. Тогда для любого ненулевого направления l Rn, такого, что функция r(l, t) дифференцируема по l в некоторой его окрестности, существует правая производная +r(l, t)/t, причем +r(l, t) log r(l, t) = max -, f(t, z; a), aA t l где z = r(l, t)l.

Полученное дифференциальное уравнение обладает рядом примечательных свойств. В частности, из-за однородности калибровочной функции, оно может быть решено лишь на n-мерной сфере единичного радиуса для l, т.е.

фактически размерность задачи совпадает с размерностью вектора l, что отмечено в работе в конце данного раздела.

В разделе 2.4 на систему дополнительно накладываются фазовые ограничения в виде выпуклого компактнозначного непрерывного по Хаусдорфу отображения Y (t). Дифференциальное уравнение изменяется соответствующим образом, однако необходимо потребовать следующее ограничение:

Предположение 2. Выполнены следующие требования на многозначное отображение Y (t) :

1. Существует малое положительное : t T B0,1 Y (t), 2. Функция Минковского r(l|Y (t)) дифференцируема по l.

В этом случае верна следующая теорема:

Теорема 2.Пусть для системы (1) действуют фазовые ограничения и выполнены Предположения 1-2. Тогда для любого ненулевого направления l Rn, такого, что функция r(l, t) дифференцируема по l в некоторой его окрестности, существует правая производная +r(l, t)/t, причем max - log r(l,t), f(t, z; a), при r(l, t) < r(l|Y (t)), l +r(l, t) aA = t min max - log r(l,t), f(t, z; a), r(l|Y (t)), при r(l, t) = r(l|Y (t)), l t aA где z = r(l, t)l.

Напомним, что определение звезды подразумевает наличие некоторого множества, называемого центральным, для каждой точки которого отрезок, соединяющий эту точку и произвольную точку множества, лежит внутри этого множества. Раздел 2.6 исследует вопрос, как изменится дифференциальное уравнение для калибровочной функции, если центральное множество звезды будет сосредоточено не вокруг начала координат, а вокруг некоторой заранее известной движущейся точки q(t) : q(t) = Q(q, t). Для этого необ ходимо потребовать, чтобы множество достижимости было строгой звездой:

звездным множеством с центром из точки q(t) и некоторой ее окрестности.

Тогда дифференциальное уравнение для функции r[l, t] = r(l|X[t] - q(t)) :

+r[l, t] log r[l, t] = max, Q(q(t), t) - f(t, z; a), aA t l где z = r[l, t]l + q(t).

Третья глава диссертации посвящена сравнению двух подходов к задаче поиска множества достижимости: подходу с использованием линий уровня функции цены и подходу с использованием калибровочных функций. В первом подходе множество достижимости системы может быть найдено как линии уровня функции цены для попятной системы:

= f(t, x; a), a A(t), t T, x(t1) = x, (2) d(x(t0), X0) inf, aA(t) где d(s, S) - некоторая метрика в пространстве Rn :

S comp(Rn), d(s, S) = 0 s S.

Если здать функцию цены как V (t, x) = inf{d(x(t0), X0)|x(t) = x}, то из теории динамического программирования известно, что такая функция цены подчиняется уравнению Беллмана:

V (t,x) V (t,x) + max, f(t, x; a) = 0, t x aA(t) (3) V (t0, x) = d(x, X0).

Множество достижимости исходной системы может быть найдено как линии уровня функции цены для попятной системы:

X[t] = {x Rn : V (t, x) 0}.

Аппарат Гамильтонова формализма позволяет, таким образом, находить множества достижимости и для невыпуклых задач, однако имеет ряд вычислительных трудностей.

Однако можно рассмотреть метрику d(s, S), которая зависит от калибровочной функции, например, d(s, S) = g(1 - r(s|S)), (4) где функция g(x) = 0 для значений x 0, и g(x) возрастает при x > 0.

Т.е. "расстояние"от точки s до множества S - длина отрезка, заключенного между точкой s и множеством S, на прямой, соединяющей начало координат и точку s. В этом случае, если s S r(s|S) 1 d(s, S) = g(1 - r(s|S)) = 0, поэтому линии уровня функции цены V (t, x) 0 будут задавать искомое множество достижимости.

Основной результат раздела заключен в следующей теореме:

Теорема 3.Пусть система (2) удовлетворяет Предположению 1. Пусть также выполнено следующее равенство:

r(x, t) 1 r(x, t) max -, f(t, r(x, t)x; a) = max -, f(t, x; a) aA aA x r(x, t) x для любых ненулевых векторов x Rn, и момента времени t [t0, ] T. Тогда функция V (t, x) = g(1-r(x, t)) является решением системы ГамильтонаЯкоби-Беллмана V (t,x) V (t,x) + max, f(t, x; a) = 0, t x aA(t) (5) V (t0, x) = g(1 - r(x|X0)) на отрезке t [t0, ], для непрерывно дифференцируемой функции g(x), такой, что g(x) = 0 для значений x 0, и возрастает при x > 0.

Т.е, например, для однородной правой части вида f(t, x, a) = Ax, A A функция V (t, x) = g(1 - r(x, t)) является решением системы Гамильтона-Якоби-Беллмана:

V (t,x) V (t,x) + max, Ax = 0, t x AA V (t0, x) = g(1 - r(x, t0)).

В разделе 3.3 рассмотрены частные примеры двумерных линейных систем, даны иллюстрации множеств достижимости, а также трубок достижимости, проиллюстрирована функция цены в фиксированные моменты времени.

Основные результаты 1. Разработан метод поиска решения задачи оптимального управления потоками с позиции распределения при помощи модифицированных уравнений Гамильтона-Якоби-Беллмана. Решена задача оптимального управления потоками, задаваемыми линейной системой с линейноквадратичным интегралом, зависящим от позиции (t, p(t, x)). Построены графические иллюстрации динамики распределения в частных случаях;

2. Выведено дифференциальное уравнение для калибровочной функции Минковского множества достижимости дифференциального включения, позволяющее строить трубки достижимости систем со звездной динамикой. Получена модификация этого уравнения при наличии фазовых ограничений;

3. Теоретически обоснована взаимосвязь предложенных методов с подходами к решению задач управления в рамках гамильтонова формализма.

Указаны уравнение и решение для функции цены задачи поиска множеств достижимости. Построены графические иллюстрации трубок достижимости и функций цены для задач с неопределенностью в матрице динамики линейной системы.

Автор приносит искреннюю благодарность своему научному руководителю Александру Борисовичу Куржанскому за постановку задач, постоянное внимание к работе и ценные советы.

Работа выполнена в рамках ФЦП “Научные и научно-педагогические кадры инновационной России на 2009-2013 годы” (контракт № 16.740.11.0426 от 26 ноября 2010 г.) и при частичной финансовой поддержке РФФИ (грант 09-01-00589-а).

Публикации по теме диссертации 1. Мазуренко С. С. Метод динамического программирования в системах с состояниями в виде распределений // Вестник Московского Университета. Секция 15. Вычислительная математика и кибернетика, 2011. № 3.

с. 30-38.

2. Мазуренко С. С. Дифференциальное уравнение на калибровочную функцию Минковского звездного множества достижимости дифференциального включения // Доклады Академии Наук. Математика. 2012.

Т. 445, № 2. с. 139-142.

Цитированная литература [1] Л. С. Понтрягин “Избранные научные труды”, 2 т., М.: Наука, 1988.

[2] Р. Беллман “Динамическое программирование”, М.: Изд-во Иностранная литература, 1960.

[3] Н. Н. Красовский “Теория управления движением”, М.: Наука, 1961.

[4] Н. Н. Красовский “Игровые задачи о встрече движений”, М.: ФИЗМАТЛИТ, 1970.

[5] R. E. Kalman “A new approach to linear filtering and prediction problems”, Trans. ASME. 1960. V. 82. N. Series D. P. 35–45.

[6] Ж.-Л. Лионc “Управление сингулярными распределенными системами”, М.: Наука, 1987.

[7] А. Б. Куржанский “Управление и наблюдение в условиях неопределённости”, М.: Наука, 1977.

[8] А. Н. Дарьин, И.А. Дигайлова, И.В. Рублев “Избранные труды А.Б.

Куржанского”, МГУ: 2009.

[9] A.Б. Куржанский “О задачах синтеза управлений по реально доступной информации”, Вестник Московского университета. Серия 15. Вычислительная математика и кибернетика. 2005. Специальный выпуск.

С. 113–122.

[10] A.Б. Куржанский “Об аналитическом описании пучка выживающих траекторий дифференциальной системы”, Доклады АН СССР. 1986.

Т. 287. № 5. С. 1047–1050.

[11] A.Б. Куржанский, О.И. Никонов “Эволюционные уравнения для пучков траекторий синтезированных систем управления”, Доклады РАН.

1993. Т. 333. № 4. С. 578–581.

[12] A. B. Kurzhanski, T. F. Filippova “On the theory of trajectory tubes a mathematical formalism for uncertain dynamics, viability and control”, Advances in Nonlinear Dynamics and Control. Boston: Birkhauser, 1993.

P. 122-188.

[13] R. W. Brockett “Optimal control of the Liouville equation”, Engineering and applied science, Harvard University.

[14] А. Ф. Филиппов “Дифференциальные уравнения с разрывной правой частью”, М.: Издательство физ.-мат. литературы, 1985.




© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.