WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     || 2 | 3 |

На правах рукописи

КУМКОВ Сергей Сергеевич ОСОБЕННОСТИ МНОЖЕСТВ УРОВНЯ ФУНКЦИИ ЦЕНЫ В ЛИНЕЙНЫХ ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ 05.13.18 математическое моделирование, численные методы и комплексы программ А В Т О Р Е Ф Е Р А Т диссертации на соискание ученой степени кандидата физико-математических наук

Екатеринбург 2007

Работа выполнена в отделе динамических систем Института математики и механики Уральского отделения РАН.

Научный консультант: кандидат физико-математических наук Пацко Валерий Семенович

Официальные оппоненты: доктор физико-математических наук Гусев Михаил Иванович, кандидат физико-математических наук Петров Николай Никандрович

Ведущая организация: Московский государственный университет им. М.В. Ломоносова

Защита состоится 23 мая 2007 года в 1500 на заседании диссертационного совета К 212.286.01 по присуждению ученой степени кандидата физико-математических наук при Уральском государственном университете им. А.М. Горького по адресу:

620083, г. Екатеринбург, пр. Ленина, 51.

С диссертацией можно ознакомиться в Научной библиотеке Уральского государственного университета им. А.М. Горького.

Автореферат разослан 20 апреля 2007 г.

Ученый секретарь диссертационного совета, доктор физ.–мат. наук, профессор В.Г. Пименов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Диссертация посвящена численному исследованию особенностей множеств уровня функции цены в линейных дифференциальных играх с фиксированным моментом окончания. Предполагается, что непрерывная квазивыпуклая функция платы зависит от некоторых двух компонент фазового вектора в момент окончания игры. В рамках данной работы под особенностями понимаются: ситуации вырождения временных сечений (t-сечений) множеств уровня узкие шейки ; специфические соотношения, связывающие t-сечения различных множеств уровня; нарушения регулярной структуры полей оптимальных движений, идущих по границе множеств уровня (излом, расщепление, слияние и т.д.).

Теория дифференциальных игр в настоящее время развитая математическая дисциплина. Первые отчеты Р.Айзекса по дифференциальным играм относятся к 1951 году. В 1965 году была опубликована его книга Дифференциальные игры, переведенная на русский язык в году1. В нашей стране динамические задачи конфликтного управления рассматриваются с начала 60-х годов прошлого века. Первыми были работы Л.С.Понтрягина и Н.Н.Красовского. В 1974 году опубликована книга Н.Н.Красовского и А.И.Субботина2. В ней, в частности, предложена позиционная формализация дифференциальных игр и доказана теорема об альтернативе, родственная теореме существования функции цены. Важные результаты были получены в работах Л.А.Петросяна и Б.Н.Пшеничного.

Среди работ зарубежных авторов конца 60-х – начала 70-х годов прошлого века отметим работы L.D.Berkovitz, A.Blaquire, J.V.Breakwell, W.H.Fleming, A.Friedman, G.Leitmann, A.W.Merz. В них рассматривались теоремы существования функции цены в подходящем классе стратегий и развивался метод Р.Айзекса решения дифференциальных игр при помощи построения сингулярных поверхностей.

Айзекс Р. Дифференциальные игры. М.: Мир, 1967.

Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры.

М.: Наука, 1974.

Более поздние результаты, относящиеся к 1980-м годам, связаны с истолкованием функции цены игры как обобщенного решения уравнения Гамильтона–Якоби–Беллмана–Айзекса. Теория, опирающаяся на понятие минимаксного решения, была создана А.И.Субботиным. Полученные результаты отражены в книге 2003 года3. Близкое понятие вязкостного решения было введено в работах M.G.Crandall и P.L.Lions. В этом направлении интенсивно работают в настоящее время M.Bardi и I.Capuzzo-Dolcetta.

Параллельно с развитием теории разрабатывались и численные методы. Опыт создания первых универсальных алгоритмов решения некоторых классов дифференциальных игр отражен в сборнике4, опубликованном в 1984 г. в Екатеринбурге. Большую роль в создании алгоритмов и их обосновании сыграли работы Н.Л.Григоренко, М.С.Никольского, В.С.Пацко, Е.С.Половинкина, В.Н.Ушакова.

За рубежом численные методы интенсивно развиваются с начала 1990-х годов. В этой области проводят исследования итальянские математики M.Bardi, M.Falcone, P.Soravia; французские P.Cardaliaguet, M.Quincampoix, P.Saint-Pierre; немецкие M.H.Breitner, H.J.Pesch.

В настоящее время достижения вычислительной техники позволили по-иному взглянуть на возможность использования численных методов при решении дифференциальных игр. Актуальной становится разработка новых методов и алгоритмов.

Цель работы. Исследование особенностей множеств уровня функции цены в линейных дифференциальных играх с фиксированным моментом окончания. Разработка соответствующих алгоритмов и компьютерных программ.

Методы исследования. Математический аппарат выпуклого анализа, попятные конструкции теории дифференциальных игр, численные Субботин А.И. Обобщенные решения уравнений в частных производных первого порядка: перспективы динамической оптимизации. М.; Ижевск: Ин-т компьютер.

исслед., 2003.

Алгоритмы и программы решения линейных дифференциальных игр / Ред.

А.И. Субботин, В.С. Пацко. Свердловск, 1984.

алгоритмы.

Научная новизна. На примере задачи о воздушном перехвате изучены причины, вызывающие вырождение двумерных t-сечений множеств уровня функции цены (максимальных стабильных мостов) появление узких шеек. Построены новые примеры дифференциальных игр, в которых имеются множества уровня с несколькими узкими шейками.

Сформулировано свойство уровневого выметания квазивыпуклой функции. Доказана теорема о наследовании свойства уровневого выметания функцией цены линейной дифференциальной игры. С помощью контрпримеров показана специфичность этого факта для ситуации, когда фазовый вектор игры имеет размерность 2.

Разработаны алгоритмы глобального численного построения и классификации сингулярных поверхностей в линейных дифференциальных играх с фиксированным моментом окончания.

Результаты диссертационной работы являются новыми.

Теоретическая и практическая ценность работы. Разработанные автором программы построения множеств уровня функции цены (максимальных стабильных мостов) в линейных дифференциальных играх с фиксированным моментом окончания и непрерывной квазивыпуклой функцией платы в сочетании с имеющимися средствами научной визуализации являются удобным инструментом, существенно помогающим в изучении игр из этого класса. Представленные в работе алгоритмы глобального численного построения сингулярных поверхностей также могут быть полезными в качестве инструмента при анализе структуры решений дифференциальных игр и исследовании пучков оптимальных движений.

Структура и объем работы. Диссертация состоит из введения, списка основных обозначений, трех глав, списка литературы и списка A иллюстраций. Диссертация подготовлена в системе LTEX. Общий объем диссертации составляет 127 страниц. Библиографический список включает 83 наименования, в том числе 16 публикаций автора по теме диссертации. Список иллюстраций включает 77 позиций.

Апробация работы. Основные результаты диссертации докладывались автором и обсуждались на конференциях молодых ученых Института математики и механики УрО РАН (Екатеринбург, 2000, 2001 гг.);

28-й, 30-й, 31-й, 33-й региональных молодежных конференциях Проблемы теоретической и прикладной математики (Екатеринбург, 1997, 1999, 2000, 2002 гг.); на международных конференциях: the 8th International Colloquium on Differential Equations, August 18–23, 1997, Plovdiv, Bulgaria; IFAC Workshop on Nonsmooth and Discontinuous Problems of Control and Optimization, Chelyabinsk, Russia, 17–20 June 1998; the 8th International Symposium on Dynamic Games and Applications, July 5–8, 1998, Chateau Vaalsbroek, Maastricht, the Netherlands; the 11th IFAC Workshop “Control Applications of Optimization” (CAO 2000), July 3–6, 2000, St.Petersburg, Russia; the 10th International Symposium on Dynamic Games and Applications, July 8–11, 2002, Saint-Petersburg, Russia; the 4th International ISDG Workshop, May 19–21, 2003, Goslar, Germany;

конференции Демидовские чтения на Урале, Екатеринбург, 1–3 марта 2006 г.; семинарах отдела динамических систем и отдела управляемых систем ИММ УрО РАН, семинаре лаборатории управляемых систем Института проблем механики РАН, семинарах кафедры оптимального управления факультета ВМиК МГУ и кaфедpы общих проблем упpaвления механико-мaтемaтического фaкультетa МГУ, семинаре кафедры кибернетики Московского института электроники и математики, семинаре кафедры дифференциальных уравнений Удмуртского госуниверситета, семинаре кафедры прикладной математики Челябинского госуниверситета.

Публикации. Основные результаты диссертации опубликованы в работах [1–16].

СОДЕРЖАНИЕ РАБОТЫ

Во введении дается краткий обзор литературы по дифференциальным играм, определяется цель работы, излагаются основные результаты диссертации.

Первая глава включает в себя разделы, посвященные описанию класса исследуемых игр и изложению алгоритма построения максимальных стабильных мостов, а также два раздела, содержащие результаты численного исследования примеров с узкими шейками.

Рассматриваются антагонистические линейные дифференциальные игры = A(t)z + B(t)u + C(t)v, t [t0, T ], z Rn, (1) u P Rp, v Q Rq, zi(T ), zj(T ), с фиксированным моментом окончания T и квазивыпуклой непрерывной функцией платы, зависящей от двух компонент zi, zj фазового вектора. Квазивыпуклой называем функцию, все множества уровня (множества Лебега) которой выпуклые. Первый (второй) игрок распоряжается управлением u (v), выбирая его из выпуклого компакта P (Q) в своем конечномерном пространстве так, чтобы минимизировать (максимизировать) значение функции в момент T.

От игры (1) переходим к эквивалентной дифференциальной игре при помощи замены (t) = Xi,j(T, t)z(t), где Xi,j(T, t) матрица, составленная из i-й и j-й строк фундаментальной матрицы Коши X(T, t) для системы = A(t)z. Эквивалентная игра имеет вид = D(t)u + E(t)v, (2) t [t0, T ], R2, u P, v Q, 1(T ), 2(T ).

Алгоритм5 попятного построения максимального стабильного моста W для игры (2), вытягиваемого от выпуклого компактного терминального множества M (от множества уровня функции платы), реализует идею альтернированного интеграла Л.С.Понтрягина6. На выходе алгоритма получаем набор многоугольников W(t), приближающих tсечения W (t) моста W.

Исакова Е.А., Логунова Г.В., Пацко В.С. Построение стабильных мостов в линейной дифференциальной игре с фиксированным моментом окончания // Алгоритмы и программы решения линейных дифференциальных игр. Ред. А.И. Субботин, В.С. Пацко, Свердловск, 1984. C. 127–158.

Понтрягин Л.С. Линейные дифференциальные игры, 2 // Докл. АН СССР, №4, Т.175, 1967. C. 764–766.

Вводится сетка моментов времени {t0 < t1 <... < tN = T } с шагом. На этой сетке динамика игры (2) подменяется кусочнопостоянной. Множества P, Q, M подменяются выпуклыми многогранными аппроксимациями P, Q, M. Полагаем W(tN ) = M. Затем множество W(tN ) пересчитывается в множество W(tN-1), которое в свою очередь пересчитывается в множество W(tN-2), и т.д. Процедура пересчета использует опорную функцию предыдущего (в обратном времени) сечения W(ti+1) и опорные функции вектограмм первого P(ti) = -D(ti)P и второго Q(ti) = E(ti)Q игроков. А именно, опорная функция нового сечения W(ti) есть7 выпуклая оболочка функции (l, ti) = l, W(ti+1) + · l, P(ti) - · l, Q(ti), (3) т.е.

·, W(ti) = conv (·, ti). (4) Процесс построений прекращается либо по достижении момента t0, либо когда выпуклая оболочка очередной функции (·, ti) является несобственной функцией, т.е. W(ti) =.

Имеет место сходимость численно построенных t-сечений приближенного моста W к сечениям идеального моста W в метрике Хаусдорфа.

Оценки погрешностей приведены в работе Н.Д. Боткина8.

Первый из примеров, численно исследованных в диссертации при помощи программы, реализующей описанный алгоритм модельная игра9,10, связанная с задачей воздушного перехвата. Преследователем в Пшеничный Б.Н., Сагайдак М.И. О дифференциальных играх с фиксированным временем // Кибернетика, №2, 1970. С. 54–63.

Botkin N.D. Evaluation of numerical construction error in differential game with fixed terminal time // Problems of Control and Information Theory, Vol. 11, № 4, 1982.

pp. 283–295.

Shinar J., Medinah M., Biton M. Singular Surfaces in a Linear Pursuit-Evasion Game with Elliptical Vectograms // Journal of Optimization Theory and Optimization, Vol.43, No.3, 1984. pp. 431 458.

Shinar J., Zarkh M. Pursuit of a Faster Evader a Linear Game with Elliptical Vectograms // Proceedings of the Seventh International Symposium on Dynamic Games, Yokosuka, Japan, 1996. pp. 855 868.

этой задаче выступает ракета-перехватчик, убегающим маневрирующая воздушная цель (самолет или другая ракета). Естественной платой в такой игре является расстояние наименьшего сближения, т.е. промах, который минимизируется преследователем P и максимизируется убегающим E. Векторы номинальных скоростей (VP )nom и (VE)nom являются постоянными и направленными так, что имеется точная встреча на номинальных траекториях. Управляющее ускорение каждого объекта перпендикулярно вектору его текущей скорости. Максимальные значения боковых ускорений ограничены константами aP и aE. Полагается, что aP > aE. Убегающий непосредственно управляет своим ускорением, а догоняющий инерционно, с постоянной времени P. Возможности объектов по изменению направления вектора их скорости в процессе движения являются малыми (слабо маневрирующие объекты).

Выбор координат производится следующим образом. Начало координат O совмещается с номинальным положением Pnom догоняющего в начальный момент. Ось OX направлена вдоль начальной номинальной линии визирования. Ось OY перпендикулярна OX и лежит в плоскости, определяемой векторами номинальных скоростей объектов (рис. 1).

Ось OZ направлена перпендикулярно первым двум осям.

Поскольку отклонения скоростей VP (t) и VE(t) от их номинальРис. 1: Система координат в задаче трехмерного преследования ных значений (VP )nom и (VE)nom малы, относительное движение вдоль оси OX может рассматриваться как равномерное и промах можно просчитывать в момент номинальной встречи в виде расстояния между объектами в плоскости Y Z в этот момент. Стало быть, задача минимизации трехмерного промаха на заданном промежутке времени может быть сведена к минимизации расстояния в плоскости Y Z в фиксированный момент T номинальной встречи.

Pages:     || 2 | 3 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»