WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


На правах рукописи

ШМАТКОВ Антон Михайлович

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ И ОЦЕНИВАНИЕ ДВИЖЕНИЯ В НЕКОТОРЫХ ЗАДАЧАХ ДИНАМИКИ

01.02.01 теоретическая механика А в т о р е ф е р а т диссертации на соискание учёной степени доктора физико-математических наук

Москва 2012

Работа выполнена в Федеральном государственном бюджетном учреждении науки Институте проблем механики им. А. Ю. Ишлинского Российской академии наук (ИПМех РАН)

Официальные оппоненты:

член-корр. РАН, доктор физико-математических наук Н. Н. Болотник, доктор физико-математических наук, профессор Ю. Ф. Голубев, доктор физико-математических наук, профессор Т. Ф. Филиппова.

Ведущая организация:

Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В. А. Трапезникова Российской академии наук.

Защита диссертации состоится “21”февраля2013 г. в15часов на заседании диссертационного совета Д 002.240.01 при ИПМех РАН по адресу:

119526, г. Москва, проспект Вернадского, д. 101, корп. 1, ИПМех РАН.

С диссертацией можно ознакомиться в библиотеке ИПМех РАН.

Автореферат разослан “ ” 2012 г.

Учёный секретарь диссертационного совета Д 002.240.кандидат физико-математических наук Е. Я. Сысоева Цель работы заключается в постановке и изучении ряда задач математической теории оптимального управления, допускающих применение аналитических методов для выяснения особенностей поведения динамических объектов.

Актуальность исследуемых задач обусловлена тем, что в математической теории оптимального управления сравнительно мало решённых задач, для которых создан алгоритм, позволяющий сравнительно быстро вычислять синтез, и ещё меньше таких, для которых последний построен в аналитической форме. Основная причина состоит в том, что после применения известного принципа максимума Л. С. Понтрягина в большинстве случаев приходится решать нелинейную краевую задачу вдвое большей размерности, чем исходная. Однако для приложений в связи с необходимостью построения опорных управлений и оценок полезны полные точные решения задач управления движением при упрощающих предположениях относительно структуры объекта, вида и формы наложенных на него ограничений. Поэтому представляют интерес любые математические модели, где решение в указанном виде возможно, если они отражают реальность лучше, чем те, где оно уже найдено, без введения дополнительных переменных или используют минимальное их количество. В особенности это относится к случаям, когда на систему влияют различные неопределённые факторы: внешние возмущающие силы, неконтролируемые вариации параметров, погрешности в измерении начальных условий. Иногда, как это показано в тексте диссертации, можно сделать полезные выводы в рамках строго детерминированных построений, без расширения фазового пространства задачи для включения дополнительных переменных, описывающих такие факторы. К сожалению, такое удаётся редко. Для создания удовлетворительной модели приходится прибегать к различным способам описания указанных факторов.

Самым распространённым подходом к исследованию неопределённых величин является вероятностный (стохастический) метод. В нём каждому неопределённому вектору сопоставляется некоторое распределение вероятностей с заданной плотностью. Соответствующим математическим аппаратом является теория случайных процессов. Отметим, что вероятностный подход требует знания статистических характеристик исходных неопределённых факторов, что далеко не всегда доступно на практике.

Гарантированный (минимаксный) подход оперирует с множествами, в которых лежат неопределённые векторы. При этом предполагается, что неизвестные помехи локализованы в известных множествах, а в остальном произвольны. Наиболее адекватным математическим аппаратом для его описания должна служить теория дифференциальных игр. Однако она весьма сложна, а многие полезные выводы могут быть получены более простыми способами. В частности, при последовательном её применении в результате аффинных преобразований, сложения и пересечения множеств могут получаться многообразия сложной, и, самое главное, трудно предсказуемой формы, даже если исходные множества в начальный момент времени имели геометрическую форму, требующую небольшого числа параметров для обработки и хранения.

Оценки показывают, что даже в линейном случае без создания принципиально новых моделирующих устройств ни сейчас, ни в обозримом будущем достаточно полные поточечные описания в пространствах большой размерности для сколько-нибудь широкого класса реальных систем не найдут материальной базы для воплощения. Очевидность этого обстоятельства вызывает к жизни попытки ввести множества простой (канонической) формы, приближающие настоящие множества достижимости. Под простой понимается такая форма, которая при соблюдении допустимой точности аппроксимации требует приемлемых вычислительных ресурсов. При этом все входящие в задачу множества заменяются на множества канонической формы. Возникает задача построения операций над каноническими множествами, результат которых был бы максимально близок в смысле некоторого критерия к результату соответствующих операций над истинными множествами неопределённости.

Во-первых, это многогранники. Наиболее часто употребляют параллелепипеды, причём их грани во многих случаях параллельны координатным плоскостям, что приводит к интервальному анализу. Вовторых, это эллипсоиды, использовать которые в качестве канонических множеств предложил F. C. Schweppe в 1968 г.. Метод был развит в [20–24] и др. Используют и более сложные множества.

С точки зрения применения в реальных технических устройствах желательно, чтобы гарантированный способ аппроксимации удовлетворял следующим требованиям.

1. Геометрические фигуры, которыми в конечном итоге приближают множества достижимости в рамках некоторого метода, должны быть понятны специалистам, которые будут им пользоваться, т. е. инженерам.

2. Для достижения удовлетворительной точности аппроксимации должно быть достаточно сравнительно небольших вычислительных ресурсов.

Здесь следует принять во внимание то, что переход от реальных устройств к математическим моделям часто порождает значительную ошибку, по сравнению с которой погрешность аппроксимации при использовании множеств канонической формы может оказаться несущественной.

3. Способ должен допускать сравнение с вероятностным оцениванием.

Дело в том, что реальные неопределённости крайне редко носят чисто случайный или чисто игровой характер. Следовательно, приходится выбирать между гарантированным и вероятностным подходами. Для этого гарантированный способ должен быть “близок” к вероятностному, а последний, как правило, опирается на гауссовы распределения неопределённых величин.

Метод эллипсоидов удовлетворяет всем указанным требованиям.

В диссертации используются эллипсоидальные оценки, основанные на [22], [23] и многих других исследованиях, выполненных в ИПМех РАН под руководством академика РАН Ф. Л. Черноусько за последние тридцать лет.

Отметим, что все рассматриваемые функции времени таковы, что решения дифференциальных уравнений, в которых эти функции используются, существуют, а все случаи наложения дополнительных ограничений оговорены отдельно. Зависимость всех введённых величин от времени явно указана при их определении и далее может быть опущена ради уменьшения громоздкости формул. Через Ik везде обозначена единичная матрица размерности k k.

Публикации. Основные результаты диссертации опубликованы в работах [1–19]. Основные результаты, выносимые на защиту и опубликованные в работах [1–10], [18] и [19], получены автором диссертации.

Структура и объём диссертации. Диссертация состоит из введения, четырёх глав, заключения, списка литературы и приложения. В приложении собраны рисунки и таблицы ко всем главам диссертации, а конце приведён список соглашений и обозначений, использованных в тексте диссертации.

Количество страниц в диссертации 280, в том числе иллюстраций 60.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Введение посвящено описанию некоторых особенностей развития математической теории оптимального управления. Основное внимание уделено трудностям, возникающим при попытке получить в аналитической форме решения задач, важных для практических приложений.

Поскольку учесть неопределённые факторы без расширения фазового пространства задачи удаётся редко, то описаны основные подходы, применяемые при рассмотрении систем с неопределёнными параметрами, т. е. вероятностный и гарантированный. Последний рассмотрен более подробно, обоснована целесообразность применения эллипсоидальных оценок, сформулирована цель работы и в сжатом виде изложено содержание всех глав и параграфов.

Первая глава содержит решения ряда задач построения оптимального управления в форме программы и синтеза. Результаты исследования могут быть использованы для создания регуляторов, способных лучше учитывать особенности неопределённых внешних воздействий и конструктивные ограничения, важные для реализации управления.

Предположим, что на динамическую систему действует возмущающая сила, которая иногда резко и на очень короткое время возрастает, но, как правило, сравнительно невелика. Требуется удерживать объект поблизости от заданной точки в пространстве. С этой целью можно построить управляющее устройство, включающее в себя две подсистемы.

Первая представляет собой обычный регулятор и предназначена для стабилизации при небольшой величине возмущения, что значительно облегчает конструирование и эксплуатацию. Сила, прикладываемая к объекту в результате её работы, сравнительно мала. Вторая предназначена для компенсации больших импульсных воздействий и соответствующая сила велика. Следовательно, влиянием первой подсистемы на объект во время работы второй можно пренебречь, как и действием возмущения в отсутствии импульсов, поскольку оба эти фактора одинаковы по порядку величины. С другой стороны, на вторую подсистему должно быть наложено дополнительное ограничение. Именно, требуется не просто привести объект в заданную точку, но и обеспечить в этой точке малую (а лучше нулевую) скорость. Иначе для выполнения поставленной цели возможностей первой подсистемы может не хватить.

Получаем задачу оптимального быстродействия для детерминированной модели с требованием получить нулевую скорость в заданной точке в конечный момент времени (“мягкая встреча”).

В §2.1 рассмотрена задача оптимального по быстродействию приведения системы в начало координат с нулевой скоростью с помощью ограниченной по модулю силы. Посредством введения автомодельных сопряжённых переменных удалось свести решение двухточечной задачи к отысканию оптимального корня некоторой функции, задаваемой аналитически. Построен численный алгоритм, позволяющий получить полное решение задачи управления в форме синтеза. Найдены коэффициенты обратной связи по ортам векторов положения и скорости, построен алгоритм управления и функция Беллмана. Приведён расчёт примеров с конкретными начальными данными.

В §2.2 исследована задача об оптимальном по быстродействию достижении материальной точкой поверхности сферы с нулевой скоростью посредством ограниченной по модулю управляющей силы. Поверхность проницаема и “посадка” на сферу может производиться как снаружи, так и изнутри. Оптимальное управление в форме программы и синтеза, траектории, время быстродействия и функция Беллмана строятся на основе принципа максимума Понтрягина. Введением автомодельных переменных краевая задача сведена к численному поиску решений алгебраического уравнения четвёртой степени и трансцендентного уравнения. Установлено свойство вырождения краевой задачи, когда оптимальная траектория близка к прямолинейной; построено решение задачи синтеза в случае вырождения. Эффективность предлагаемого подхода проиллюстрирована конкретными примерами, содержащими расчёты семейств траекторий, и анализом режимов управления.

В §2.3 рассмотрены управляемые движения материальной точки в однородной вязкой среде. Решена задача о приведении за минимальное время этой точки посредством ограниченной по модулю силы на фиксированную сферу как изнутри, так и снаружи. Для произвольного начального положения и любой начальной скорости с помощью принципа максимума Л. С. Понтрягина в явном виде построены оптимальное управление как в форме программы, так и в форме синтеза, время быстродействия и функция Беллмана, а также оптимальная фазовая траектория. Проведены аналитическое и численное исследования решения, обнаружены качественные механические свойства оптимальных характеристик движения: немонотонная зависимость времени быстродействия от величины начального вектора скорости, разрыв функции Беллмана.

В §2.4 исследована задача об оптимальном уклонении материальной точки под действием ограниченной силы от области сферической формы. Решение было найдено согласно следующему алгоритму. Рассмотрим некоторую допустимую траекторию движения. Найдём на траектории такую точку или множество точек, расстояние от которой до начала координат минимально. Для краткости назовём эту точку и соответствующее расстояние критическими. Для каждого набора начальных условий исследуем всё множество возможных траекторий (т. е. множество достижимости), образующееся перебором допустимых управлений, и среди них найдём имеющую максимальное критическое расстояние.

Затем определим такое подмножество начальных условий, для которого это расстояние не меньше радиуса препятствия. Следовательно, невозможно избежать встречи с препятствием, если начальные условия не принадлежат найденному подмножеству. Если уклонение возможно, то не существует траектории, имеющей большее критическое расстояние, чем та, которая может быть найдена по соответствующим формулам.

С точки зрения предотвращения попадания на сферу представляется естественным назвать такую траекторию оптимальной, поскольку она проходит на максимально возможном расстоянии от препятствия.

Таким образом, изложенная процедура оптимального уклонения содержит последовательное решение четырёх задач: 1) определение граничных точек множества достижимости; 2) поиск наиболее удалённой от начала координат точки этого множества для каждого момента времени t = T < ; 3) нахождение ближайшей к началу координат точки на соответствующей траектории; 4) определение границы области допустимых начальных условий.

Решение первых двух задач найдено аналитически. Построение минимизирующей траектории x(T ) требует некоторых вычислений, а определение границы допустимой области, т. е. решение четвёртой задачи, также оказалось аналитическим.

В §2.5 рассмотрен случай, когда управляющее воздействие (сила или момент силы) F не может изменяться мгновенно. Это предположение лучше соответствует реальным управляющим устройствам, которым часто присуща значительная степень инерционности, в то время как существующие решения задач оптимального управления часто требуют, чтобы F принимала крайние значения и мгновенно переключалась с одного них на другое.

Пусть скорость изменения F ограничена | | v0, где v0 > заданная постоянная. Будем полагать, что ограничение F0 на абсолютную величину силы не достигается и всегда |F (t)| < F0. Рассмотрим систему с одной степенью свободы, описываемую уравнениями 1 = x2, m2 = F, где x1 обобщённая координата, x2 обобщённая скорость, m постоянная инерционная характеристика (масса или момент инерции). При помощи замены переменных x1 = (v0/m)x, x2 = (v0/m)y, F = v0z приведём уравнения движения и ограничение на | | к виду = y, = z, = u, |u| 1 (1) Теперь переменные x, y, z являются фазовыми координатами, а u играет роль ограниченного управления.

С помощью автомодельных переменных удалось понизить порядок системы и построить в замкнутой полностью аналитической форме синтез управления, оптимального по быстродействию для системы (1). Это управление u(x, y, z), выраженное как функция текущих (или начальных) фазовых координат x, y, z, обеспечивает приведение системы (1) на заданное конечное многообразие x(T ) = 0, y(T ) = 0 при произвольном z(T ) за кратчайшее время T.

Вторая глава посвящена задаче о наискорейшем переводе центра масс манёвренного самолёта из одной заданной точки трёхмерного пространства в другую при фиксированных векторах скоростей в этих точках. В примерах вектор скорости в конце движения равен начальному.

В научной литературе управлению полётом самолётов уделено большое внимание. Наиболее подробно изучены вопросы, связанные со стабилизацией заданных лётчиком параметров движения методами автоматического регулирования. Исследованные задачи выбора оптимальной траектории полёта связаны с поиском наилучших параметров крейсерских режимов полёта, увеличением дальности полёта, уменьшением расхода топлива и прочих вопросов, важных, в первую очередь, для оптимизации лётно-технических характеристик неманёвренных самолётов. В работах, посвящённых оптимизации манёвренных характеристик самолёта, в основном была исследована достаточно узкая проблема оптимизации угловой скорости виража в горизонтальной плоскости без ограничений на координаты самолёта в конце манёвра. Траектории, лежащие в вертикальной плоскости и не сводящиеся к обычным для гражданской авиации (смена высоты полёта, заход на посадку и т. п.), изучались преимущественно для нужд космической отрасли.

Современные потребности развития и совершенствования манёвренных самолётов приводят к необходимости решения специальных задач оптимального управления, существенных, в частности, для воздушного боя. Например, внезапное нападение противника заставляет предпринимать освоенные на тренировках оборонительные манёвры, одним из которых является “мёртвая петля”. Главным отличием настоящей работы от проведённых ранее исследований следует считать то, что здесь скорость в момент окончания манёвра равна начальной. Последнее важно как при уклонении от противника, так и при преследовании цели.

Пренебрежём влиянием ветра, вращением Земли и кривизной её поверхности. Рассмотрим движение центра масс самолёта в трёхмерном пространстве относительно некоторой наземной неподвижной правой декартовой прямоугольной инерциальной системы координат OXY Z, оси OX и OZ которой лежат в горизонтальной плоскости. Имеем m = G + R + P, m = const, = v(t) , |v| = V const > 0 (2) r RЗдесь m масса летательного аппарата, которую будем считать постоянной, r радиус-вектор центра масс самолёта в системе OXY Z с компонентами x, y и z, G сила тяжести (гравитационное поле будем полагать однородным), R главный вектор аэродинамических сил, P сила тяги двигателей, v вектор скорости. В силу сказанного выше предположим, что значение |v| всегда достаточно велико и ограничение на него можно не учитывать. Будем считать атмосферу изотермической с аппроксимационной зависимостью массовой плотности воздуха от высоты y вида = 0 exp(-y/h). Вектор R в (2) принято рассматривать в виде суммы трёх векторов: силы лобового сопротивления Rx, направленной против вектора скорости v; подъёмной силы Ry, лежащей в вертикальной плоскости симметрии самолёта и ортогональной Rx, и боковой силы Rz. Последнюю положим равной нулю. Будем считать, что подъёмную силу Ry можно мгновенно менять как по величине, так и по направлению, причём |Ry| может быть выражен через безразмерный скалярный коэффициент подъёмной силы Cy:

max |Ry| = CyqS, 0 Cy Cy, q = v2/где q скоростной напор, S площадь крыла самолёта. Пусть скаляр Cx0 коэффициент лобового аэродинамического сопротивления при нулевой подъёмной силе, A коэффициент “отвала” поляры. Тогда модуль силы аэродинамического сопротивления можно представить в форме |Rx| = Cx0 + ACy qS. Будем полагать, что вектор тяги P всегда направлен вдоль вектора скорости v. Величина |P | ограничена минимальной и максимальной допустимыми мощностями двигателей:

Pmin |P | Pmax, Pmin /|G| = 1/2, Pmax /|G| = -B1y + B2V + Bгде B1, B2 и B3 постоянные коэффициенты, определяемые на основании экспериментальных данных. Введём скаляр u:

Up = g (Pmax + Pmin)/ (2|G|), Um = g (Pmax - Pmin)/ (2|G|) |P |/m = Up + uUm, |u| где g величина ускорения свободного падения. Это преобразование позволяет перейти от величины |P | с ограничениями, зависящими от фазовых переменных, к величине u, ограничения на которую от фазовых переменных не зависят.

Разделим обе части дифференциального уравнения для r в (2) на m:

= v, v = G/m + Up + uUm - Cx0 + ACy qk + Cyqk (3) , , = v/V, = Ry/|Ry|, (, ) = 0, k = S/m = const Rгде через (·, ·) обозначено скалярное произведение двух векторов. Введём коэффициенты нормальной и тангенциальной перегрузки ny = |Ry|/|G|, 0 ny nmax, nx = (|P | - |Rx|) /|G| y Тогда можно записать дифференциальные уравнения (3) в виде = v, v = fg + gnx + gny, fg = G/m, |fg| = g (4) В §2.2 аналитически исследован трёхмерный случай (3), в котором требуется выбрать вектор cl, имеющий фазовые ограничения, а также скаляр u так, чтобы за минимальное время T привести центр масс самолёта из заданного начального в заданное конечное состояние в фазовом пространстве для системы = v, v = Up + uUm - qkCx0 - qk|cl|2A + qkcl + fg max |u| 1, cl = Cy, |cl| = Cy Cy, |cl|qk gnmax y Для примера рассмотрим случай, когда начальная и конечная фазовые точки совпадают. Обозначим через col вектор-столбец и запишем r(0) = r(T ) = col(0, 5000 м, 0), v(0) = v(T ) = col(250 м/с, 0, 0) (5) Рис. 1. Рис. 2.

На рис. 1 начальная и конечная точка обозначена буквой ; стрелками показано направление движения по кривым. Оптимальная траектория 1 имеет переменную кривизну на конечном участке вблизи .

Время движения по ней составляет T1 24.94 с.

В §2.3 дополнительно введено ограничение на знак кривизны траектории. Поскольку это можно сделать только для плоских кривых, то всюду в полученных ранее формулах следует полагать проекции векторов на горизонтальную координатную ось OZ равными нулю и тем самым считать задачу не трёхмерной, а двумерной. Пусть x и y проекции на оси OX и OY. Введём новое скалярное управление n:

n vy n n = ny sign y, nyy =, nyx = - vx 1 + vy/vx 2 2 2 1 + vy/vx Тогда можно записать (4) в форме = v, v = Up + uUm - qkCx0 - Ag2n2q-1k-1 + gny + fg max |u| 1, |n| nmax, |n| Cy qk/g y Условие неотрицательности кривизны траектории имеет вид n |vx|/V, если vx (6) n > |vx|/V, если vx > где vx проекция скорости v на ось OX. Условие для траекторий, имеющих неположительную кривизну, имеет вид, аналогичный (6).

Для случая (5), показанного на рис. 1, время движения по оптимальной траектории 2 с неотрицательной кривизной T2 27.25 с, а по оптимальной траектории 3 с неположительной кривизной T3 24.96 с.

Заметим, что 2 близка к окружности, но ею не является. Помимо траекторий 1, 2 и 3 существуют ещё три соответствующих оптимальных решения, которые можно получить, если взять кривые, зеркально симметричные приведённым относительно вертикальной прямой, проходящей через точку .

Также были вычислены траектории, удовлетворяющие граничным условиям r(0) = col(0, 5000 м), v(0) = v(T ) = col(250 м/с, 0), причём вектор r(T ) любой. Полученные кривые показаны на рис. 2, где начальная точка; I оптимальное решение с неположительной кривизной и временем движения TI 22.74 с; II оптимальное решение с неотрицательной кривизной и временем движения TII 23.58 с. Стрелки обозначают направление движения по траекториям.

Третья глава посвящена дальнейшему развитию метода эллипсоидов с целью получения уравнений в форме, удобной для приложений, решению задач построения аппроксимаций в случае неопределённости ограничений на управление и оптимального выбора этих границ, а также проблеме управления ансамблями траекторий с использованием глобально оптимальных эллипсоидов.

Изложим некоторые его положения по [22], [23]. Пусть E(, ) обозначает эллипсоид, заданный l-мерным вектором своего центра и симметрической неотрицательно определённой l l-матрицей . Если положительно определена, то E(, ) = : -1( - ), - 1 (7) Rl где центр, матрица. Если какие-либо собственные числа обращаются в нуль, то под E(, ) будем понимать геометрическую фигуру, представляющую собой предел, к которому стремится последовательность эллипсоидов (7) с невырожденными матрицами, соответствующие собственные числа которых стремятся к нулю. В частности, E(, ) может быть точкой. Будем называть эллипсоидами супердостижимости такие эллипсоиды, которые обеспечивают внешние эволюционные оценки для множеств достижимости.

Рассмотрим динамическую систему = A(t)x + B(t)w(t) + (t), x(t) , w(t) (8) Rn Rm w(t) E g(t), W (t), x(t0) E(a0, Q0) (9) где векторы g(t) и a0, а также матрицы W (t) и Q0 известны. Тогда x(t) E a(t), Q(t), причём Q Q = AQ + QA + + q(t)G(t), G(t) = BW B, Q(t0) = Q0 (10) q(t) a = Aa + Bg + , a(t0) = a0 (11) Скалярная функция q(t) подчинена двум условиям. Во-первых, задача Коши (10) должна иметь решение, а во-вторых, q = q(t) при t t0. Существующие методы выбора функции q(t) можно разделить на две группы. В обоих случаях вводится функционал L = L(S), гладко зависящий от произвольной симметрической матрицы S. Требуется, чтобы градиент grads L(S) на множестве симметрических матриц существовал и был неотрицательно определённой матрицей. То гда q = Tr(P Q)/ Tr(P G), причём для получения локально оптимальных эллипсоидов супердостижимости следует использовать соотношение P (t) = grads L(S)|S=Q(t), минимизирующее скорость роста функционала в каждый момент времени между t0 и моментом окончания процесса T. Для получения глобально оптимальных эллипсоидов супердостижимости необходимо решать задачу Коши = -P A - A P, P (T ) = grads L(S)|S=Q(T ) (12) Вариант (12) обеспечивает минимальное значение функционала в момент T. Заметим, что оба варианта совпадают при t0 = T.

Часто начальное положение объекта в фазовом пространстве измеряют с весьма высокой точностью. Тогда матрица Q0 вырождена и q(t0) может обратиться в нуль, что может привести к появлению особой точки в (10). Положение ещё более осложняется, если матрица G тоже вырождена.

В §3.2 предложено искать q(t) в виде суммы q0 + tq1 + t2q2 + O(t3) при t0 = 0, назначая соответствующие коэффициенты одновременно с получением членов суммы Q(t) = tQ1 + t2Q2 + t3Q3 + t4Q4 + O(t5) при Q(0) = 0. Получающиеся эллипсоиды не будут относиться ни к локально, ни к глобально оптимальным.

Пусть существуют представления A(t) = A0 + tA1 + O(t2), G(t) = G0 + tG1 + t2G2 + O(t3) где A0, A1, G0, G1, G2 известные постоянные матрицы.

Если выбрать q0 = 0, q1 = 1 и q2 = 0, то tQ(t) = t2G0 + t3Q3 + A0Q3 + Q3A + A1G0 + G0A + G2 + O(t5) 0 Q3 = A0G0 + G0A + G1 /Оказалось, что такой подход даёт интересные результаты. В частности, выбор q(t) = t и замена Q(t) = tZ(t) в задаче (10) при Q(0) = 0 приводят к линейной по Z задаче = A(t)Z + ZA (t) + G(t), G(t) = B(t)W (t)B (t), Z(0) = 0 (13) Если Q0 = 0, то можно решить задачу Коши QA = AQA + QAA, QA(0) = QТогда искомая аппроксимация x(t) представляет собой сумму двух эллипсоидов: эллипсоида с матрицей QA(t) и центром a(t) из (11) и эллипсоида с матрицей Q(t) = tZ(t) и центром в начале координат. Эта сумма может быть аппроксимирована одним эллипсоидом известными методами. Для простоты изложения в дальнейшем будем, как правило, полагать Q0 = 0 и ограничиваться рассмотрением (13).

В §3.3 вектор w(t) в (8) рассматривается как управление с назначаемыми ограничениями, которые должны быть выбраны оптимальным в смысле некоторого критерия способом. Такого рода задача может возникнуть, в частности, при назначении соотношения мощностей управляющих воздействий по различным фазовым координатам. Например, в технических приложениях может потребоваться так распределить имеющиеся ресурсы управления при конструировании системы, чтобы множество достижимости имело максимально возможные размеры по определённым направлениям в фазовом пространстве. Это даёт возможность улучшить управляемость при наличии априорных данных об условиях работы реального объекта. Соответствующий выбор должен быть сделан применительно ко всему ансамблю допустимых движений системы, что требует исследования множеств достижимости.

Уравнения (13) позволяют для любой допустимой реализации w(t) с помощью выбора матрицы W (t) максимизировать функционал T Tr Q(T ) + Tr (t)Q(t) - Tr W (t)R(t)W (t) dt где (t) и постоянная произвольные положительно определённые симметрические матрицы, а T конечный момент времени. Например, если и одинаковы и диагональны, то выбор соответствующих элементов этих матриц определяет, насколько для данного практического применения величина максимума проекции множества достижимости на какую-либо ось системы координат важна по сравнению с аналогичными проекциями на другие оси. Назначение положительно определённой матрицы R(t) позволяет ограничивать норму матрицы W (t) и тем самым может отражать ограничения на суммарную максимальную управляющую силу в системе (8). С этой точки зрения задача состоит в выборе мощности каждого из нескольких приводов при ограниченности суммарного веса двигателей, их габаритов, уровня потребления энергии и т. д. В простейшем случае можно положить R(t) = (t)Im, где (t) произвольная скалярная положительная функция.

Показано, что решение задачи всегда существует, единственно и имеет вид W (t) = B P BR-1, = -A P - P A - t, P (T ) = T В §3.4 рассмотрен случай, когда сами границы допустимых значений x(t0) и w(t) известны неточно. В таких ситуациях можно выбрать оценку возмущения настолько грубой, что она охватит все возможные варианты. Однако это может привести к неоправданно высокой неопределённости в значениях x(t). В качестве альтернативы можно построить эллипсоид, содержащий множество достижимости системы (8) при неточно заданных элементах матриц Q(t0) и W (t), описывающих границы возможных начальных условий и внешних воздействий (9). Для этого необходимо знать параметры эллипсоида, содержащего возможные значения этих элементов для Q(t0) и аналогичного ему для W (t).

Воспользуемся тем, что система (13) линейна по компонентам матриц Z(t) и W (t). Составим вектор (t) размерности n(n + 1)/2 из элементов симметрической матрицы Z(t), находящихся не ниже главной диагонали, и вектор (t) размерности, не превышающей m(m +1)/2, из соответствующих элементов симметрической матрицы W (t). Оба эти вектора заданы неточно. Построим эллипсоид с матрицей (t0), ограничивающий возможные начальные значения (t0) и аналогичный эллипсоид с матрицей (t), аппроксимирующий (t). Тогда поставленная задача сводится к решению системы вида (13), но не для исходных векторов x(t) и w(t), а для (t) и (t) соответственно. Алгоритм применён к двум простым механическим системам.

В §3.5 изучена ситуация, когда можно управлять матрицей системы (8), (9) и таким образом учитывать всю совокупность возможных траекторий, т. е. управлять их ансамблем.

Пусть A(t) = A0(t) + A1(t, u) и = (t, u), а вектор g(t) 0. Тогда система (8), (9) примет вид = A0(t) + A1(t, u) x + B(t)w + (t, u), w E(0, W (t)) (14) Здесь u U управление, а скаляр = const малый параметр.

Rk Множество достижимости (14) будем оценивать с помощью глобально оптимальных эллипсоидов. Задача состоит в том, чтобы найти такое управление u для системы уравнений (14), что Tr CQ(T ) + Ca(T ), a(T ) min (15) Здесь C фиксированная положительно определённая матрица.

В результате проведённого исследования построен алгоритм, позволяющий построить указанное управление с погрешностью по функционалу (15), не превышающей O(2). При этом удалось уменьшить порядок решаемой краевой задачи до удвоенной размерности вектора x(t), т. е. значения, характерного для такой задачи теории оптимального управления, в которой ансамбль траекторий системы (14) во внимание не принимается.

В §3.6 исследован случай, когда имеется погрешность в исполнении управляющего воздействия, зависящая от его величины. Пусть система (8), (9) имеет вид = A(t)x + B(t, u)w + u(t), где w E(0, W (t)) и |u| 1 скалярное управление. Здесь, как и в §3.5, множество достижимости будем оценивать с помощью глобально оптимальных эллипсоидов, но вместо (15) будем использовать его упрощённый вариант, а именно L(Q) = Tr(CQ).

Показано, что оптимальное управление может принимать только значения ±1 и 0, причём существуют только такие точки переключения, в которых оно изменяется с ±1 на 0 и обратно, с 0 на ±1. Тем самым исследуемую проблему можно рассматривать как частный случай широко известного класса задач, искомое управление в которых можно назвать оптимальным по расходу топлива.

Четвёртая глава посвящена вопросам сравнения стохастического и детерминированного подходов к оцениванию фазового состояния динамических систем.

В §4.1 выяснены основания, на которых может быть построена математически корректная процедура сравнения гарантированного и вероятностного методов. Пусть динамическая система задана уравнением = f(x, t, ) (16) где = (t) гауссовский случайный процесс типа белого шума с ко вариационной матрицей R(t, t ) = (t) (t ) = N(t)(t - t ), где M N(t) матрица интенсивности шума, означает взятие математичеM ского ожидания, а (t) дельта-функция Дирака. Необходимо найти mx = {x} и матрицу ковариации Dx(t) процесса x(t).

M Типичная задача гарантированного априорного анализа точности имеет следующий вид = f(x, t, w) (17) где возмущающий вектор w = w(t) лежит в заданном множестве , которое, например, может быть эллипсоидом. Требуется найти эллипсоид E(a(t), Q(t)), в котором лежит x(t).

Чтобы иметь возможность сравнить результат решения задачи (16) с таковым для (17), mx и Dx нужно связать с a и Q. Для этого можно исходить из “правила 3 ”, т. е. отождествлять область, вероятность попадания в которую превосходит некоторую заданную постоянную величину (например, 90%), с соответствующей областью (или её оценкой), получаемой в результате применения гарантированного метода.

В §4.2 рассмотрена динамическая система, описывающая движение некоторого технического устройства, подверженного влиянию помехи (t) и имеющая вид = A(t)x + B(t)(t), x(0) = x0, x , (t) (18) Rn Rm Пусть (t) ограниченный по норме центрированный широкополосный шум с интервалом корреляции, намного меньшим всех характерных постоянных времени рассматриваемой динамической системы (18), и с ограниченной дисперсией F (t). Назовём его практически белым шумом.

Пусть x0 ограниченный по норме вектор с распределением, близким к нормальному, и матрицей дисперсии 0. Назовём векторы такого типа практически гауссовыми. В частности, будем считать x(t) практически гауссовым на всём интересующем нас промежутке времени. Требуется найти дисперсию вектора x(t) как функцию времени.

Поставленная инженерная задача исследована средствами как вероятностного, так и гарантированного подходов. При переходе от практически белого шума (t) к белому шуму с корреляционной матрицей (t)(t - ) по традиции предположим, что (t) = µF (t), где µ константа, назначаемая из инженерных соображений и имеющая размерность времени. Практически гауссовы векторы заменим гауссовыми с той же дисперсией.

Тогда искомая дисперсия (t) может быть найдена из уравнения = A(t) + A (t) + µG(t), G(t) = B(t)F (t)B (t), (0) = При использовании гарантированного подхода согласно §3.1 матрица эллипсоида, ограничивающего сверху значения x(0), будет равна Y0 = 20, а для (t) получим эллипсоид с матрицей U(t) = 2F (t), где для “правила 3 ” имеем = 3. В этом случае x(t) является вектором, для которого внешней гарантированной оценкой будет некоторый эллипсоид Y (t). Тогда можно найти эллипсоид для среднего отклонения x(t) от среднего значения с матрицей Q(t) = Y (t)/2, подчиняющейся уравнениям (10). Для всех конкретных L(Q), упомянутых в диссертации, функция q(t) и соотношения (10) не зависят от и в дальнейшем будем полагать = 1.

Проведено сравнение результатов применения обеих моделей. Указаны случаи, когда гарантированный подход даёт оценку дисперсии более точную, чем стохастический. Показано, что в некоторые моменты времени при определённых условиях матрица Q в (16) совпадает с матрицей Dx в (17).

В §4.3 установлено, как следует выбирать модель возмущения, чтобы указанные моменты времени можно было назначать специально. Поскольку соответствующее решение в значительной степени уже изложено в [25], то в диссертации приведены только важные для исследуемого вопроса результаты. Это необходимо, поскольку здесь они интерпретируются иным, отличным от оригинальной статьи образом. Оказалось, что использованный способ сопоставления связывает параметры возмущения со свойствами объекта, т. е., если необходимо построить уравнения (16) и (17), дающие эквивалентный разброс значений фазовых координат динамической системы, при составлении модели возмущений требуется учитывать не только свойства самого возмущения, но и характеристики динамической системы, даже если исходное возмущение (t) от последних не зависит.

В §4.4 составлен алгоритм, позволяющий сравнить результаты действия на динамическую систему процесса со случайными неограниченными приращениями и процесса с произвольными (в частности, детерминированными), но ограниченными приращениями. В качестве первого взят вектор v , каждая компонента которого винеровский Rm t процесс, т. е. vi = i dt, где i центрированный белый шум с единичной интенсивностью, соответствующий компоненте vi. В качестве второго использовано ограниченное возмущение u E(0, Imt), где u .

Rm В §4.5 в рамках метода эллипсоидов построен аналог фильтра Калмана для гарантированной оценки состояния динамической системы = A(t)x + B(t)w(t), x , w(t) Rn Rm (19) y(t) = H(t)x + v(t), y(t) Rr где матрицы A(t), B(t) и H(t) известны, вектор w(t) описывает возмущение, действующее на систему, а вектор v(t) ошибку наблюдения. Будем аппроксимировать значения w(t) эллипсоидом размерности m m с известной матрицей W (t), а значения v(t) эллипсоидом размерности r r с известной матрицей V (t), причём центры обоих эллипсоидов будем считать нулевыми.

Уравнения искомого фильтра имеют вид - = A + H V y(t) - H, (t0) = x(t0) - = A + A - H V H + BW B, (t0) = (20) A = A + In/ 2q(t) W = q(t) 1 + (t)-1 W, V = q(t) 1 + (t) V где (t) и q(t) произвольные скалярные функции времени, причём (t) 0 и q(t) 0 при t t0. Интересно, что при t0 = 0, (0) = 0, (0) = 0, y(0) = 0 замена переменных (t) = tZ(t), (t) = µ(t) t, y(t) = z(t) t и выбор (t) = t/(1 - (t)), (t) = t/(t), где 0 (t) < 1, позволяют привести (20) к виду -µ = Aµ + (t)ZH V z(t) - Hµ, µ(0) = (21) - =AZ + ZA - (t)ZH V HZ + BW B, Z(0) = 1 - (t) Уравнения (21) по форме совпадают с известными уравнениями фильтра Калмана с точностью до множителей, зависящих от (t). С точки зрения, изложенной в §4.1, можно сказать, что эти множители увеличивают возможное воздействие факторов w(t) и v(t), входящих в (19), по сравнению со стохастическим случаем, когда W и V характеризуют интенсивности соответствующих шумов. Такой эффект связан с особенностями выбранного способа аппроксимации множеств достижимости.

Функцию (t) можно назначить, например, в соответствии с требова d нием Tr C(t) min, где C произвольная постоянная неотриdt цательно определённая матрица. Тогда -0, Tr(CBW B ) Tr CZH V HZ (t)= Tr(CBW B ) - 1 -,Tr(CBW B ) < Tr CZH V HZ -Tr (CZH V HZ) ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ Получено численно-аналитическое решение задачи о приведении материальной точки в начало координат с нулевой скоростью посредством ограниченной по модулю силы за минимально возможное время. Для того же объекта исследована возможность наискорейшего достижения поверхности заданной сферы в фазовом пространстве как в отсутствие, так и при наличии однородной вязкой среды. Аналитически решена задача определения границы области допустимых начальных условий, позволяющих уклониться от неподвижного сферического препятствия динамическому объекту, управляемому ограниченной силой. В замкнутой форме построен синтез оптимального управления в задаче оптимального быстродействия для линейной системы третьего порядка с инерционным управлением.

Рассмотрена задача о наискорейшем переводе центра масс манёвренного самолёта из одной заданной точки трёхмерного пространства в другую при фиксированных векторах скоростей в этих точках. Найдены численные решения при совпадающих начальных и конечных условиях для траекторий, целиком лежащих в вертикальной плоскости. Показано, что в общем случае решение неединственно, причём наилучшая траектория может менять знак кривизны. Найдены локально оптимальные решения. Рассмотрена задача с учётом ограничения на знак кривизны траектории и вычислены соответствующие оптимальные управления как при фиксированной, так и при свободной конечной точке.

В результате выполнения диссертационной работы получила дальнейшее развитие теория аппроксимации множеств достижимости с помощью эллипсоидов. Построена внешняя гарантированная эллипсоидальная оценка, применимая при любом вырождении как начального эллипсоида, так и эллипсоида, содержащего вектор внешнего возмущения. Показано, что она обеспечивает высокую точность аппроксимации на малых интервалах времени. Исследована задача выбора параметров эллипсоида, содержащего вектор управления. Разработан метод решения проблемы построения гарантированной внешней аппроксимации множества достижимости линейной динамической системы в случае, когда границы допустимых значений неопределённых факторов известны неточно. Рассмотрены с теоретических позиций частный случай неточной реализации управления исполнительными устройствами и случай управляемой матрицы системы. Получены результаты, позволяющие учитывать всю совокупность возможных траекторий ансамбля.

Выяснены основания, на которых может быть построена математически корректная процедура сравнения гарантированного и вероятностного методов описания различных неопределённых факторов. Для динамических систем, традиционно моделируемых методами теории вероятностей, рассмотрена проблема составления математической модели линейной динамической системы с аддитивным неопределённым воздействием по её инженерному описанию. Указаны условия, при которых использование стохастической модели может привести к значительному завышению оценки степени неопределённости фазового вектора по сравнению с ситуацией, когда применяется гарантированный подход. Разработан метод сопоставления результатов действия на линейную динамическую систему процесса, имеющего случайные неограниченные приращения, и процесса с произвольными, в том числе и детерминированными, но ограниченными приращениями. Разработан фильтр, аналогичный известному фильтру Калмана, для получения непрерывной во времени внешней гарантированной эллипсоидальной оценки состояния динамической системы по данным измерений.

Литература 1. Акуленко Л. Д., Шматков А. М.Синтез управления в задаче оптимального по быстродействию приведения материальной точки в заданное положение с нулевой скоростью // ПММ. 1998. Т. 62. Вып. 1. C. 129–138.

2. Акуленко Л. Д., Шматков А. М. Наискорейшее попадание на сферу с нулевой скоростью // Докл. Академии наук. 2001. Т. 379. № 1. C. 28–32.

3. Акуленко Л. Д., Шматков А. М. Оптимальное по быстродействию достижение сферы материальной точкой с нулевой скоростью // ПММ. 2002. Т. 66. Вып. 1. C. 10–23.

4. Акуленко Л. Д., Шматков А. М. Оптимальное уклонение объекта от сферического препятствия // Докл. Академии наук. 2002. Т. 387. № 5. C. 608–612.

5. Акуленко Л. Д., Шматков А. М. Уклонение динамического объекта от неподвижной сферы под действием ограниченной силы // ПММ. 2003. Т. 67. Вып. 2. C. 179–190.

6. Акуленко Л. Д., Шматков А. М. Оптимальное по быстродействию пересечение сферы в вязкой среде // Изв. РАН.

Теория и системы управления. 2007. № 1. C. 23–30.

7. Желнин Ю. Н., Утёмов А. Е., Шматков А. М. Оптимальный по быстродействию манёвр “петля” без потери скорости // Изв. РАН. Теория и системы управления. 2012.

№ 6. C. 170–185.

8. Овсеевич А. И., Шматков А. М. К вопросу о сопоставлении вероятностного и гарантированного подходов к прогнозу фазового состояния динамических систем // Изв.

РАН. Теория и системы управления. 1997. № 4. С. 11–16.

9. Черноусько Ф. Л., Шматков А. М. Синтез оптимального быстродействия в одной системе третьего порядка // Доклады Академии наук. 1997. Т. 354. № 2. С. 174–177.

10. Черноусько Ф. Л., Шматков А. М. Оптимальное по быстродействию управление в одной системе третьего порядка // ПММ. 1997. Т. 61. Вып. 5. С. 723–731.

11. Шматков А. М. Об управлении системами с помехой, ограниченной по величине // Изв. РАН. Техн. кибернетика.

1994. № 4. С. 48–55.

12. Шматков А. М. Об управлении ансамблем траекторий при наличии ограниченной помехи // Изв. РАН. Теория и системы управления. 1995. № 4. С. 82–87.

13. Шматков А. М. Сопоставление стохастического и эллипсоидального оценивания неопределённости для динамической системы с возмущениями, ограниченными по величине // Докл. Академии наук. 2006. Т. 411. № 4. C. 460– 463.

14. Шматков А. М. О невырожденной локально оптимальной эллипсоидальной аппроксимации оценки состояний линейных систем // ПММ. 2008. Т. 72. Вып. 2. С. 241– 250.

15. Шматков А. М. Об оптимальном выборе ограничений по управлению // ПММ. 2010. Т. 74. Вып. 1. С. 170–175.

16. Шматков А. М. Оценивание фазового состояния динамической системы при неточно заданных границах возмущений // Изв. РАН. Теория и системы управления. 2011.

№ 4. С. 66–72.

17. Шматков А. М. Построение аналога фильтра Калмана для гарантированной оценки состояния динамической системы // Изв. РАН. Теория и системы управления. 2011.

№ 5. С. 33–40.

18. Chernousko F. L., Shmatkov A. M. Synthesis of time-optimal control in the third order system // Proc. of the International IFAC Workshop “Nonsmooth and Discontinuous Problems of Control and Optimization”. June 17–20, 1998, Chelyabinsk.

19. Chernousko F. L., Shmatkov A. M. New results on optimal ellipsoidal estimation for uncertain dynamical systems // Proc. of the World Congress IFAC-2002, v. 15, part 1, 2002, Barcelona, Spain.

20. Schweppe F. C. Uncertain dynamic systems. Englewood Cliffs, New Jersey: Prentice Hall, 1973. 563 p.

21. Куржанский А. Б. Управление и наблюдение в условиях неопределённости. М.: Наука, 1977. 392 с.

22. Черноусько Ф. Л. Оценивание фазового состояния динамических систем. М.: Наука, 1988. 320 с.

23. Chernousko F. L. State estimation for dynamic systems. Boca Raton, Florida: CRC Press, 1994. 304 p.

24. Kurzhanski А. В., Valyi I. Ellipsoidal calculus for estimation and control. Boston: Birkhuser, 1997. 321 p.

25. Ким Ю. В., Овсеевич А. И., Решетняк Ю. Н. Сравнение стохастического и гарантированного подходов к оцениванию состояния динамических систем // Изв. АН СССР. Техн. кибернетика. 1992.

№ 2. C. 87–94.

Антон Михайлович Шматков Оптимальное управление и оценивание движения в некоторых задачах динамики 01.02.01 Теоретическая механика Подписано к печати 27.09.2012. Заказ № 18-2012. Тираж 70 экз.

Отпечатано на ризографе ИПМех РАН 119526, Москва, пр-т Вернадского, 101,







© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.