WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     ||
|

Второй способ вычисления применим для объектов управления, ближайшие состояния которых по значениям параметров не всегда обладают близкими оценками. И наоборот, состояния с близкими оценками не всегда имеют близкие значения параметров.

Далее вычисленное управляющее воздействие подается на вход исполняющего органа, который в соответствии с ним воздействует на ОУ.

Адаптация (управление базой знаний) нечетких систем ААУ Исходя из основного условия задачи, согласно которому система управления должна иметь способность управлять ОУ в близкой к стационарной среде, т.е. в такой среде, свойства которой могут меняться во времени, система должна адаптироваться к изменениям свойств среды.

Под адаптацией мы понимаем переобучение системы – изменение алгоритма управления объектом.

Ввиду того, что знания в системе хранятся в виде нечетких правил управления (продукций), изменение алгоритма управления возможно двумя способами: либо изменением уже существующих правил, либо удалением существующих правил и генерацией новых.

Исходя из рассмотренной организации БЗ, при которой описания входных и выходных нечетких множеств хранятся отдельно от правил, и каждое нечеткое множество может быть использовано несколькими разными правилами, изменение входных множеств нежелательно, поскольку попытка изменить одно правило может повлечь изменения в других правилах, изменять которые не нужно.

Если исходить из условия, что входные и выходные множества остаются неизменными, можно заключить, что первый способ изменения алгоритма управления равносилен второму. То есть адаптация системы осуществляется за счет удаления старых правил, которые становятся неадекватными изменившимся свойствам ОУ и среды, и генерации новых правил.

Каждое правило, находящееся в базе знаний, должно контролироваться с точки зрения адекватности описания им закономерностей взаимодействия ОУ и среды. Для этой цели введем для каждого правила некоторый параметр Qj, при помощи которого будем задавать степень адекватности j-го правила. Пусть Qj = говорит о полной неадекватности правила текущим свойствам ОУ и среды, а Qj = – об обратном. Правила с Qj < Qmin, где Qmin – априорно заданный порог, ухудшают качество управления, и в некоторых реализациях систем управления могут быть удалены из БЗ для экономии памяти.

Очевидно, величина Qj должна меняться в процессе работы УС в соответствии с изменениями свойств объекта управления и среды. То есть значение этой величины можно использовать для отслеживания изменений свойств объекта управления и среды.

Изменение величины Qj на очередном такте должно зависеть от того, насколько j-ое правило принимало участие в управлении на предыдущем такте и на сколько получившийся при этом результат соответствует результату, предсказываемому правилом.

Тогда модуль изменения величины Qj на t–ом такте будет зависеть от степени принадлежности входных величин множествам входных переменных правила (посылка) и от степени принадлежности реально выполненного действия выходным переменным правила, что можно выразить в виде зависимости (14):

Qjwj x (Ot-1) wj y (At -1), (14) где, исходя из того, что x1t -1 y1t - x2t -1 y2t - Ot -1 = At -1 =, (15)......

xN t -1 yM t - величины wjx и wjy примут значения x wj x (Ot -1) = min(µ (xit -1)) ij, (16) i=1, N y wj y (At -1) = min(µ ( yit -1)) ij.

i=1,M Знак и величина изменения степени адекватности должны зависеть от принадлежности результирующих величин образу, описываемому данным правилом.

Введем также некоторую величину q – константу, задаваемую априорно, которая будет определять скорость изменения степени адекватности правил – некоторый аналог скорости сходимости для нейронных сетей.

Тогда значение величины Qj на каждом такте работы УС можно записать в виде формулы (17):

Qjt +1 = Qjt + wj x(Ot -1) wj y (At -1) q (wj x(Ot ) - Qjt ). (17) Полученное значение степени адекватности j-го правила Qj может быть использовано в процессе двумя способами: как поправочный коэффициент, корректирующий результирующую посылку j-го правила, и как индикатор необходимости присутствия данного правила в БЗ.

В 3-ей главе приводится описание разработанной в диссертации модели прикладной системы управления.

Разработка программной реализации нечеткой системы ААУ проведена с использованием CASE-системы 4GN, созданной с участием автора специально для ускорения разработки и унификации интеллектуальных систем управления, основанных на методе ААУ. Схема системы 4GN изображена на рис.2.

Рисунок 2. Общая схема системы 4GN.

Помимо структуры и основных функций 4GN, в главе описана структура разработанного в рамках данной диссертационной работы программного обеспечения. А именно: базовых классов системы ААУ для среды 4GN и модулей, реализующих:

• модель нечеткой системы управления ААУ, состоящей из блоков FuzzyPFR, FuzzyQAS, FuzzyKB и FuzzyDM;

• модели объектов управления – перевернутого маятника и корпуса космического аппарата – PendulumCO и SatelliteCO;

• подсистемы визуализации реального времени для 4GN;

• модулей для подсистемы визуализации ViewMembershipFunctions, ViewString и ViewPendulum, отображающих соответственно функции принадлежности, правила управления в текстовом виде и изображение перевернутого маятника.

В 4-ой главе представлены результаты нескольких серий экспериментов, в ходе которых уточняются параметры разработанной системы управления, оптимальные для различных объектов управления и целевых функций.

На прикладной системе управления перевернутым маятником были исследованы зависимости качества управления, скорости обучения системы и эффективности базы знаний от максимального размера кластера и длительности периода генерации правил.

В частности, было экспериментально установлено, что • эффективность БЗ линейно повышается при увеличении длительности периода генерации правил с 10 до 100 тактов;

• качество управления системы, а также количество правил в БЗ и время обучения системы падает при увеличении максимального размера кластера с 0,2 до 0,35. При значениях размера кластера, выходящих за пределы этого диапазона система теряет способность к обучению.

Также в этой главе разработанная прикладная система управления сравнивается с другими системами управления, решающими аналогичные задачи:

1. проводится сравнение разработанной системы с системами управления, основанными на различных нейросетевых реализациях обучения с подкреплением (reinforcement learning) на традиционной тестовой задаче балансирования перевернутым маятником. В ходе проведения экспериментов, результаты которых представлены в таблицах 1 и 2, показано преимущество нечеткой системы ААУ над другими системами, участвовавшими в экспериментах в скорости обучения примерно на 9% при балансировании маятником из фиксированного начального положения и примерно на 115% при балансировании маятником из случайного начального положения при равных критериях качества управления;

Таблица 1. Результаты опытов по балансированию перевернутым маятником из фиксированного начального положения.

Система управления GENITOR SANE Igel НААУ НААУ Среднее количество попыток 1846 535 283 259 Стандартное отклонение (SD) 1396 329 138 154 Максимальное отклонение 12 12 12 12 маятника Таблица 2. Результаты опытов по балансированию перевернутым маятником из произвольного начального положения.

Система управления GENITOR SANE Igel НААУ Среднее количество попыток 2578 1691 967 Стандартное отклонение (SD) 2092 984 1148 Максимальное отклонение маятника 12 12 12 2. На примере задачи стабилизации углового движения космического аппарата проводилось сравнение разработанной нечеткой системы ААУ с ранее разработанными вариантами системы ААУ, не использующими нечеткую логику. В ходе экспериментов нечеткая система ААУ показала преимущество в скорости обучения примерно в 8 раз (таблица 3). На этой же задаче была продемонстрирована способность разработанной системы к переобучению (адаптации);

Таблица 3. Результаты опытного сравнения различных вариантов системы управления угловым движением космического аппарата.

Система управления Pilot 1 Pilot 2 НААУ 1 НААУ Среднее количество тактов 7590 6905 862 обучения Стандартное отклонение (SD) 972 735 176 3. На примере программной модели мобильного робота Pioneer P3-DX с целевой функцией избежания столкновения с препятствиями показана возможность применения разработанной нечеткой системы для управления объектами этого типа. Сравнение полученной системы управления с другими системами не проводилось из-за отсутствия общепринятых тестовых задач для мобильных роботов.

Основные результаты работы В данной диссертационной работе представлен подход к построению систем автономного адаптивного управления на основе теории нечетких множеств.

Основные результаты работы:

1) разработано обобщенное описание системы ААУ на основе теории нечетких множеств;

2) разработаны методы синтеза подсистем системы ААУ на основе нечеткой логики, а именно:

• представление (кодирование) алгоритма работы системы управления в виде входных и выходных нечетких множеств и нечетких правил управления, • метод автоматического разбиения множеств значений входных и выходных переменных системы на нечеткие множества, отражающие пространственные закономерности во входных и выходных данных системы, • метод автоматической генерации нечетких правил управления с использованием автоматической кластеризации методом вычетов, при помощи которых описываются функциональные взаимосвязи между входами и выходами системы;

• метод коррекции степеней адекватности правил управления, позволяющий менять влияние каждого правила на процесс управления, адаптируя алгоритм управления к изменениям свойств объекта управления и среды;

3) на основе разработанных методов создана модель прикладной системы управления в виде модуля для системы Designer4GN на языке C#, которая была отлажена на задачах балансирования перевернутым маятником, стабилизации углового движения космического аппарата и управления мобильным роботом;

4) проведены несколько серий компьютерных экспериментов с разработанной системой управления и моделями объектов управления:

• на примере системы балансирования перевернутым маятником нечеткая система ААУ показала высокую скорость обучения, которая на 9%-115% выше по сравнению с системами, построенными на основе обучения с подкреплением, при равных критериях качества, • на примере системы стабилизация углового движения космического аппарата нечеткая система ААУ продемонстрировала существенное сокращение (примерно в 8 раз) скорости обучения, по сравнению с существующими системами ААУ, • на примере системы управления мобильным роботом была продемонстрирована возможность применения разработанной системы для эффективного управления объектами этого типа.

Публикации 1. Жданов А. А., Караваев М. В. Применение нечеткой логики в имитационной системе автономного адаптивного управления. Труды Института Системного Программирования Российской Академии Наук: Том 3. – М.: ИСП РАН, 2002, с.

119-135.

2. Караваев М.В., Жданов А.А. Применение нечеткой логики в системах автономного адаптивного управления. Сборник материалов всероссийской научно-технической конференции "Наука – производство – технологии – экология": Том 1. Киров: Изд-во ВятГУ, 2002, с. 13-14.

3. Alexander Zhdanov, Maxim Karavaev and Helen Maklakova, Claire Medigue, Michel Sorine. Simulation of control mechanisms in the cardio-vascular system.

French-Russian A.M. Liapunov Institute for Applied Mathematics and Computer Science. Transactions. Vol. 4. Pp. 233-245. Moscow. 2003.

4. Караваев М. В. Применение нечеткой логики в имитационной системе автономного адаптивного управления. Труды Института Системного Программирования Российской Академии Наук: Том 7 (под ред. А.А.Жданова).

– М.: ИСП РАН, 2004, с. 41-53.

5. Караваев М.В. Правила формирования связей между нейроноподобными элементами в системах автономного адаптивного управления. С. 102-108.

Сборник научных трудов Всероссийской научно-технической конференции Нейроинформатика-2004: Часть 2. М.: МИФИ. С. 102-108.

6. Жданов А.А., Устюжанин А.Е., Караваев М.В. Нейросетевой самообучаемый метод адаптивного управления динамическими объектами. Материалы XXIX Академических чтений по космонавтике, 2005 год. М.: 2005. с. 93.

7. А.А. Жданов, А.Е. Устюжанин, М.В. Караваев, Д.Б. Липкевич. 4GN – инструмент для разработки нейроноподобных адаптивных систем управления на основе метода автономного адаптивного управления. Сборник научных трудов Всероссийской научно-технической конференции Нейроинформатика2005: Часть 1. М.: МИФИ. С. 203-209.

8. Жданов А.А., Караваев М.В. Разработка адаптивной системы управления мобильным роботом с применением нечеткой логики. Всероссийская научнотехническая конференция "Наука – производство – технологии – экология".

Сборник материалов: Том 1. Киров: Изд-во ВятГУ, 2005, с. 34-36.

9. М.В. Караваев. Применение нечеткой логики в системах автономного адаптивного управления. Труды Международных научно-технических конференций «Интеллектуальные системы» (AIS'05) и «Интеллектуальные САПР» (CAD-2005). Научное издание в 4-х томах. - М.: ФИЗМАТЛИТ, 2005.

10. М.В. Караваев, А.Е. Устюжанин, А.А. Жданов. 4GN – программный инструмент для проектирования интеллектуальных систем управления. Труды Международных научно-технических конференций «Интеллектуальные системы» (AIS'05) и «Интеллектуальные САПР» (CAD-2005). Научное издание в 4-х томах. - М.: ФИЗМАТЛИТ, 2005.

Pages:     ||
|



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.