WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 4 | 5 || 7 | 8 |   ...   | 17 |

38 множество достаточно широким, ограничивая в каждом достижение определенных результатов деятельности. Примерами конкретном случае возможные значения обстановок имеющейся у моделей мотивационного управления являются рассмотренные в агента информацией). разделе 1.1 задачи планирования и стимулирования [8, 61]. В В соответствии с приведенным выше определением, управ- случае, например, задачи стимулирования, мотивационное управление – это воздействие на управляемую систему. Так как ление заключается в непосредственном (входящем в функцию управляемая система (точнее, управляемый субъект – агент) полезности аддитивно) вознаграждении агента за выбор определенных действий.

описывается кортежем, то внешнее воздействие в общем слуНаиболее «мягкое» (косвенное), по сравнению с институциочае может быть направлено на каждый из элементов этого кортенальным и мотивационным, и, одновременно, наименее исследожа. Выделим три группы переменных (элементов кортежа, ванное (с точки зрения формальных моделей) – это информацикоторые могут изменяться) – допустимые множества A и A0, фунонное управление [44, 55].

кция полезности f( ) и информация I. Этим трем группам переменВведенные типы управлений характеризуют объекты воздейных соответствуют три типа управлений (основание классификаствия (компоненты управляемой системы, на которые направлено ции – группа переменных, описывающих модель принятия управляющее воздействие), поэтому обсудим, что следует решений, на изменение которых направлено управление) [34]:

понимать под требуемым поведением управляемой системы, и, в - институциональное управление (изменение допустимых первую очередь – «требуемым» с чьей точки зрения.

множеств);

Исследователь операций, занимающийся построением и - мотивационное управление (изменение функции полезности);

анализом модели, как правило, находится на позициях - информационное управление (изменение информации, которую оперирующей (управляющей) стороны, то есть центра [19, 21, 51].

агент использует при принятии решений).

Следовательно, необходимо описать предпочтения центра и Обсудим кратко специфику каждого из этих типов управлений1.

рассмотреть модель принятия им решений по выбору управлений.

Институциональное управление, которое обозначим uA UA, Модель принятия решений центром описывается кортежемявляется наиболее жестким и заключается в том, что центр 0 = {UA, Uv, UI, A0,, w(.), Ф(.), I0}.

целенаправленно ограничивает множества возможных действий и «Действиями» центра (выбираемыми им стратегиями) результатов деятельности агента. Такое ограничение может являются управления uA UA, uv Uv, uI UI. Обозначим осуществляться явными или неявными воздействиями2 – u = (uA, uv, uI) U = = UA Uv UI – вектор управлений.

правовыми актами, морально-этическими нормами и т.д.

В большинстве моделей управления ОС считается, что единМотивационное управление, которое обозначим uv Uv, являственная роль центра заключается в осуществлении управления, ется более «мягким», чем институциональное, и заключается в то есть у него отсутствует собственный (не опосредованный целенаправленном изменении функции полезности агента. Такое действиями агентов) результат деятельности, поэтому резульизменение может осуществляться введением системы штрафов татом деятельности центра обычно считают совокупный и/или поощрений за выбор тех или иных действий и/или результат деятельности агентов.

Так как в условиях отсутствия природной неопределенности Естественно, на практике иногда трудно выделить в явном виде управление предпочтения центра v0( ) определены на множестве A' возможтого или иного типа, так как они используются одновременно.

Достаточно ярко институциональное управление проявляется в моделях управления многоэлементными ОС, в которых центр может запрещать или разрешать совместный выбор агентами определенных комбинаций действий В сложных (многоуровневых иерархических) системах центр может (примеры – производственные цепочки, управление проектами [12] и др.) или рассматриваться как субъект, управляемый центром более высокого уровня, а достижение определенных результатов совместной деятельности [73, 78]. агент – как центр, управляющий агентом более низкого уровня [57].

40 ных действий агентов, то качественно управление заключается в ном их поведении в зависимости от используемого способа побуждении центром агентов к выбору определенных действий. устранения игровой неопределенности приводит к той или иной Обсудим, какие действия следует центру побуждать выбирать концепции равновесия игры. Равновесие игры управляемых агентов. субъектов зависит от используемых центрами управляющих Рациональный выбор P(.) агентов (см. предыдущий пункт) воздействий, поэтому можно считать, что решение задачи управления ОС заключается в исследовании, во-первых, равновесия зависит от управляющих воздействий u(.) U, используемых игры управляющих органов и, во-вторых, – управляемого центром, то есть множество рационального выбора агентов есть равновесия игры агентов. В зависимости от уровней иерархии, P(u) A.

которым принадлежат участники рассматриваемого игрового Итак, центр может предсказать, что, если он использует взаимодействия, можно выделять игры между агентами (см.

некоторое управление u U, то агенты выбирают одно из разделы 2.1, 3.1), игры между центрами (см. раздел 2.2) и игры действий множества P(u). Если это множество содержит более между центрами и агентами (см. раздел 2.3).

одного элемента, то у центра остается неопределенность относиИтак, кратко подведем итоги первой главы.

тельно выбора агентов, которая может устраняться одним из В разделе 1.1 приведена классификация механизмов управописанных в [34] методов. Далее в тексте обычно будет исления ОС, выделены основные классы механизмов управления – пользоваться принцип максимального гарантированного резульмеханизмы стимулирования и планирования. Проведенный в тата, в соответствии с которым значение целевой функции центра разделах 1.2 и 1.3 анализ концепций решения кооперативных игр при использовании управления u U равно K(u) = min Ф(y, u).

yP(u) позволил обосновать использование для построения модели коаВеличина K(u), u U, называется эффективностью управле- лиционного взаимодействия участников ОС сбалансированность ния [11]. Следовательно, задача управления ОС формально кооперативной игры в качестве критерия устойчивости максиможет быть сформулирована следующим образом: найти мальной коалиции и понятие несущественности кооперативной допустимое управление, имеющее максимальную эффективность игры в качестве критерия невыгодности коалиционного взаимо(такое управление называется оптимальным управлением), то действия. Для исследования существенных игр с пустым С-ядром предложено использовать решение в угрозах и контругрозах. В есть K(u) max.

uU разделе 1.4 построена модель ОС с коалиционным взаимодейстРассмотренная модель управления является базовой моделью вием участников и сформулирована общая задача управления управления ОС, так как она позволяет унифицировано описывать подобными ОС, заключающаяся в выборе центром допустимого процессы принятия решений участниками ОС. Действительно, в управления, максимизирующего его критерий эффективности при многоуровневых системах взаимодействие между участниками условии, что действия агентов определяется решением различных уровней управления может описываться наращивакооперативной игры (в рамках выбранных концепций решения).

нием рассмотренной структуры по «вертикали». Введение нескольких управляющих органов (центров) или нескольких управляемых субъектов (агентов) соответствует «горизонтальному» расширению этой структуры.

Игровая неопределенность в принятии решений отражает взаимодействие субъектов, в результате которого выигрыши (полезности и т.п.) каждого из них в общем случае зависят от действий всех участников системы. Предположение о рациональ42 * yi вектора действий y*. Наконец, центр получает доход H(y*), ГЛАВА II. КОАЛИЦИОННОЕ ВЗАИМОДЕЙСТВИЕ зависящий от реализовавшегося вектора действий и выплачивает УЧАСТНИКОВ ОС С ПОЛНОЙ ИНФОРМАЦИЕЙ i-му агенту стимулирование ( y*), i N.

i Во второй главе на примере различных моделей стимулироЗадача центра заключается в выборе системы стимулировавания исследуются коалиционные взаимодействия в детермининия (то есть набора функций (.) ), приводящей к максимальрованных ОС. Рассматривается стимулирование в веерной ОС i (раздел 2.1), в ОС с распределенным контролем (раздел 2.2), а ному значению его целевой функции при условии, что агенты также задача формирования состава веерной ОС (раздел 2.3). выбором действия максимизируют свою целевую функцию при заданной центром системе стимулирования. Таким образом, при 2.1. Задача стимулирования в веерной ОС заданной системе стимулирования агенты участвуют в игре, в которой стратегиями являются их действия, а выигрыши опредеВ [58, 60, 62] был подробно исследован класс задач стимулиляются выражением (15).

рования в детерминированных ОС с несколькими агентами.

Ранее [58, 60, 62] при решении данной задачи считалось, что Рассматривалась следующая модель: ОС состоит из центра, агенты не могут координировать выбор своих действий, который управляет n агентами. Целевая функция центра обмениваться информацией и заключать между собой (14) ( y) = H (y) - ( y), i iN соглашения. В этом случае игру агентов можно рассматривать как некооперативную и использовать в качестве концепции решения где y = (y1,..., yn ) A' = Ai – вектор действий агентов – это iN данной игры равновесие Нэша (или равновесие в доминантных разность неотрицательного непрерывного дохода H(y) и стратегиях, если оно имеется).

суммарного стимулирования (также неотрицательного), которое В [62] было показано, что, в зависимости от заданных ограцентр выплачивает агентам, N = {1,..., n} – множество агентов, ничений на механизм стимулирования, оптимальными являются следующие системы стимулирования:

Ai = 1 – множество допустимых действий агента, i N.

+ Если центр может назначать i-му агенту стимулирование, заЦелевая функция i-го агента висящее от всего вектора действий y, то система стимулирования (15) fi (y) = ( y) - ci (y), i N, i * c(yi, y-i ) + i * yi = yi это разность получаемого им от центра стимулирования (y) и (16) ( y) =, i i * yi yi 0, затрат агента ci (y), связанных с реализацией всеми агентами где y* Arg max[H (y) - ( y)], ci вектора действий y. Функцию затрат ci (y), i N будем считать yA' iN неотрицательной неубывающей по каждой компоненте вектора реализует действие y* как единственное равновесие в доминантдействий функцией.

ных стратегиях и является -оптимальной для центра.

Как центр, так и все агенты точно знают функции Ф(.), fi(.), Если стимулирование i-го агента может зависеть только от поэтому данная модель и называется детерминированной.

его компоненты действия, то система стимулирования Порядок функционирования системы следующий. Центр * * * ci ( yi, y-i ) + i, yi = yi сообщает агентам зависимость (y) стимулирования от (17) (yi ) =, i i 0, yi y* i выбираемого ими вектора действий y. Затем все агенты одновременно и независимо выбирают каждый свою компоненту где y* Arg max[H (y) - ( y)], ci yA' iN 44 реализует действие y* как единственное равновесие Нэша и Фиксация (при заданной системе стимулирования) коалициявляется -оптимальной для центра. онной структуры ={S1, …, Sk} определяет игру k лиц с целевыми Если центр наблюдает только результат деятельности функциями (19) и стратегиями (20).

Кооперация агентов невозможна, если для произвольной z = g(y), где g :n m – однозначное непрерывное + + отображение, и доход центра зависит только от результата деякоалиционной структуры в любом равновесии Нэша y* игры Г тельности z, то система стимулирования Г выигрыш всех коалиций S не превышает их выигрыша в ci (y*(z*)) + i, z = z* равновесии Нэша некооперативной игры, то есть справедливо (18) (z) =, i неравенство z z* 0, (21) S N fS (y* ) fi ( y*).

Г где y*(z*) Arg min ( y), z* Arg max[H (z) - (z)] c i i iS y:g ( y)=z* iN iN Действительно, условие (21) совпадает с определением реализует результат z* как единственное равновесие Нэша и сильного равновесия Нэша, при наличии которого, как показано является -оптимальной для центра.

выше в разделе 1.2, кооперативная игра является несущественной.

Интерес представляет проверка влияния на данные резульРассмотрим последовательно модели, соответствующие таты коалиционного взаимодействия агентов. Далее предполагасистемам стимулирования (16)-(18).

ется, что агенты могут образовывать коалиции, и в ОС имеется Стимулирование каждого агента линейно-трансферабельный товар (деньги), которым агенты зависит от действий всех агентов могут обмениваться между собой.

Заметим, что в данной задаче коалиционное взаимодействие Если центр использует систему стимулирования (16), то агентов нежелательно для центра [26, 28]. Действительно, целевая функция произвольной коалиции S имеет вид системы стимулирования (16)-(18) реализуют оптимальное для * * (22) fS (y) = (yi - yi ) [ci (yi, y-i ) + ] - ci (yi, y-i ), i центра действие с наименьшими затратами. Любые договоренноiS iS сти между агентами могут только изменить реализуемое ими где – символ Кронекера.

действие, что уменьшит результат игры для центра. Важным * При выборе коалицией стратегии yS она получает выигрыш поэтому представляется поиск условий, при которых кооперативное взаимодействие агентов не сказываются на реализуемом i. Обозначим S0 S – множество участников коалиции S, не iS системами стимулирования (16)-(18) результате.

отклоняющихся от плана.

Далее будем называть коалиционной структурой ={S1, …, Тогда выигрыш коалиции S будет иметь вид Sk} произвольное разбиение множества агентов N на коалиции fS ( y) = (yi, y-i ) + ] - (yi, y-i ) - (yi, y-i ) = S1, …, Sk. При объединении группы агентов в коалицию S они [c * c * c i i i i iS0 iS0 iS \Sначинают действовать как один игрок с целевой функцией (23) = - (yi, y-i ), (19) fS (y) = ( y) - ci (y)] c [ i i i iS0 iS\SiS и векторной стратегией что в силу неотрицательности функции затрат меньше, чем i iS (20) yS = (yi )iS.

независимо от действий участников других коалиций, то есть выполнение плана y* является доминантной стратегией не только для каждого агента, но и для любой коалиции (в том числе 46 * * и состоящей из всех агентов). Таким образом, при образовании (27) ci ( yi, y-i ) + ci ( y* \S ', (0)S ').

Pages:     | 1 |   ...   | 4 | 5 || 7 | 8 |   ...   | 17 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.