WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 4 | 5 || 7 | 8 |   ...   | 12 |

Рассмотрим влияние информированности агентов на состояние АС. Под состоянием АС будем понимать совокупность действий агентов или некоторый их агрегат (то есть вектор y A’, или результат совместной деятельности z = w(y, ) A0, или в более общем случае – значение некоторого параметра q = F(y, )), а под их рациональным поведением (см. выше) – выбор равновесных стратегий, причем параллельно будут анализироваться максиминное равновесие (в рамках которого каждый из игроков устраняет неопределенность относительно действий других игроков, рассчитывая на наихудшие с его точки зрения их стратегии) и равновесие Нэша.

Опишем сначала рассматриваемую в [24] модель информационного регулирования, при котором управляющий орган – центр – передает информацию управляемым субъектам (агентам) о значениях некоторых параметров, например, прогнозируемых значениях факторов, влияющих на функционирование системы (например, о состоянии внешней среды). В модели регулируемого равновесия (следует отметить, что термин «регулируемое равновесие» имеет гораздо более широкую область применения, нежели чем только информационное регулирование, так как, фактически, он охватывает все теоретико-игровые модели управления многоэлементными АС [70]) задача центра состоит в том, чтобы привести систему в наиболее выгодную для него ситуацию равновесия (предполагается, что при каждом заданном сообщении центра агенты достигают некоторого равновесия).

Понятно, что АП является управлением только для активных систем – в пассивных системах он бессмысленнен и всегда будет являться пассивным прогнозом (см. второй раздел).

Рассмотрим систему с n агентами, каждому из которых центр сообщает информацию ui о неопределенном параметре, и это сообщение агент воспринимает как истинное значение. Однородной в [24] названа стратегия центра, заключающаяся в сообщении одинаковой информации ’ всем агентам. Определим три типа (каждый последующий включает предыдущие как частные случаи) передаваемой агентам информации:

1) центр сообщает точно, то есть стратегия однородна и ui =, i N = {1, 2,..., n};

2) центр использует только однородные стратегии, но ’( ) может отличаться от ;

3) центр может использовать произвольные (неоднородные) стратегии u = (u1, u2,..., un).

Обозначим yi Ai – действие i-го агента, Ai – множество его допустимых действий, y = (y1, y2,..., yn) A’ = Ai – вектор iN действий всех агентов. Функция полезности (функция выигрыша, целевая функция) i-го агента vi( ) зависит от действий всех агентов y A’ и неопределенного параметра.

После сообщения информации центром в рамках предположения П1 i-ый агент считает, что агенты имеют целевые функции fij(y) = vj(y, ui), j, i N. Поэтому, если каждый агент применяет равновесную по Нэшу (с точки зрения имеющейся у него инфор* мации) стратегию yi (ui), определяемую равновесным вектором y*(ui):

* * j N, yj Aj fij( y* (ui), y- j (ui)) fij(yj, y- j (ui)), j где y-j = (y1, y2,..., yj-1, yj+1,..., yn) A-j = Ai – обстановка игры i j для j-го агента, то в результате сложится следующая «равновесная» (в информационном смысле) ситуация:

* * * y*(u) = ( y1 (u1), y2 (u2),..., yn (un)), которая в [24] названа регулируемым равновесием. Так как в моделях управления многоэлементными организационными системами любое равновесие игры агентов зависит от стратегии центра (то есть является регулируемым равновесием), то для обозначения совокупности равновесных при заданной информированности игроков стратегий будем использовать термин «информационное равновесие».

В частном случае однородных (достоверных или недостоверных) сообщений центра ’ равновесная в информационном смысле * * * ситуация y*( ’) = ( y1 ( ’), y2 ( ’),..., yn ( ’)) будет равновесной и в «классическом» смысле, так как представления каждого агента о целевой функции любого другого агента будут совпадать с представлениями последнего о своей целевой функции.

Если целевая функция центра имеет вид (y, ), то задача управления будет заключаться в поиске такого вектора сообщений u*( ) агентам, который бы побуждал их придти в наиболее выгодное для центра равновесие (если множество R(u) равновесий содержит более одного элемента, то центр может рассчитывать на гарантированный результат): u*( ) = max min (y*(u), ).

un y* (u)R(u) В [24] сформулированная задача исследуется для частного вида целевых функций центра и агентов.

Обобщим рассмотренную концепцию регулируемого равновесия на случай модели принятия решений, используемой в настоящей работе. В ходе дальнейшего изложения будем различать субъективное описание игры (то есть, описание с точки зрения игрока (агента)) и объективное (то есть, описание с точки зрения центра, которому известно множество ). Если каждому из игроков известно множество, то есть Ii =, i N (иными слоi i вами, выполнено предположение П1 – см. предыдущий раздел), то субъективной гарантирующей стратегией i-го игрока будет (1) yiг (Ii) = arg max min min fi(yi, y-i, ), i N, yiAi i y-i A-i где y-i = (y1, y2, …, yi-1, yi+1, …, yn) A-i = Aj – обстановка игры j i для i-го игрока. Субъективный гарантированный выигрыш равен (2) fiг (Ii) = min fi( yiг (Ii), y-гi (I-i), ), i N, i а объективный гарантированный выигрыш равен fiг (I, I0) = min fi( yiг (Ii), y-гi (I-i), ), i N, где I = (I1, I2, …, In) – вектор информированностей игроков.

Аналогично можно записать субъективное равновесие Нэша y*(Ii) = ( y* (Ii ), y* (Ii ), …, y* (Ii ) ) A’ (устраняя неопределен1 2 n ность относительно состояния природы вычислением гарантированного по результата):

* * (3) i N, yi Ai min fi( y*, y-i, ) min fi(yi, y-i, ).

i i i Субъективный гарантированный выигрыш при этом равен * (4) fi* (Ii) = min fi( y* (Ii), y-i (Ii), ), i N, i i а объективный гарантированный выигрыш равен fi* (I, I0) = min fi( y* (Ii), y*i (I-i), ), i N.

i Изменяя информацию I, центр может изменять выбираемые агентами равновесные стратегии (1) и/или (3), совокупность которых обозначим R(I), что и составляет суть информационного управления.

Пусть теперь, помимо информации о множестве возможi ных значений неопределенного параметра, каждый агент имеет представления (термин «представления», быть может, является не совсем удачным, так как используется в психологии несколько в другом смысле, однако достаточно точно отражает суть понятия информированности агентов друг о друге (см. также модели многоагентных систем [70, 98, 120])) об информированности других агентов20. Так, агент i может предполагать, что информированность j-го агента есть (иными словами, выполнено предпоij ложение П2 – см. предыдущий раздел). Моделируя поведение других игроков, каждый агент вычисляет информационное равновесие R(Ii) на основании имеющейся у него информации. В этом случае Ii = (,, …,,,, …, ), i N. Запишем по i1 i2 i,i-1 i i,i+1 in Как отмечалось в предыдущем разделе, обобщением данной модели является модель, в которой каждый агент имеет определенные представления о представлениях о нем других агентов и т.д. – см. предположения Пm, m > 2, выше. Увеличение глубины рефлексии и исследование соответствующих моделей коллективного поведения субъектов с рефлексией и управления ими представляется перспективным направлением будущих исследований (см. также примеры в девятом разделе настоящей работы).

аналогии с (1)-(4) для рассматриваемого случая субъективные максиминное равновесие и равновесие Нэша:

г (5) yij (Ii) = arg max min min fj(yj, y-j, ), i, j N, j i, yjAj ij y- j A- j г (6) yiг (Ii) = yii (Ii) = г г г = arg max min fi( yi1 (Ii), yi2 (Ii),…, yi,…, yin (Ii), ), i N, yi Ai i г (7) fiг (Ii) = min fi( yiг (Ii), yi,-i (Ii), ), i N, i * * (8) i, j N, j i, yj Aj min fj( y*, yi,- j, ) min fj(yj, yi,- j, ), ij ij ij * * (9) yi (Ii) = yii (Ii) = * * * = arg max min fi( yi1 (Ii), yi2 (Ii),…, yi,…, yin (Ii), ), i N, yi Ai i * * (10) fi* (Ii) = min fi( yii, yi,-i, ), i N.

i Если i, j N =, то П2 переходит в П1. При этом выраij j жения (5)-(10) переходят в соответствующие выражения (1)-(4).

Задача информационного управления в общем виде может быть записана как:

min min (y, ) max, 0 yR(I ) I где I – информационное управление (вектор сообщаемой центром агентам информации), () – функция полезности центра (его целевой функцией является f0(I) = min min (y, ) – см. разде 0 yR(I ) лы 2 и 3), R(I) – информационное равновесие (множество равновесных по Нэшу при данном информационном управлении стратегий агентов), – известное центру множество возможных значений неопределенных параметров.

В рамках рассматриваемой модели информационное управление со стороны центра (его сообщения агентам) может затрагивать:

- множества – информационное регулирование;

i - множества – рефлексивное управление;

ij - равновесные состояния системы R(I), или в общем случае некоторые параметры Q, зависящие от равновесных состояний системы и состояния природы – активный прогноз.

Примеры выделенных типов информационного управления рассматриваются в девятом разделе.

6. ЗАДАЧА АКТИВНОГО ПРОГНОЗИРОВАНИЯ Если в задачах информационного регулирования и рефлексивного управления центр сообщает агенту некий "факт" (информацию о некотором параметре, представлениях других агентов или их действиях), то в задаче активного прогнозирования сообщается прогноз q Aq (или Q Aq)– например, равновесный результат деятельности агентов. Центр как бы сообщает агенту: если ты будешь действовать наилучшим для себя образом, то результат будет таким, как я прогнозирую (в этом смысле прогнозом, сообщаемым агенту, может быть и его (агента) собственное действие, что при сообщении факта не может иметь место). Далее агент на основании информации о будущих значениях векторов yг или y* может «восстанавливать» информацию { } о состоянии i природы и использовать ее при вычислении равновесных стратегий (в частности, собственной стратегии).

Перейдем к формальному определению понятий информационного регулирования и активного прогноза, считая, что центр использует однородную стратегию, то есть всем агентам сообщается один и тот же прогноз Q Aq (множество возможных значений параметра q), или одно и то же множество возможных значений состояния природы.

Обозначим EN( ) A’ – множество равновесий Нэша игры агентов при состоянии природы (при определении равновесия Нэша – см. предыдущий раздел – считается, что каждый агент стремится максимизировать гарантированное (по ) значение своей целевой функции). Далее, обозначим: EN( ) = EN ( ) – множество векторов действий агентов, которые могут быть равновесными по Нэшу при, A0( ) = {z A0 | z = w(y, ), 0 y EN( ), } – множество равновесных результатов деятельности, которые могут реализоваться при.

Тогда задача информационного регулирования в рамках принципа доверия может быть записана в следующем виде (см.

рисунок 5):

(1) min (z) max.

zA0(0 ) A’ AEN( ) A0( ) Рис. 5. Структура задачи информационного регулирования Таким образом, в рамках информационного регулирования центр определяет какие действия и результаты деятельности могут оказаться равновесными при тех или иных значениях состояния природы, а затем выбирает сообщение, максимизирующее гарантированное значение своего критерия эффективности – см. (1).

В задаче активного прогнозирования ситуация более сложная.

При получении от центра прогноза Q Aq множества возможных значений некоторого параметра (например, подмножества множества возможных результатов деятельности – при этом q = z, F( ) = w( ), Aq = A0) – каждый агент вычисляет пару множеств – множество равновесных по Нэшу действий A’(Q) = {y A’ | F(y, ) Q, y EN( ), (Q)}, приводящих к реализации сообщенных значений q, и соответствующее ему множество возможных значений состояния природы: (Q) = { | F(y, ) Q, y EN( )}.

Во введенных обозначениях дальнейший ход мыслей агента описывается следующим образом (см. рисунок 6): он вычисляет множество значений неопределенного параметра (Q), при которых равновесными являются действия из множества A’(Q), а затем использует это множество (Q) для определения своей равновесной стратегии, то есть "проходит" сначала от Q к (см. рисунок 6), а затем (как в задаче информационного регулирования – см.

рисунок 5) – от к результатам деятельности, на множестве A0( (Q)) которых определена его функция полезности.

Таким образом, задача активного прогнозирования может быть записана в следующем виде (см. рисунок 6):

(2) min (z) max.

zA0 ((Q)) Q Aq A’ Aq A’(Q) (Q) Q Рис. 6. Структура задачи активного прогнозирования Из сравнений задач (1) и (2) видно, что при Aq = A0 эффективность информационного регулирования не ниже эффективности активного прогноза. Равенство достигается, в частности, когда A0( ) и (q) – однозначные отображения (см. примеры в девятом разделе). При этом z A0, A0( (z)) z, (A0( )). В то же время, активный прогноз является более «мягким» и опосредованным воздействием на управляемую систему, нежели чем информационное регулирование, так как последнее требует значительно большей информированности центра (см.

примеры в девятом разделе).

Если центр использует неоднородную стратегию, то он сообщает разным агентам, вообще говоря, различный прогноз21. При этом в качестве сообщения может выступать вектор Q = {Q1, n Q2, …, Qn} Aq, то есть i-му агенту сообщается прогноз Qi, i N.

Тогда каждый из агентов вычисляет свое множество возможных значений неопределенного параметра (Qi) и вырабатывает исходя из него свою стратегию (ср. с предположением П1 в разделе 4).

Понятно, что в этом случае по крайней мере один агент обманется в своих ожиданиях, то есть для него прогноз окажется неточным – см.

следующий раздел.

Возможно, вообще говоря, активное прогнозирование более сложной структуры: сообщение i-му агенту прогноза, а также представления других агентов (ср. с предположением П2 в разделе 4) – набора множеств {Qij}. В этом случае i-й агент поступает следующим образом. Он вычисляет за каждого из остальных агентов множества = (Qij), j i, и на основании этих множеств ij определяет предполагаемые действия yij, j i. Далее, вычисляя «свое» множество = (Qii) и подставляя в свою целевую функi цию действия других агентов, i-й агент определяет свое действие yi (см. формулы (5), (6) или (8), (9) раздела 5).

Pages:     | 1 |   ...   | 4 | 5 || 7 | 8 |   ...   | 12 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.