WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 11 | 12 || 14 | 15 |   ...   | 26 |

Для начала сделаем следующее предположение: структура информированности является конечной регулярной (см. раздел 3.5). Напомним, что для конечной регулярной структуры можно последовательно найти все равновесные действия ральных и фантомных агентов, двигаясь от висячих вершин РКД к корню.

Обозначим множество параметрических (параметр – вектор = (1, 2, …, n) n) равновесий Нэша (1) EN() = {{xi}i N X’ | i N, yi Xi, fi(i, x1, …, xn) fi(i, x1, …, xi-1, yi, xi+1, …, xn)}.

Предположим, что на нижнем уровне {ij}j N конечной регулярной структуры информированности имеет место субъективное общее знание фантомных агентов. Тогда с точки зрения i-агента возможными являются равновесия их игры из множества EN({ij}j N). Введем множество наилучших ответов i-го агента на выбор оппонентами действий из множества X-i при множестве возможных состояний природы:

(2) BRi(, X-i) = Arg max fi (, xi, x-i ), i N, xiXi x-iX-i, а также следующие величины и множества (3) EN = EN ( ), n (4) Xi0 = Proji EN, i N, k k (5) X = X, i N, k = 0, 1, 2, …, -i j j i где k -(6) Xik = BRi(, X ), k = 1, 2, …, i N.

-i Отображение BRi(,): X-i Xi называется рефлексивным отображением i-го агента, i N [81].

Утверждение 17. Для любых k = 0, 1, … и i N имеет место k соотношение X Xik +1, то есть с ростом ранга рефлексии i-го i агента множества (6) его возможных наилучших ответов не сужаются.

(Напомним (см. раздел 2.1), что рангом рефлексии i-го агента является глубина дерева Ii.) Доказательство проведем индукцией по k.

1) Пусть k = 0. Тогда для любого i N справедливы импликации xi Xi0 x-i X xi BRi(, x-i) xi Xi1.

-i 2) Пусть вложение множеств имеет место для всех i N при k = m - 1, т. е. справедливо соотношение Xim-1 Xim.

Тогда выполняется и m-1 m X X, -i -i а также m-1 m xi Xim xi BRi(, X ) xi BRi(, X ) xi Xim+1. • -i -i Исследование свойств рефлексивных отображений оказываются существенными при рассмотрении задачи о максимальном целесообразном ранге рефлексии, в рамках которой для каждого реального агента требуется определить минимальный ранг рефлексии, при котором множество его равновесных действий охватывает все многообразие своих равновесных действий в рефлексивной игре (при различных вариантах структуры информированности).

Данная задача является математической формулировкой вопроса о том, насколько сложную структуру информированности требуется сформировать управляющему органу – центру – при осуществлении информационного управления.

Рефлексивное отображение i-го агента называется стационарk +ным, если Xik = X, k = 0, 1, ….

i Утверждение 18. Если рефлексивные отображения всех агентов стационарны, то множество действий i-го агента, которые могут быть реализованы как компоненты информационного равновесия, реализуется в рамках структуры информированности глубины не более двух и составляет Xi0, i N. При этом ранг рефлексии каждого агента равен единице, а множество равновесных действий реальных агентов составляет E = Xi0.

iN Доказательство. Поскольку рефлексивные отображения стационарны, все равновесные (при любых структурах информированности) действия i-го агента содержатся в множестве Xi0. Покажем, что набор равновесных действий реальных агентов E = Xi0 достигается в рамках структуры информированности iN глубины не более 2.

Возьмем произвольный набор действий x = (x1, …, xn) E = Xi0 и зафиксируем i N. Из того, что xi Xi0, следует, что iN существуют наборы (i1, …, i,i-1, i, i,i+1, …, in) n и xi,-i X-i такие, что (xi1, …, xi,i-1, xi, xi,i+1, …, xin) EN(i1, …, i,i-1, i, i,i+1, …, in).

Для любого положим ij = ij, тогда структура Ii имеет единичную глубину, т. е. субъективно (с точки зрения i-го агента) имеет место общее знание о наборе (1, …, n).

Формируя для каждого i N свою структуру Ii единичной глубины (т. е. «свое» i-субъективное общее знание), можно реализовать весь набор x = (x1, …, xn). При этом структура информированности игры I имеет глубину не более двух. Заметим, что единичная глубина имеет место при x EN, т. е. когда набор (1, …, n) является общим знанием среди всех агентов. • Таким образом, если рефлексивные отображения стационарны, то при осуществлении информационного управления увеличение ранга рефлексии свыше первого не приводит к появлению новых информационных равновесий.

В общем случае возможны три варианта:

1) если рефлексивные отображения стационарны, то множество субъективных равновесий есть X’, то есть является Xi iN подмножеством (быть может, собственным – см. далее пример 1) множества X’ допустимых действий агентов;

2) если рефлексивные отображения не стационарны, то множество субъективных равновесий может совпадать с множеством X’ допустимых действий агентов – см. пример 2;

3) если рефлексивные отображения не стационарны, то множество субъективных равновесий может быть строго шире Xi0, iN но не совпадать (быть уже) с множеством X’ допустимых действий агентов – см. пример 3.

В приводимых далее примерах 1–3 фигурируют два агента.

Пример 1. Пусть fi(, x1, x2) = xi – xi2 / 2 ( + xj), где (0; 1), j =3 – i, i = 1, 2, = [0; 1]. Тогда BRi(i, xj) = i + xj, j =3 – i, i = 1, 2.

Вычислим равновесие Нэша: xi* (i, j) = (i + j) / (1 – 2), j =3 – i, i = 1, 2. Определим Xi0 = [0; 1 / (1 – )], i = 1, 2. Легко проверить, что рефлексивное отображение в рассматриваемом примере является стационарным, то есть Xik = Xi0, k = 1, 2, …, i = 1, 2 – см. рис. 33.

xBR1(1, x2) BR1(0, x2) BR2(1, x1) k EN X BR2(0, x1) xk XРис. 33. Множество субъективных равновесий в примере Изменяя i и j, т.е. осуществляя информационное регулирование, центр может реализовать как субъективное равновесие любую точку из множества [0; 1 / (1 – )]2. • В общем случае (при нестационарных рефлексивных отображениях) с увеличением глубины структуры информированности множество субъективных равновесий не сужается, поэтому из анализа теоретико-игровой модели нельзя априори ограничить максимальный целесообразный ранг рефлексии агентов. Приведем пример.

Пример 2. Пусть f1(, x1, x2) = (1 – x2) x1 – x1 /2, f2(, x1, x2) = x1 x2 – x2 /2, где = [1/2 ;1], X1 = X2 = (0 ;1). Тогда BR1(, x2) = (1 – x2), BR2(, x1) = x1.

Легко проверить, что множеством EN является четырехугольник с вершинами (2/5,1/5), (2/3,1/3), (1/2,1/2) и (1/3,1/3), поэтому 0 X1 = [1/3 ;2/3], X2 = [1/5 ;1/2] (см. рис. 34).

xBR1(1/2, x2) EN X BR1(1, x2) X1 xXРис. 34. Множество субъективных равновесий в примере Обозначим левую и правую границы отрезка Xik за i,k и i,k соответственно, i = 1, 2. Тогда имеем следующие соотношения:

1,0 = 1/3, 1,0 = 2/3, 2,0 = 1/5, 2,0 = 1/2;

2,k+1 = 1,k, 2,k+1 = 1,k, 1,k+1 = (1 – 2,k), 1,k+1 = 1 – 2,k, где k = 0, 1, …. Из последних соотношений нетрудно вывести следующие:

i,k+4 = i,k, i,k+4 = + i,k, i = 1, 2, k = 0, 1, ….

Таким образом, i,k 0, i,k 1 при k, где i = 1, 2. Поэтому Xik = (0;1) = Xi, i = 1, 2. Это означает, что, надлежащим k образом увеличив глубину рефлексии агента, можно добиться любого его допустимого действия. • Примеры 1 и 2 показывают, что множество субъективно равновесных действий i-го агента (при всевозможных его структурах информированности) Xik может как совпадать с Xi0, то есть k быть достаточно узким, так и совпадать с Xi, то есть быть максимально широким. Убедимся, что возможны и «промежуточные» варианты, то есть ситуации, в которых множество субъективных равновесий строго шире исходного множества EN равновесий Нэша, но строго уже множества допустимых действий.

Пример 3. Пусть целевые функции агентов и множество такие же, как и в предыдущем примере. Изменим лишь множества допустимых действий: X1 = X2 = (–c ; 1 + c), c > 0. Тогда попрежнему Xik = (0;1), i = 1, 2, но теперь (0;1) Xi. • k В заключение настоящего раздела отметим, что, по-видимому, существует определенная аналогия между рефлексивными играми и информационными расширениями игр [20, 47, 48], в том числе – метаиграми Н. Ховарда [172, 173]. В информационных расширениях игр предполагается, что существует упорядочение агентов, в рамках которого агент, принимающий решение о выбираемом действии, может рассчитывать на знание действий агентов, которые производят свой выбор раньше (в заданном упорядочении) него. Такие игры – с фиксированной последовательностью ходов – называются иерархическими играми [27, 29, 30, 44, 48]. В рамках этой модели доказано [48], что любой вектор действий, обеспечивающий агентам выигрыши не меньше соответствующих максиминов в исходной игре, может быть реализован как равновесие в некотором информационном расширении исходной игры. Для рефлексивных игр с регулярными структурами информированности это, вообще говоря, не так – пример 1 показывает, что для некоторых случаев множество информационных равновесий остается достаточно узким. В то же время, «иерархичность» и «рефлексивность» игр не противоречат друг другу – например, иерархическая игра может быть рефлексивной. Синтез результатов исследования метаигр и рефлексивных игр представляется перспективной задачей будущих исследований.

5.3. СТАЦИОНАРНОСТЬ ЛИНЕЙНЫХ РЕФЛЕКСИВНЫХ ОТОБРАЖЕНИЙ В настоящем разделе рассмотрен случай взаимодействия двух агентов, имеющих квадратичные по своему действию целевые функции. Для этого случая будут сформулированы достаточные условия стационарности рефлексивных отображений, что, согласно утверждению 18, позволяет при решении задачи информационного управления ограничиться вторым рангом рефлексии агентов [40].

Пусть целевые функции агентов являются многочленами второй степени по действиям этих агентов:

(1) fi (, x1, x2 ) = i( )xi2 +i( )xix +i( )xi + i (, x ), j j j = 3 – i, i = 1, 2, причем функции i, i, и i непрерывны. При этом (2) = [, ] 1, (3) xi Xi = [Li, Ri] 1, i = 1, 2.

Потребуем также, чтобы для любых 1,2 выполнялись следующие условия:

(4) i(i)< 0, i (i ) ( ) - 2 ( )i (i ) j j j j (5) Li Ri, i = 1, 2, 4i (i ) ( ) -i (i ) ( ) j j j j 1(1) 2(2) (6) 0 < <1.

21(1) 22(2) Утверждение 19. Рефлексивное отображение игры (1)–(3) при выполнении условий (4)–(6) является стационарным.

Доказательство. В случае структуры информированности единичной глубины, т. е. когда 1 и 2 являются общим знанием, равновесием является пара (x1, x2), являющаяся решением системы уравнений 2(2)x1 +2(2) (7) x2 = BR2(2, x1) = -, 22(2) 1(1)x2 + 1(1) (8) x1 = BR1(1, x2) = - 21(1) (в силу условия (4) у каждой целевой функции максимум достигается в одной точке).

Как нетрудно убедиться, единственным решением этой системы является следующее:

i (i ) ( ) - 2 ( )i (i ) j j j j (9) xi =, j = 3 – i, i = 1, 2.

4i (i ) ( ) -i (i ) ( ) j j j j С учетом условия (5) компоненты решения (9) принадлежат соответствующим допустимым множествам действий агентов.

Таким образом, множества всевозможных равновесных действий (при различных значениях 1 и 2) описываются соотношениями i (i ) ( ) - 2 ( )i (i ) j j j j (10) Xi0(i, ) =, j = 3 – i, i = 1, 2.

j 4i (i ) ( ) -i (i ) ( ) j j j j Отметим, что в силу условий (1)–(3) множества Xi0 являются отрезками.

Подставляя (10) в (7), (8), получаем следующие соотношения для описания множеств Xi :

i(i1) i(i1) 1 (11) Xi (i,,i1)= j j j j j 2i(i1)X (i, )- 2i(i1), i,,.

Далее, подставляя (11) в (7), (8), получаем выражение для преобразования множества Xi0 в Xi2 :

i(i2) i(i2) 1 (12) Xi2(i,,,i2)= j j j 2i(i2)X - 2i(i2)= (1) (1) i(i2) i(i2) j j 0 j j = i 2i(i2)- 2 (1)X - 2 (1) - 2i(i2)= j j j j (1) (1) i(i2) (i2) j j 0 1 j j i = )1i j j 2i(i2)2 (1)X (i, )+ Xi0(i2, 2i(i2)2 (1), j j j j i,,,i2.

j j Множества Xik являются отрезками 1 и, следовательно, выпуклы. С учетом условия (6), преобразование (12) отображает множества Xi0 в себя. Поэтому Xi2 = Xi0, и рефлексивные отображения являются стационарными. • 5.4. РЕФЛЕКСИВНАЯ НЕМАНИПУЛИРУЕМОСТЬ МЕХАНИЗМОВ ПЛАНИРОВАНИЯ Механизмы планирования. На сегодняшний день известно [11], что манипулируемость процедур принятия решений может быть обусловлена либо стратегическим манипулированием со стороны агентов (искажением ими своих сообщаемых предпочтений [3, 17, 45, 63, 94]), либо манипулированием алгоритмом обработки мнений агентов (так называемая теория агенды [50]).

В механизмах планирования [17, 94] (принятия центром решений на основании сообщаемой агентами информации) считается, что предпочтения агентов являются для них общим знанием (см. раздел 1.3) т.е. предпочтения каждого агента известны всем агентам, всем агентам это известно и т.д. до бесконечности. При этом механизм называется неманипулируемым, если каждому агенту, каковы бы ни были его предпочтения, при любой обстановке игры (любых предпочтениях оппонентов) выгодно сообщение достоверной информации о своих предпочтениях.

В настоящем разделе мы обсудим возможность ослабления требования неманипулируемости при условии, что центр имеет возможность осуществлять информационное управление, т.е.

формировать у агентов ту или иную систему представлений о типах оппонентов, об их представлениях и т.д.

Рассмотрим организационную систему, состоящую из управляющего органа – центра – и n управляемых субъектов – агентов.

Стратегией i-го агента является сообщение центру некоторой информации si Si, i N = {1, 2, …, n} – множеству агентов. Центр на основании сообщенной ему информации назначает агентам планы xi = hi(s) Xi 1, где h : S X – процедура (механизм) планирования, hi: S Xi, i N, s = (s1, s2, …, sn) S = – S i iN вектор сообщений всех агентов, x = (x1, x2, …, xn) X = – X i iN вектор планов.

Функция предпочтения (целевая функция) агента, отражающая интересы агента в задачах планирования: fi(xi, ri): Xi 1 1, зависит от соответствующей компоненты назначенного центром плана и параметра ri 1 – типа агента.

Как правило, при исследовании механизмов планирования, то есть в организационных системах с сообщением информации, вводится предположение, что функции предпочтения агентов однопиковые [71] с точками пика {ri}i N, то есть функция fi(xi, ri) непрерывна, строго монотонно возрастает по xi до единственной точки максимума ri и строго монотонно убывает после нее, i N.

Это предположение означает, что предпочтения агента на множестве допустимых планов таковы, что существует единственное наилучшее для него значение плана – точка пика, степень же предпочтительности остальных планов монотонно убывает по мере удаления от точки пика. Поэтому под типом агента будем понимать точку максимума (идеальную точку, точку пика) его функции предпочтения, то есть наиболее выгодное с его точки зрения значение плана.

Pages:     | 1 |   ...   | 11 | 12 || 14 | 15 |   ...   | 26 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.