WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 6 | 7 || 9 | 10 |   ...   | 26 |

Рассмотрим несколько усложненную версию предыдущего сюжета.

Пример 3 («Шпионские страсти-2»). Ситуация похожа на описанную в примере 2, различие в том, что агент на самом деле работает на государство А, а государству В передает лишь соответствующим образом обработанные сведения. Граф рефлексивной игры для этой, более сложной, ситуации изображен на рис. 20.

3 23 2 1 21 1 2 12 Рис. 20. Граф рефлексивной игры в сюжете «Шпионские страсти-2» Вершинам графа соответствуют следующие реальные и фантомные агенты: 1 – государство А; 2 – государство В; 3 – агент;

21 – государство А, которое ошибочно полагает, что агент – его чиновник, не входивший ни в какие контакты с В; 23 – агент, работающий в пользу государства В; 212 – государство В, которое тающий в пользу государства В; 212 – государство В, которое не входило ни в какие контакты с агентом – чиновником государства А; 213 – агент – чиновник, верный государству А и не входивший ни в какие контакты с государством В.

Отметим, что во всех рассмотренных выше примерах ранг рефлексии (который на единицу меньше длины максимальной последовательности индексов) не превышает двух. Более высокие ранги рефлексии в художественных произведениях встречаются чрезвычайно редко, однако их можно найти, о чем свидетельствует следующий пример.

Пример 4. В фильме «Император и убийца» (1999, режиссер – Чен Кайге) описывается ситуация, основными участниками которой являются два человека – китайский император и убийца.

Убийцу посылают к императору под видом посла соседнего государства. Император, между тем, осведомлен о том, что посол на самом деле является убийцей. Однако убийца знает о том, что император знает, что он собирается убить его.

Граф рефлексивной игры для этой ситуации изображен на рисунке 21.

121 2 1 12 121 2 1 Рис. 21. Граф рефлексивной игры в фильме «Император и убийца» Вершинам графа соответствуют следующие реальные и фантомные агенты: 1 – император; 2 – убийца; 12 – убийца, который считает императора неосведомленным; 121 – император, который считает пришедшего к нему человека послом соседнего государства; 1212 – посол соседнего государства.

Роль жены императора в интриге фильма читатель может увидеть из графа рефлексивной игры, приведенного на рисунке 22, в котором она обозначена номером 3.

3 13 121 2 1 2 1 12 121 Рис. 22. Роль жены императора в фильме «Император и убийца» Отметим, что в последнее время наличие нескольких рефлексивных (виртуальных, быть может, вложенных друг в друга) реальностей лежит в основе сюжетов многих художественных фильмов – «Матрица», «Авалон», «Шоу Трумэна» и др.

Наконец, заключительный пример – несколько иного жанра.

Пример 5. Приведем полностью текст эпиграммы «О поцелуе» (см.: С.Я. Маршак. Избранное. – М.: Художественная литература, 1964 (раздел «Из английских эпиграмм»)): «– Он целовал вас, кажется / – Боюсь, что это так. / – Но как же вы позволили / – Ах, он такой чудак! / Он думал, что уснула я / И все во сне стерплю, / Иль думал, что я думала, / Что думал он: я сплю!» 2A 2B 2 2A1 2B12 Рис. 23. Структура информированности барышни в эпиграмме «О поцелуе» На рис. 23 изображена структура информированности барышни, которую поцеловал кавалер (оставшийся в эпиграмме за кадром). Вершинам графа соответствуют следующие реальные и фантомные агенты: 1 – барышня (поскольку она не уверена, какая из двух возможностей имела место, к данной вершине направлены две стрелки); 2А – кавалер, считающий барышню спящей; 2В – кавалер, считающий, что барышня думает, что он считает ее спящей; 2А1 – спящая барышня (поскольку она спит и не рефлексирует, то стрелка, направленная к данной вершине, отсутствует); 2В– барышня, которая думает, что кавалер считает ее спящей.

Таким образом, язык графов рефлексивной игры является удобным средством единообразного описания эффектов информационной рефлексии в художественных произведениях.

ГЛАВА 3. ИНФОРМАЦИОННЫЕ РАВНОВЕСИЯ В данной главе исследуются специфические типы информационных равновесий. В разделе 3.1 рассматривается свойство стабильности равновесия, состоящее в том, что каждый агент наблюдает именно тот результат игры, который ожидает в момент выбора действия. Тем самым, информационная структура игры не меняется.

В разделе 3.2 стабильные информационные равновесия подразделяются на истинные и ложные. Формулируется достаточное условие, при выполнении которого все стабильные равновесия являются истинными (утверждение 12).

В разделе 3.3 рассматривается случай, когда агенты в результате игры наблюдают действия друг друга. Доказывается ряд утверждений, проясняющих взаимосвязь стабильности равновесия и свойств структуры информированности игры.

В разделе 3.4 проводится аналогия между рефлексивными играми и байесовыми играми – альтернативным способом моделирования принятия решения в ситуации с неполной информированностью. Доказывается теорема, в определенном смысле математически обосновывающая необходимость ограничения ранга рефлексии агента.

В контексте описанной в разделе 1.4 модели информационного управления материал данной главы охватывает цепь «действие наблюдаемый результат информированность» (рис. 24).

Управляющий орган (центр) Управляющее воздействие Реальный результат ИНФОРМИ- НАБЛЮДАЕМЫЙ РОВАННОСТЬ РЕЗУЛЬТАТ ДЕЙСТВИЕ Агент(ы) Рис. 24. Предмет исследования в главе 3.1. СТАБИЛЬНЫЕ ИНФОРМАЦИОННЫЕ РАВНОВЕСИЯ Одной из особенностей «классического» равновесия Нэша является его самоподдерживающийся характер – если игра повторяется несколько раз и все игроки, кроме i-го, выбирают одни и те же равновесные действия, то и i-му нет резона отклоняться от своего равновесного действия. Это обстоятельство очевидным образом связано с тем, что представления всех игроков о реальности адекватны – значение состояния природы является общим знанием.

В случае информационного равновесия ситуация, вообще говоря, может быть иной. Действительно, в результате однократного разыгрывания игры может оказаться, что какие-то из игроков (или даже все) наблюдают не тот результат, на который они рассчитывали. Это может быть связано как с неверным представлением о состоянии природы, так и с неадекватной информированностью о представлениях оппонентов. В любом случае, самоподдерживающийся характер равновесия нарушается – если игра повторяется, действия игроков могут измениться.

Однако в некоторых случаях самоподдерживающийся характер равновесия может иметь место и при различных (и, вообще говоря, неверных) представлениях агентов. Говоря неформально, это происходит тогда, когда каждый агент (как реальный, так и фантомный) наблюдает тот результат игры, которого ожидает. Для формального изложения нам понадобится дополнить описание рефлексивной игры.

Напомним, что рефлексивная игра задается кортежем {N, (Xi)i N, fi()i N,, I}, где N = {1, 2, …, n} – множество участников игры (игроков, агентов), Xi – множество допустимых действий i-го агента, fi(): X’ 1 – его целевая функция, i N, I – структура информированности. Дополним эту конструкцию набором функций wi(): X’ Wi, i N, каждая из которых отображает вектор (, x) в элемент wi некоторого множества Wi. Этот элемент wi и есть то, что i-й агент наблюдает в результате разыгрывания игры.

Функцию wi() будем называть функцией наблюдения i-го агента [138]. Будем считать, что функции наблюдения являются общим знанием среди агентов.

Если wi(, x) = (, x), т. е. Wi = X’, то i-й агент наблюдает как состояние природы, так и действия всех агентов. Если, напротив, множество Wi состоит из одного элемента, то i-й агент ничего не наблюдает.

Пусть в рефлексивной игре существует информационное равновесие x, + (напомним, что – произвольная непустая конечная последовательность индексов из N). Зафиксируем i N и рассмотрим i-го агента. Он ожидает в результате игры пронаблюдать величину (1) wi (i, xi1, …, xi,i-1, xi, xi,i+1, …, xin).

На самом же деле он наблюдает величину (2) wi (, x1, …, xi-1, xi, xi+1, …, xn).

Поэтому требование стабильности для i-агента означает совпадение величин (1) и (2) (напомним, что эти величины являются элементами некоторого множества Wi).

Пусть величины (1) и (2) равны, т. е. i-агент и после разыгрывания игры не сомневается в истинности своих представлений.

Однако является ли это достаточным основанием для того, чтобы он и в следующий раз выбрал то же действие xi Ясно, что ответ отрицательный, что продемонстрируем на следующем примере.

Пример 1. Пусть в рефлексивной биматричной игре, где = {1, 2}, выигрыши заданы биматрицами (агент 1 выбирает строку, агент 2 – столбец, то есть X1 = X2 = {1; 2}), приведенными на рис. 25, = 1 = (1,1) (0,0) (0,1) (1,2) (0,1) (2,0) (1,1) (2,2) Рис. 25. Матрицы выигрышей в примере а граф рефлексивной игры имеет вид, изображенный на рис. 26.

1 1 Рис. 26. Граф рефлексивной игры в примере Пусть при этом = 1 =1, 2 = 21 = 2, и каждый агент наблюдает свой выигрыш (т.е. функция наблюдения агента совпадает с его функцией выигрыша). Ясно, что информационным равновесием является набор x1 = x2 = x21 = 2, т. е. первый и второй агенты, а также 21-агент и все прочие фантомные агенты выбирают вторые действия. Однако реальное состояние природы = 1 становится известным второму агенту после розыгрыша игры (и получения им выигрыша 0 вместо ожидаемого 2). Поэтому в следующий раз второй агент выберет действие x2 = 1, что побуждает и первого агента изменить свое действие (выбрать x1 = 1). • Таким образом, для стабильности равновесия необходимо чтобы и ij-агент, i, j N, наблюдал «нужную» величину. Он ожидает в результате игры пронаблюдать (3) wj (ij, xij1, …, xij,j-1, xij, xij,j+1, …, xijn).

На самом же деле (т. е. i-субъективно, ведь ij-агент существует в сознании i-агента) он наблюдает величину (4) wj (i, xi1, …, xi,j-1, xij, xi,j+1, …, xin).

Поэтому требование стабильности для ij-агента означает совпадение величин (3) и (4).

В общем случае, т. е. для i-агента, i +, условие стабильности определим следующим образом.

Определение. Информационное равновесие xi, i +, будем называть стабильным при заданной структуре информированности I, если для любого i + выполняется (5) wi (i, xi1, …, xi,i-1, xi, xi,i+1, …, xin) = = wi (, x1, …, x,i-1, xi, x,i+1, …, xn).

Информационное равновесие, не являющееся стабильным, будем называть нестабильным. В частности, информационное равновесие в примере 1 является нестабильным.

Утверждение 9. Пусть структура информированности I имеет сложность и существует информационное равновесие xi, i +.

Тогда система соотношений (5) содержит не более чем попарно различных условий.

Доказательство. Рассмотрим две любые тождественные [81] структуры информированности: Ii = Iµi. Поскольку xi – равновесие, имеем i =µi, xi =xµi, Iij =Iµij, xij =xµij для любого j N. Поэтому условия стабильности (5) для i- и µi-агентов тождественно совпадают. Так как имеется попарно различных структур информированности, количество попарно различных условий (5) не превышает. • 3.2. ИСТИННЫЕ И ЛОЖНЫЕ РАВНОВЕСИЯ Стабильные информационные равновесия будем разделять на два класса – истинные и ложные равновесия. Определение предварим примером.

Пример 2. Рассмотрим игру, в которой участвуют три агента с целевыми функциями xi (x1 + x2 + x3) fi (ri, x1, x2, x3) = xi -, ri где xi 0, i N = {1, 2, 3}. Целевые функции являются общим знанием с точностью до типов агентов – параметров ri > 0. Вектор r = (r1, r2, r3) типов агентов может интерпретироваться как состояние природы. При этом здесь и далее подразумевается, что свой собственный тип известен каждому агенту достоверно.

Граф рефлексивной игры имеет вид, изображенный на рисунке 27, при этом r2 = r3 = r, r21 = r23 = r31 = r32 =c. Общим знанием является следующее: каждый игрок знает свой тип и наблюдает сумму действий оппонентов.

21 2 Рис. 27. Граф рефлексивной игры в примере Нетрудно вычислить единственное информационное равновесие этой игры:

(1) x2 = x3 = (3r – 2с) / 4, x21 = x23 = x31 = x32 = (2c – r) / 4, x1 = (2r1 – 3r + 2с) / 4.

Условия стабильности (см. выражение (5) предыдущего раздела) в данном случае выглядят следующим образом:

(2) x21 + x23 = x1 + x3, x31 + x32 = x1 + x2.

Записаны условия для 2- и 3-агентов, поскольку для 1-, 21-, 23-, 31-, 32-агентов они тривиальны.

Подставляя (1) в (2), получаем, что необходимым и достаточным условием стабильности является равенство (3) 2с = r1 + r.

Пусть условие (3) выполнено. Тогда равновесные действия реальных агентов таковы:

(4) x2 = x3 = (3r – r1) / 4, x1 = (3r1 – 2r ) / 4.

Предположим теперь, что типы агентов стали общим знанием (см. рис. 28).

2 Рис. 28. Общее знание в примере Нетрудно убедиться, что в случае общего знания единственным равновесием будет (4). • Таким образом, при выполнении условия (3) имеет место несколько парадоксальная ситуация. Представления второго и третьего агентов не соответствуют действительности (рис. 27), однако их равновесные действия (4) в точности такие, как были бы в случае одинаковой информированности (рис. 28). Назовем такое стабильное информационное равновесие истинным.

Определение. Пусть набор действий xi, i +, является стабильным информационным равновесием. Будем называть его истинным равновесием, если набор (x1, …, xn) является равновесием в условиях общего знания о состоянии природы (или о наборе (r1, …, rn) типов агентов).

Из определения, в частности, следует, что в условиях общего знания любое информационное равновесие является истинным.

Рассмотрим еще один случай, когда этот факт имеет место.

Утверждение 12. Пусть целевые функции агентов имеют вид fi (ri, x1, …, xn) = i (ri, xi, yi(x-i)), а функции наблюдения – вид wi(, x) = yi(x-i), i N. Содержательно это означает следующее: выигрыш каждого агента зависит от его типа, его действия и функции наблюдения, зависящей от действий остальных агентов (но не от их типов).

Тогда любое стабильное равновесие является истинным.

Доказательство. Пусть xi, i +, – стабильное информационное равновесие, и условия утверждения выполнены. Тогда для любого i N имеем:

xi Arg max fi(ri, yi, xi,-i ) = Arg max i (ri, yi, yi(xi,-i)).

yiXi yiXi В силу стабильности справедливо равенство yi(xi,-i) = yi(x-i), поэтому xi Arg max i (ri, yi, yi(x-i)) = Arg max fi (ri, yi, x-i).

yiXi yiXi Последнее соотношение означает (в силу произвольности i N), что набор (x1, …, xn) является равновесным при полной информированности. • Определение. Стабильное информационное равновесие, не являющееся истинным, назовем ложным.

Pages:     | 1 |   ...   | 6 | 7 || 9 | 10 |   ...   | 26 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.