WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 8 |

yEN ( M, u Для решения задачи (5) воспользуемся комбинацией принципа декомпозиции игры агентов и выражений (1)-(3), позволяющих учитывать глобальные ограничения.

Фиксируем произвольный вектор действий агентов x A’. Для того чтобы этот вектор действий был реализуем, необходимо и достаточно, чтобы он был равновесием Нэша (для этого достаточно использовать соответствующую компенсаторную систему стимулирования), и был допустимым действием (с точки зрения ограничений на множества действий агентов). Для удовлетворения последнему условию центр должен выбрать такие значения управляющего параметра u U’, чтобы i N xi Ai(ui).

Обозначим Ui(xi) = {ui Ui | xi Ai(ui)}, i N – множество таких управлений, при которых действие xi является допустимым для n i-го агента, i N; U(x) = (xi ). Минимальные затраты центра U i i=на обеспечение допустимости вектора действий x A’ равны:

(6) ~ (x) = min) (u).

uU ( x Из принципа компенсации затрат [32] и принципа декомпозиции игры агентов [34] следует, что в рассматриваемой модели суммарные затраты центра по реализации действия x A’ равны n (x) = (x) + ~ (x).

c i i=Оптимальным для центра действием агентов является действие y*, максимизирующее разность между доходом центра и его затратами на стимулирование:

(7) y* = arg max {H(x) – (x)}.

xA Итак, выражение (7) дает оптимальное решение задачи управления в многоэлементной ОС в условиях, когда центр имеет возможность управлять множествами допустимых действий агентов.

4.5. МОДЕЛИ ОГРАНИЧЕННОЙ РАЦИОНАЛЬНОСТИ Рациональное поведение экономических агентов традиционно моделируется их стремлением к увеличению значения некоторой функции (функции полезности, выигрыша, целевой функции и т.д.), определенной на множестве альтернатив, которые может выбирать агент, и обстановок (внешних условий его деятельности) – см.

раздел 4.1 и [1, 4, 16, 24].

Рассмотрим одного агента (в одноэлементных моделях индекс, обозначающий номер агента, будет опускаться), интересы которого отражены его целевой функцией f(y), определенной на множестве возможных действий A: y A, f: A. Тогда множеством рационального выбора будет множество действий, доставляющих максимум целевой функции (см. также раздел 4.1):

(1) C0(f( ), A) = Arg max f(y).

yA Например, в экономико-математических моделях в качестве функции полезности (целевой функции фирмы) во многих случаях выступает прибыль фирмы.

Принцип (1) принятия решений соответствует так называемой классической рациональности. В работах Г. Саймона было предложено рассматривать так называемые модели ограниченной рациональности (ОР), то есть отказаться от предположения о стремлении агента к достижению абсолютного максимума, заменив его предположением о стремлении к достижению определенного уровня полезности, быть может, зависящего от величины оптимума [41, 51].

В настоящем разделе описывается ряд моделей ограниченной рациональности и обсуждается влияние предположений о рациональном поведении агентов на решения задач институционального управления ОС.

Введем следующее предположение о целевой функции и допустимом множестве: пусть f( ) непрерывна и вогнута, а множество A выпукло и компактно. Очевидно, что в рамках этих предположений множество C0(f( ), A) непусто.

Обозначим y* = arg max f(y). Для простоты будем считать, что yA f(y*) 0.

Следуя [30], введем в рассмотрения три типа ограниченной рациональности.

Первый тип ОР. Предположим, что агент стремится к обеспечению некоторого минимального уровня индивидуальной полезности U, то есть множеством рационального выбора можно считать (2) C1(f( ), A, U ) = {y A | f(y) U }.

Второй тип ОР. Предположим, что агент готов смириться с потерями фиксированной величины 0 по сравнению с абсолютным максимумом, то есть множеством рационального выбора можно считать (3) C2(f( ), A, ) = {y A | f(y) f(y*) – }.

Отметим, что этот способ учета «нечувствительности» и порогов различения агентов наиболее распространен в теоретикоигровых моделях, и при использовании в построении обобщенных решений позволяет регуляризовывать критерии оптимальности и добиться устойчивости решения по параметрам модели [9, 12, 23, 28]. Кроме того, данный тип представления рационального поведения согласован с моделями ОС, учитывающими неопределенность [33], в том числе – неопределенность целей агента.

Третий тип ОР. Предположим, что агент готов смириться с потерями, составляющими не более чем фиксированную часть (0; 1] от максимального выигрыша, то есть множеством рационального выбора можно считать (4) C3(f( ), A, ) = {y A | f(y) (1 – ) f(y*)}.

Неравенство в (4) можно записать в эквивалентном виде:

f(y*) – f(y) f(y*).

Введенные три типа ограниченной рациональности охватывают большинство встречающихся на практике задач управления ОС.

Исследуем свойства множеств (2)-(4).

В рамках введенных предположений U 0, 0, (0; 1] имеет место [30]:

- C0 C1, C0 C2, C0 C3;

- U ' U, ’, ’ выполнено C1(f( ), A, U ) C1(f( ), A, U ' ), C2(f( ), A, ) C2(f( ), A, ’), C3(f( ), A, ) C3(f( ), A, ’);

- C1(f( ), A, 0) = C2(f( ), A, 0) = C3(f( ), A, 0) = C0(f( ), A);

- для любого допустимого значения любого параметра (U 0, 0, (0; 1]) существуют значения двух других параметров, при которых множества (2)-(4) совпадают.

Последнее свойство позволяет говорить об эквивалентности в определенном смысле трех типов ОР, однако, использование в моделях определенного типа ОР должно быть обусловлено спецификой конкретной модели (например, для первого типа, в отличие от второго и третьего, не требуется знания абсолютного максимума и т.д.).

Отметим, что существует целое семейство целевых функций, имеющих одно и то же множество максимумов (1). Так, из теории полезности известно [44, 46], что целевая функция определена с точностью до положительного линейного преобразования, то есть для любого числа a и любого положительного числа b функции f( ) и g(y) = a + b f(y) имеют одинаковые множества максимумов:

C0(f( ), A) = C0(g( ), A).

В то же время, не все типы ограниченной рациональности обладают свойством инвариантности множества выбора относительно положительных линейных преобразований. Так, для первого типа ОР множество (2), определенное для функции f( ), не изменится, если в определении этого множества для функции g(y) = a + b f(y) изменить U на a + b U. Для второго типа ОР достаточно изменить на b. Для третьего типа ОР найти подобной замены общего вида не удается.

Рассмотрим, как изменится определение равновесия Нэша, сформулированное первоначально для классической рациональности, в рамках того или иного типа ограниченной рациональности.

Напомним, что равновесие Нэша в предположении классической рациональности определяется следующим образом (см. также предыдущий раздел) [16, 48, 50]. Для каждого агента вычисляется его наилучший ответ на ту или иную игровую обстановку:

BRi(y-i) = Arg max fi(yi, y-i), y-i A-i, i N.

yiAi Совокупность наилучших ответов определяет отображение BR(y) = (BR1(y-1), …, BRn(y-n)), y A’. Равновесием Нэша называется точка x A’, удовлетворяющая уравнению x = BR(x). Следовательно, множество равновесий Нэша есть (5) EN = {x A’ | x = BR(x)}.

Определим для заданных уровней индивидуальной полезности {Ui }i N следующие множества:

Bi(Ui ) = {y A’ | fi(y) Ui }, BRi(y-i, Ui ) = {yi Ai | fi(yi, y-i) Ui }, i N, BR(y, U ) = (BR1(y-1, U1 ), …, BRn(y-n, Un )), где U = (Ui )i N. Равновесием Нэша в рамках ОР1, следуя [30], будем считать x = BR(x, U ), то есть (6) E1 (U ) = = { x A’ | i N fi(x) Ui }, Bi(Ui ) N iI то есть множество векторов действий агентов, каждый из которых гарантирует каждому из агентов соответствующий уровень полезности.

В рамках второго типа ограниченной рациональности классическое равновесие Нэша переходит в определение -равновесия Нэша [16, 50]:

(7) EN ( ) = {y A’ | i N, yi Ai fi(yiN, y-iN) fi(yi, y-iN) – }, i где = (,, …, ).

1 2 n Аналогично определяется равновесие Нэша и в рамках третьего типа ОР:

(8) EN ( ) = {y A’ | i N, yi Ai fi(yiN, y-iN) (1 – ) fi(yi, y-iN)}, i где = (,, …, ).

1 2 n Очевидно, что множества (7) и (8) содержат в себе «классическое» множество равновесий Нэша (5).

Рассмотренные в настоящем подразделе модели ограниченной рациональности, во-первых, позволяют обобщить результаты разделов 4.2 и 4.4 по постановке и решению задач институционального управления (управления ограничениями деятельности).

Так как данные обобщения являются чисто "техническими", приводить их в настоящей работе мы не будем. Во-вторых, модели ограниченной рациональности будут использованы в пятом разделе при постановке и решении задач управления нормами деятельности.

5. УПРАВЛЕНИЕ НОРМАМИ ДЕЯТЕЛЬНОСТИ В настоящем разделе формулируется и решается задача управления нормами деятельности (подразделы 5.1-5.3) в предположении, что информация о существенных параметрах является общим знанием; затем исследуется влияние информированности агентов (иерархии их взаимных представлений) на согласованность норм деятельности и принципов рационального поведения агентов (подраздел 5.4), что позволяет рассмотреть в подразделах 5.5-5.6 ряд прикладных моделей.

5.1. ПОСТАНОВКА ЗАДАЧИ УПРАВЛЕНИЯ НОРМАМИ ДЕЯТЕЛЬНОСТИ Пусть ОС состоит из n агентов, выбирающих действия yi Ai из компактных множеств Ai и имеющих непрерывные целевые функции fi(, y), где – состояние природы, y = (y1, y2, …, yn) A’ = Ai, i N, где N = {1, 2, …, n} – множество аген iN тов.

Нормой деятельности будем называть отображение : A’ множества возможных состояний природы во множество допустимых векторов действий агентов. Содержательно i-ая компонента вектор-функции ( ) определяет, какое действие i-го агента от него ожидают остальные агенты и центр.

Пусть предпочтения центра заданы на множестве состояний природы, норм деятельности и действий агентов: (, ( ), y).

Предполагая, что агенты следуют установленным нормам, обозначим K( ( )) = F ( (, ( ), ( ))) – эффективность институционального управления ( ), где F ( ) – оператор устранения неопределенности. В качестве оператора устранения неопределенности (в зависимости от информированности центра) может использоваться гарантированный результат по множеству, или математическое ожидание по известному распределению вероятностей p( ) на множестве и т.д. (см. методы устранения неопределенности в разделе 4.1 и в [16, 29, 33]).

Тогда задачей институционального управления при ограничениях M на нормы деятельности будет выбор допустимой нормы * ( ) M, имеющей максимальную эффективность:

* (1) () = arg max K( ( )), ()M при условии, что агенты следуют установленным нормам деятельности.

Последнее условие требует пояснений. Так как агенты активны и выбирают свои действия самостоятельно, то выбор агента будет совпадать с выбором, предписываемым нормой, только в том случае, если агенту это выгодно. Детализируем, что можно понимать под «выгодностью».

По аналогии с моделями ограниченной рациональности, рассмотренными в разделе 4.5, определим параметрическое равновесие Нэша [16] и рациональное поведение для каждого из трех типов ограниченной рациональности:

(2) EN ( ) = {x A' | i N, yi Ai fi(, x) fi(, x-i, yi)}, (3) E1 (,U ) = {x A' | i N fi(, x) Ui }, N (4) EN (, ) = {x A' | i N, yi Ai fi(, x) fi(, x-i, yi) – }, i (5) EN (, ) = {x A' | i N, yi Ai fi(, x) (1– ) fi(, x-i, yi)}.

i Будем называть норму ( ) согласованной с j-ым типом рационального поведения, j = 0,3, если j (6) EN ( ) ( ).

Условие (6) можно интерпретировать следующим образом:

норма деятельности реализует то или иное равновесие, если для любого состояния природы, выбор, предписываемый нормой, не противоречит рациональности поведения агентов (обеспечивает им соответствующий выигрыш и/или делает невыгодным одностороннее отклонение от нормы). Если ( ) – однозначное отображение, что мы и будем предполагать в дальнейшем, то навязывание центром согласованной нормы деятельности может рассматриваться как сужение множества равновесий (подсказка о существовании фокальной точки и т.д. – см. обсуждение проблемы множественности равновесий в [16, 50]). С этой точки зрения управление нормами деятельности можно рассматривать как задачу реализации соответствия группового выбора (см. обзор результатов теории реализуемости в [29, 40]), в которой является вектором индивидуальных характеристик агентов. Такой аспект рассмотрения представляется перспективным направлением дальнейших исследований, но выходит за рамки настоящей работы.

Условия (2) и (6) совместно можно записать в следующем виде: норма ( ) является согласованной тогда и только тогда, когда (7), i N, yi Ai fi(, ( )) fi(, ( ), yi).

Условие (7) означает, что норма согласована с интересами агентов, если при любом состоянии природы каждому агенту выгодно следовать норме деятельности при условии, что остальные агенты также следуют этой норме. Аналогичным условию (7) образом можно записать и условия (3)-(5).

Рассмотрим, какой информированностью должны обладать агенты для того, чтобы существовала согласованная норма. Легко видеть, что условия игры – множество агентов, целевые функции, допустимые множества, а также норма деятельности и состояние природы должны быть общим знанием. Напомним, что общим знанием в теории игр [37] называется факт, о котором: а) известно всем игрокам; б) всем игрокам известно а); всем игрокам известно б), и так далее до бесконечности.

Действительно, для вычисления параметрического равновесия Нэша в рамках действующих норм деятельности каждый агент должен быть уверен, что и остальные агенты вычислят то же равновесие, что и он. Для этого он должен поставить себя на место остальных агентов, моделирующих его поведение, и т.д. Одним из способов создания общего знания является публичное сообщение факта всем агентам, собранным вместе. Наверное, в том числе, этим объясняется то, что для формирования корпоративной культуры, корпоративных стандартов поведения и т.д. в современных фирмах так много внимания уделяется неформальному общению сотрудников, лояльности фирме и т.д., то есть созданию у работников впечатления принадлежности общему делу, разделения общих ценностей и т.д. – все это нужно для существования общего знания.

Таким образом, под задачей институционального управления, как управления нормами деятельности, будем понимать задачу (1), (7) поиска нормы, обладающей максимальной эффективностью на множестве допустимых и согласованных норм.

5.2. РЕШЕНИЕ ЗАДАЧИ УПРАВЛЕНИЯ НОРМАМИ ДЕЯТЕЛЬНОСТИ Обозначим S – множество норм (всевозможных отображений : A'), удовлетворяющих условию (7) раздела 5.1. Тогда задачу управления можно записать в виде:

Pages:     | 1 |   ...   | 2 | 3 || 5 | 6 |   ...   | 8 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.