WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     || 2 |
-- [ Страница 1 ] --

Российская Академия Наук Институт проблем управления им. В.А. Трапезникова Н.А. Коргин НЕМАНИПУЛИРУЕМЫЕ МЕХАНИЗМЫ ОБМЕНА В АКТИВНЫХ СИСТЕМАХ Москва - 2003 УДК 519 ББК 22.18 К 66 Коргин Н.А.

Неманипулируемые механизмы обмена в активных системах. М.: ИПУ РАН (научное издание), 2003. – 126 с.

Настоящая работа посвящена вопросам построения неманипулируемых механизмов обмена в активных системах.

Рассматриваются статические задачи обмена в двух- и многоэлементных активных системах.

Работа рассчитана на специалистов (теоретиков и практиков) по управлению организационными системами.

Рецензент: д.т.н. Д.А. Новиков Утверждено к печати Редакционным советом Института Текст воспроизводится в виде, утвержденном Редакционным советом Института © Институт проблем управления РАН, 2003 2 СОДЕРЖАНИЕ Введение...............................................................................................................4 Глава I. Общие принципы построения неманипулируемых механизмов обмена в активных системах.............................................................................. 1.1. Модель обменной схемы............................................................................. 1.2. Общая постановка задачи обмена в активной системе.......................... 1.3. Рассмотрение задач теории активных систем как задач обмена........... 1.4. Математические модели и методы, используемые для построения неманипулируемых механизмов обмена в активных системах................... 1.5. Общий метод построения неманипулируемых механизмов обмена в активных системах............................................................................................ Глава II. Неманипулируемые механизмы обмена в двухэлементных активных системах............................................................................................ 2.1. Представление задачи стимулирования в виде задачи обмена............. 2.3. Решение задачи обмена для двухэлементных обменных схем без иерархии............................................................................................................. Глава III. Неманипулируемые механизмы обмена в многоэлементных активных системах............................................................................................ 3.1. Неманипулируемые механизмы обмена для обменных схем с веерной структурой взаимодействия агентов............................................................... 3.2. Неманипулируемые механизмы обмена для обменных схем со структурой взаимодействия агентов типа «цепочка»................................... Заключение...................................................................................................... Литература....................................................................................................... ВВЕДЕНИЕ Современный руководитель сталкивается с большим количеством проблем в процессе управления подчиненным ему субъектом (коллективом, предприятием, государством и т.д.) или планирования его деятельности. Среди наиболее насущных следует выделить проблему недостатка информации, необходимой для осуществления эффективного управления и планирования. В областях математики, исследующих управление в социально-экономических и организационных системах (теория игр, теория активных систем, микроэкономика и т.д.), предложены различные методы устранения информационной неопределенности руководителя системы. Один из распространенных приемов - сообщение необходимой информации подчиненными руководству (например в теории активных систем механизмы управления с сообщением информации называются механизмами планирования [52]). При разработке механизмов управления с сообщением информации, наряду с традиционной задачей максимизации эффективности управления системой [18,52], возникает задача устранения возможности подчиненных манипулировать сообщаемой ими информацией в собственных целях.

Пример «Традиционная проблема воровства». Если у повара, работающего в неком ресторане за фиксированную зарплату, начальство требует изготовления блюд, рецепты которых не известны руководству но известны повару, сколько продуктов нужно для приготовления того или иного блюда, то у повара возникает естественное желание завысить называемые количества, тем самым, заполучив в свое распоряжение излишки продуктов.

В настоящее время проблема манипулируемости получила достаточно широкое освещение как в отечественных [4,10-14,16 22,46,47,52,53,55,58,62,63], так и в зарубежных публикациях [59,61,64,65,67-70,72-77,79-82,85-89,91,95]. Однако, до сих пор не существует единого аппарата построения неманипулируемых механизмов управления социально-экономическими и организационными системами.

Основной трудностью является многообразие рассматриваемых моделей систем и различных постановок задач управления.

В данной работе развивается один из возможных подходов, призванный свести воедино многие полученные ранее результаты.

Насколько хорошо понятие «обмен» описывает взаимодействие между людьми? Рассмотрим произвольное сообщество. Каждый из членов этого сообщества обладает своим ресурсом (или несколькими видами ресурсов) – деньгами, знаниями, возможностью выполнить какую-либо работу, хорошим настроением и т.д. Люди, члены данного сообщества могут обмениваться между собой этими ресурсами. Зачем? Например, с целью улучшить свое благосостояние. Оставив за рамками данной книги нетривиальный вопрос – что такое благосостояние человека, скажем лишь, что и материальное богатство человека, выраженное в деньгах, и его уважение в обществе, и даже его моральное удовлетворение можно рассматривать как благосостояние. Важно лишь, что благосостояние человека зависит от имеющихся у него в наличии ресурсов.

Таким образом, обмен – это перераспределение ресурсов между элементами системы, с целью улучшения их благосостояния.

Очевидно, что экономические системы являются частным случаем сообщества людей, причем элементами подобных систем могут являться как отдельные люди, так и целые коллективы, предприятия, фирмы, страны и т.д. – экономические субъекты. Поэтому, процесс функционирования экономической системы может быть представлен как процесс обмена. В качестве ресурсов, обмениваемых участниками системы, могут выступать производимые ими товары, оказываемые услуги, деньги.

Пример «Взаимодействие мельника и пекаря». Схема обмена выглядит следующим образом. Мельник передает пекарю некоторое количество муки, заказывая у него выпечь из нее булок. Обмен между мельником и пекарем здесь очевиден – обменивается ресурс типа «мука» на ресурс типа «булки». В случае, если условия обмена определяет мельник, а пекарь либо соглашается на них либо нет, в роли управляющего органа (центра) выступает мельник, а пекарь – в роли активного элемента [23]. Проблема неполной информированности центра (мельника) о параметрах схемы (типе пекаря) может быть сформулирована следующим образом. Мельник не знает точно технологии пекаря, но знает, что на изготовление одной булки пекарю требуется от 600 до 900 грамм муки.

Возникает вопрос о том, сколько же муки обменять на сколько булок.

Мельник может поступить следующим образом – он может спросить у пекаря о его технологии, и в зависимости от сообщенной информации предложить различные варианты обмена, тем самым реализовав механизм обмена с сообщением информации. Проблема манипулируемости подобного механизма очевидна – пекарь может воспользоваться неполной информированностью мельника в своих интересах, сообщив завышенное значение требуемого количества муки, а полученные излишки использовав в своих интересах.

Рассматривая различные процессы функционирования социально экономических и организационных систем как процессы обмена, можно расширить области применения полученных ранее результатов решения отдельных задач управления (в частности, задачи построения неманипулируемх механизмов управления).

Для разработки эффективных неманипулируемых механизмов обмена в активных системах необходимо решение следующих основных задач:

- Разработка модели обменной схемы и формулировка общей задачи обмена в активной системе.

- Разработка общих методов построения неманипулируемых механизмов обмена в активных системах в условиях неполной информированности руководящего органа (центра).

- Синтез эффективных и неманипулируемых механизмов обмена для базовых обменных схем: двухэлементных и многоэлементных (веерного типа и типа «цепочки»).

Структура изложения.

Перечисленные общие теоретические задачи настоящего исследования определяют структуру дальнейшего изложения его результатов. Первая глава посвящена общей постановке проблемы построения неманипулируемых механизмов обмена в активных системах.

В разделе 1.1 формулируется математическая модель обменной схемы (ОС). Вводятся определения обмена, множества вариантов обмена (МВО) и ОС, а также ряд других ключевых определений.

В разделе 1.2 задача обмена формулируется как задача управления.

В разделе 1.3 изучается возможность рассмотрения задач теории активных систем (ТАС) как задач обмена. Проводится сравнительный анализ классификации активных система (АС) и классификации ОС.

Раздел 1.4 посвящен обзору основных математических моделей и методов, которые могут быть использованы для построения неманипулируемых механизмов для ОС. Формулируется принцип открытого управления и приводятся достаточные условия неманипулируемости прямых механизмов планирования. Приведен принцип построения неманипулируемых механизмов для решения задач теории контрактов. Рассматривается модель обменной экономики Эджворта. Излагаются принципы построения механизмов Маскина и МакКельви, реализующих заданное соответствие группового выбора (СГВ).

В разделе 1.5 дается общая постановка задачи построения неманипулируемых механизмов обмена для АС с неполной информированностью центра. Формулируется общий метод построения неманипулируемых механизмов обмена.

Вторая глава посвящена рассмотрению «базовых» обменных схем, состоящих из двух агентов.

В разделе 2.1 строится модель ОС, соответствующая модели АС для задача стимулирования. Доказывается эквивалентность решений детерминированных задач стимулирования и обмена для соответствующей ОС. Осуществляется переход от детерминированной ОС к ОС с внутренней неполной информированностью центра – вводится понятие типа АЭ, полностью характеризующее АЭ, и не известное достоверно центру. Формулируются условия на зависимость функции предпочтения АЭ от типа, при выполнении которых возможно применение общего метода построения неманипулируемого механизма обмена.

Раздел 2.2 посвящен построению механизмов ОУ в двухэлементных ОС с внутренней неполной информированностью. Рассматриваются дискретный и непрерывный методы построения механизмов ОУ.

Дискретный метод построения неманипулируемых механизмов обмена основан на «графическом» анализе функций предпочтения агентов.

Непрерывный метод является частным случаем предложенного в разделе 1.5 общего метода построения неманипулируемых механизмов обмена.

Доказана эквивалентность двух предложенных методов.

Раздел 2.3 посвящен решению двухэлементных задач обмена без иерархии. Предлагается метод решения подобных задач, основанный на механизмах ОУ для аналогичных двухэлементных иерархических ОС.

Агенты самостоятельно распределяют между собой роли Ц и АЭ.

Определяется зависимость распределение ролей от параметров ОС для «квазиинтеллектуальных» (не производящих анализ сообщений оппонента) и «интеллектуальных» (анализирующих сообщения оппонента) агентов.

Третья глава работы посвящена исследованию механизмов ОУ в ОС с конечным числом элементов.

В раздел 3.1 рассматривается ОС с веерной структурой взаимодействия элементов и одним уровнем иерархии. Т.е ОС состоит из одного центра и конечного числа АЭ. Для многоэлементных ОС, соответствующих многоэлементной задачи стимулирования строится эффективный механизм обмена ОУ.

В разделе 3.2 рассматриваются ОС со структурой взаимодействия элементов типа «цепочка» и одним уровнем иерархии. Предлагаются три метода построения неманипулируемых механизмов обмена для случая, когда общий метод неприменим. Первый метод – метод «консолидации АЭ» – центр рассматривает всех АЭ как единый АЭ и решает задачу нахождения механизма обмена ОУ для полученной двухэлементной ОС.

Второй метод – метод «разбиения схемы» – цент взаимодействует с каждым АЭ по отдельности. Третий метод – метод «доносчика» - центр делегирует права промежуточного центра тому АЭ, который сообщит наилучшую оценку типов всех АЭ.

Заключение содержит основные результаты работы и обсуждение перспективных направлений дальнейших исследований.

ГЛАВА I. ОБЩИЕ ПРИНЦИПЫ ПОСТРОЕНИЯ НЕМАНИПУЛИРУЕМЫХ МЕХАНИЗМОВ ОБМЕНА В АКТИВНЫХ СИСТЕМАХ В данной главе формулируется математическая модель ОС, ставится задача обмена. Проводится сравнительный анализ оснований для классификации АС и ОС, в результате которого обосновывается актуальность рассмотрения задач ТАС как задач обмена. Приводится обзор основных известных моделей и методов, которые могут быть использованы для построения неманипулируемых механизмов обмена для ОС. Формулируется общая постановка задачи построения неманипулируемых механизмов обмена для АС с неполной информированностью центра. Предложен общий метод решения этой задачи. Выводятся необходимые и достаточные условия неманипулируемости механизма обмена, сформулированные в терминах функций предпочтения агентов. Полученные автором результаты, содержащиеся в первой главе, были опубликованы в работах [33,37,40,43].

1.1. Модель обменной схемы Понятие обмена можно понимать в буквальном смысле – считая обменными бартерные схемы. Можно попытаться расширить рамки понятия процесса обмена, рассматривая его, как процесс взаимодействия между членами социально-экономической системы с целью улучшения своего благосостояния. Для этого необходимо построить модель обменной схемы, которая не противоречит проводимым ранее исследованиям бартерных схем [1,5,6,7,9,15,24,26,31,44] и позволяет рассмотреть другие задачи функционирования социально-экономической системы (активной системы в терминах ТАС) как задачи обмена.

Рассмотрим АС, состоящую из n+1 агентов и m видов ресурсов.

Множество всех агентов обозначим I = {0,…,n}. Множество всех ресурсов обозначим J = {1,…,m}. Набор всех имеющихся у агента i ресурсов i i i обозначим y = (y,..., y ). Здесь y обозначает наличие у i-ого агента i 1 m j ресурса типа j. Соответственно распределение ресурсов по всем агентам можно записать в виде матрицы: y = (y,.., y ).

0 n Нумерация агентов от 0 до n оправдана тем, что большинство ОС, рассматриваемых в данной работе будут представлять из себя АС, состоящие из одного руководящего агента и n подчиненных ему агентов.

Функции и возможности руководящего и подчиненных агентов будут рассмотрены ниже, при описании структуры подчиненности агентов.

Предпочтения каждого агента опишем произвольной функцией m (функция предпочтения): ( y ) : R R;

i = 0,n + 1.

i i Агенты обладают возможностью взаимодействовать между собой путем взаимного обмена ресурсами.

Определение 1. Обмен – перераспределение ресурсов из множества J между элементами из множества I: y0ye.

Здесь y0 – матрица начального распределения ресурса (или существующего распределения), ye – соответственно конечного.

Определение 1 и само описание набора агентов и ресурсов выглядят пока достаточно абстрактно, но именно данный подход позволяет дать наиболее общее определение обменной схемы и самого процесса обмена.

Рассмотрим качественно, какие ограничения (требования) могут быть наложены на описанную выше модель и приведем примеры данных ограничений. Данные ограничения могут трактоваться как основания для классификации ОС.

Ограничения по ресурсам. Ограничения данного класса определяют множества всевозможных значений матрицы распределения ресурсов y:

yA. Примером подобных ограничений являются ограничения на общее n i количество ресурса y = Y, и ограничения на количество ресурса j j i=o i i (ресурсов) у отдельного агента, например y Y.

j j Ограничения по возможности взаимодействия между агентами.

Ограничения данного класса фактически превращают некий произвольный набор агентов в сетевую структуру – указывают, с какими агентами данный конкретный агент может обмениваться какими ресурсами. На рисунке 1 приведен пример ограничений данного класса – линии, связывающие агенты указывают на возможность взаимодействия (обмена) между ними, подписи к линиям – указывают на типы ресурсов, которыми данные агенты могут обмениваться. Ограничения данного класса обозначим QS. Запись y0ye QS обозначает, что обмен y0ye возможен в рамках определенной структуры.

Рис. 1. Структура взаимодействия агентов Ограничения на вид функций предпочтения агентов. Это достаточно широкий класс ограничений. Например, функции всех агентов принадлежат к классу вогнутых однопиковых непрерывных функций. Или вид функций предпочтения может быть указан явным образом, например:

m i j j j j = (y - ).

B i i i i j= Ограничения данного класса обозначим Q.

Ограничения индивидуальной рациональности IR(y0).

Ограничения данного класса определяют требования, налагаемые на e значения функций предпочтения агентов. Например i I ( y ) ( y ).

i i i i Множество распределений ресурсов, индивидуально рациональных по отношению к начальному распределению ресурса, обозначим IR(y0).

Очевидно, что IR(y0) A.

Накладывая на рассматриваемую схему ограничения приведенных выше четырех классов в различных комбинациях, можно получить достаточно большое количество моделей взаимодействия агентов.

Пример 1. Схема “Распределение ресурсов” (см. рисунок 2) Рис. 2. ОС «Распределение ресурсов» Опишем модель АС, используемую в задаче распределения ресурсов [4,16,18,25,29,52,57] в терминах обменных схем:

1. Кол-во агентов - n+1 (Центр – агент с номером 0) 2. Кол-во видов ресурсов – n i 3. Ограничения на ресурс A:

y = Y 1 i=o 4. Ограничения QS: агенты с номерами i =1,n могут взаимодействовать только с агентом номер 0 (центр).

5. Ограничения Q: функции благосостояния для агентов с номерами i =1,n – однопиковые, максимум функции благосостояния k-ого достигается при наличии у него ресурса в кол-ве rk.

6. Ограничения ИР зависят от начального распределения ресурса и записываются следующим образом i =1,n, y A, (y ) (y ) i i i i 7. Начальное распределение ресурса: y = (Y,0,...,0) Рассмотренная схема позволяет трактовать задачи распределения ресурсов [4,16,18,25,29,52,57] как задачи обмена. Здесь и далее символ обозначает окончание примера или задачи. Символ обозначает окончание доказательства леммы, утверждения или теоремы.

После введения четырех классов ограничений можно записать ряд ключевых определений.

Определение 2. Множество возможных вариантов обмена (МВО) Y(y0): Y(y0) IR(y0), y Y(y0), y0y QS.

Т.е множество возможных вариантов обмена - совокупность всех индивидуально рациональных распределений ресурсов, переход к которым от начального распределения ресурсов возможен в рамках заданной структуры.

Определение 3. Обменная схема (ОС) – кортеж {I, J, A, y0, QS, Q, IR(y0)}, для которой МВО не пусто.

Для обменных схем можно вести следующие замены:

Определение 4. Трансферт ресурса типа j для элемента i в процессе i i i обмена y0y : x = y - y.

j j j i i Соответственно можно определить x = (x,..., x ) - вектор i 1 m трансфертов всех ресурсов у элемента i;

матрица трансфертов в ОС x = (x,.., x ).

0 n Данная замена актуальна тем, что любой из возможных обменов в ОС однозначно определяется матрицей x. В то время как различным вариантам обмена может соответствовать одинаковое конечное распределение ресурса между агентами.

Определение 5. Множество возможных вариантов обмена в терминах трансфертов Х: xX y Y(y0) : x = y - y0.

Множество Х зависит от y0, но, учитывая, что в определении обменной схемы мы рассматриваем единственное начальное распределение ресурсов, аргумент y0 опускается.

Определение 6. Функция полезности i-го агента от обмена:

o o f (x ) = (x + y ) - (y ).

i i i i i i i o По аналогии с множеством Х, аргумент y в записи функции i полезности опускается. Очевидно, что свойства функции полезности абсолютно идентичны свойствам функции предпочтения. Фактически, функции полезности от обмена – это и есть функции предпочтения, но рассматриваемые в новой системе координат (трансфертах), полученной путем сдвига из стартовой системы координат (ресурсы).

Пример 2. Пусть предпочтения агента описываются функцией (y, y ) = y - (y -Y ). Тогда, в соответствии с определением 6, 1 2 2 1 множество Х зависит от y0, но, учитывая, что в определении обменной схемы мы рассматриваем единственное начальное распределение ресурсов, аргумент y0 опускается.

Таким образом, целевая функция в обменной схеме для данного агента будет иметь следующий вид:

f (x, x ) = x - x + 2x (y - Y ).

1 2 2 1 1 1 При начальном наборе ресурсов у данного агента {Y1,0}, его целевая функция переписывается следующим образом f (x, x ) = x - x.

1 2 2 Также, важными понятиями в рассмотрении обменных схем, являются понятие структуры подчиненности и понятие информационного состояния схемы.

Структура подчиненности определяет иерархию в обменных схемах – т.е. кто определяет правила и последовательность обмена и предлагает возможные варианты обмена для всей схемы. Отметим, что структура подчиненности может не иметь ничего общего со структурой схемы, определяемой ограничениями QS. Одним «экстремумом» множества возможных структур подчиненности является равноправная структура – когда все агенты оказывают сравнимое влияние на выбор вариант обмена или правила обмена. В противоположность данной структуре можно поставить иерархическую структуру с двумя уровнями иерархии – из множества всех агентов выделяется один, в подчинение которого находятся все остальные агенты схемы. Используя терминологию ТАС [52], главенствующего агента можно назвать центром (Ц), находящихся у него в подчинении агентов – активными элементами (АЭ). Для рассмотрения более сложных структур подчиненности можно для i-ого агента ОС ввести следующую характеристику – (IiA;

IiP). IiA - множество агентов ОС, которым данный агент подчиняется непосредственно. IiP множество агентов ОС, находящихся в непосредственном подчинении у данного агента.

Информационное состояние ОС определяет информированность агентов о параметрах ОС. В данной работе сохраняется классификация, принятая в [14,18,19,52]. В соответствии с данной классификацией, основное внимание в данной работе уделяется ОС с неполной и ассиметричной информированностью агентов. Агент считается не полностью информированными, если ему не известны точные значения всех параметры ОС. Информационное состояние системы считается ассиметричным, если агенты обладают разными уровнями информированности о параметрах ОС.

Введя базовые определения, необходимые для рассмотрения обменных схем, перейдем к формулировке задачи обмена.

1.2. Общая постановка задачи обмена в активной системе Самая общая постановка задачи обмена может быть сформулирована как стандартная задача управления [18,52]. Реализация любого из вариантов обмена зависит от управляющего воздействия u U: x =G(u).

Пусть на множестве UX задан функционал Ф(u, x), определяющий эффективность обмена с точки зрения управляющего органа (например центра самого верхнего уровня, или совокупности всех элементов для равноправной ОС). Величина K(u) = Ф(u, G(u)) называется эффективностью управления u U. Задача управляющего органа заключается в выборе максимально эффективного допустимого управления:

u * Arg max K(u) = { u U | U K(u) K()}.

uU 1.3. Рассмотрение задач теории активных систем как задач обмена Прежде чем обосновать смысл рассмотрения задач ТАС как задач обмена, произведем сравнительный анализ классификации ТАС и классификации ОС, предложенной в данной работе.

Базовая модель АС задается следующим набором параметров [16, 52], который также служит основанием для классификации задач ТАС.

Состав АС – совокупность субьектов, являющихся агентами системы (участниками АС).

Структура АС – совокупность информационных, управляющих и других связей между участниками АС, включая отношения подчиненности и распределения прав принятия решений.

Порядок функционирования – последовательность получения информации и выбора стратегий участниками АС.

Число периодов функционирования – отражает наличие или отсутствие динамики в рассматриваемой АС.

Предпочтения участников АС – определяют совместно с принципами рационального поведения зависимость состояния системы от управляющих воздействий и критерий эффективности системы.

Допустимые множества состояний (стратегий) участников АС – отражают индивидуальные и общие ограничения на выбор состояний, накладываемые окружающей средой, используемой технологией и т.д.

Информированность участников – та информация, которой обладают участники.

Из данного набора параметров часть сохранена и в описании модели обменной схемы. Это состав системы, порядок функционирования, число периодов функционирования и информированность участников, которая в данной работе формулируется как структура информированности агентов ОС. Несовпадение остальных параметров классификации АС и классификации ОС можно привести в виде таблицы 1.

Таблица 1.

Различие оснований классификации ОС и ТАС Предпочтения Допустимые ТАС Структура АС участников АС множества Ограничения в ОС А Qs Q IR(y0) Структура подчиненности Затемненные области в приведенной выше таблице указывают на пересечение критериев классификации модели АС и ОС по смыслу.

Поясним эти пересечения.

Структура системы распадается на два параметра – структура подчиненности, и структуру взаимодействия, задаваемую ограничениями на возможность взаимодействия между агентами. Причем последний параметр больше принадлежит к группе допустимые множества из классификации ТАС, так как является именно ограничением в модели.

Разделение параметра предпочтения участников системы – всего лишь углубление классификации, позволяющее более четко прояснить структуры модели ОС. Параметр допустимые множества преобразуется прежде всего ограничения на ресурс, но возможность обмена агентов между собой в соответствии с некой структурой также можно расценивать как ограничения на выбор состояний участниками АС.

Таким образом, ОС - это АС, при исследовании которых акцент делается на возможности взаимодействия агентов между собой (обмена ресурсами).

Совершенно очевидно, что многие (если не все) задачи ТАС, могут быть рассмотрены как задачи обмена.

Задачи стимулирования [2,8,12-14,16-22,45-52,55,58] – центр взаимодействует с активными элементами, требуя от них каких то действий и назначая стимулирование за эти действия. Взаимодействие между центром и АЭ может быть представлено в виде обмена – центр обменивает свой ресурс (например деньги) на ресурс АЭ – их работу, товар, т.д. Поэтому очевидно, что задачи стимулирования могут рассматриваться как задачи обмена. В разделе 2.1 приводится строгое доказательство эквивалентности задач стимулирования и обмена.

Задачи распределения ресурса [4,16,18,25,29,52,57] – центр неким образом распределяет имеющийся у себя в наличии ресурс между АЭ. В примере 1 рассмотрена ОС, где возможен только «односторонний» обмен – один агент может распределить имеющийся у него в наличии ресурс между остальными. Иными словами задачи распределения ресурсов можно представить как частный случай задач обмена. Представляется перспективным перенос результатов ТАС, полученных для задач распределения ресурсов.

Задачи определения внутренних цен [2,7,13,14,16,17,19-22,25,26,55,58] также могут быть рассмотрены как задачи обмена, где ресурсами к обмену являются деньги и товары.

На рисунке 3 представлена структура рассматриваемых в работе обменных схем. В главе 2 будут рассмотрены двухэлементные ОС, для которых задачи обмена могут быть классифицированы как эквивалентные задачам стимулирования, эквивалентные «обратным» задачам стимулирования (центр стал АЭ, а АЭ – центром) и как «классический» обмен – функции предпочтения агентов линейно зависят от количества имеющихся у агентов ресурсов.

Обменные схемы (описание модели и постановка задачи обмена – глава 1) Два агента (глава 2) Несколько агентов (глава 3) Нет иерархии Иерархия Ц - АЭ Неполная Полная информированность информированность Неполная информированность центра агентов центра Взаимодействие Веерное агентов типа взаимодействие «цепочка» агентов Построены эффективные и неманипулируемые механизмы обмена раздел 2.3 раздел 2.1 раздел 2.2 раздел 3.2 раздел 3. Обратная задача Задача «Классический» стимулирования стимулирования обмен Рис. 3. Рассматриваемые обменные схемы 1.4. Математические модели и методы, используемые для построения неманипулируемых механизмов обмена в активных системах В данном разделе приведем основные результаты ТАС и микроэкономической теории, применимые для построения неманипулируемых механизмов обмена в активных системах Условия совершенного согласования. В отечественных работах авторы сосредоточили внимание на способах организации деятельности отдельных элементов системы. В [10-14,16-22,52,53,55,58,62,63] исследуются механизмы функционирования систем, в которых альтернатива представляет собой вектор Евклидова пространства, причем в функции полезности каждого активного элемента явно участвует только одна компонента этого вектора, обычно содержательно интерпретируемая как план, назначаемый данному элементу. Такие системы в зарубежных работах получили название экономик с частными товарами (Economies with private goods) [45,61,72,53,55,].

Рассмотрим систему, состоящую из центра и n активных элементов.

Интересы элементов и центра выражаются их целевыми функциями fi (xi, yi, ri ), i = 1, n и (x, y) где ri i - параметр, параметризующий класс допустимых целевых функций i - го элемента, x = (x1,..., xn ) - вектор планов, назначаемых элементам, а y = ( y1,..., yn ) - вектор действий, выбираемых элементами. Порядок функционирования системы следующий:

1. Этап сбора информации. Элементы сообщают центру оценки (s1,..., sn ) параметров (r1,..., rn ) ;

2. Этап планирования. На основе полученных оценок центр, используя процедуру планирования : S X, где S = X, X = i i iI iI множество допустимых планов, назначает планы xi = (s) элементам, i i = 1, n.

3. Этап выбора состояния. Получив плановые задания, элементы выбирают свои состояния yi Ai, где Ai, i = 1, n - множества допустимых состояний.

В предположении рационального поведения элементов, при фиксированных планах выбираемые действия yi будут максимизировать соответствующие целевые функции, то есть:

yi Pi (xi, ri ) = Argmax fi (xi, yi, ri ).

yiAi Как и ранее, при сообщении оценок на этапе 2, будет иметь место эффект манипулирования информацией. Задачей центра является выбор такой процедуры планирования, чтобы в точке равновесия значение его целевой функции было максимально. Введем эффективность механизма = (S, ) K() = min ((s*), r), rS где (x, r) = (x, y(x, r)).

При заданных значениях параметра ri i и плане xi X элемент i выбирает действие yi (xi, ri ) Pi (xi, ri ) = Argmax fi (xi, yi, ri ). Таким yiAi образом, можно говорить о функции предпочтения (полезности) элемента i (xi, ri ) = fi (xi, yi (xi, ri ), ri ).

Зададим для каждого активного элемента множества X (s ) X и i -i i рассмотрим следующую процедуру планирования:

(5.1) (x, s) max xX (x, s ) = max (z, s ).

i i i i i zX (s- i ) i (5.2) Условие (5.2) обеспечивает назначение элементу плана, максимизирующего его функцию предпочтения (в которую в качестве «истинного» значения типа АЭ подставляется сообщенная им оценка) и называется условием совершенного согласования (УСС). Условие (5.1) в неявном виде задает процедуру планирования, максимизирующую целевую функцию центра. Механизм, удовлетворяющий (5.1)-(5.2), называется механизмом открытого управления (ОУ).

Теорема 5.1.2 [52] (Принцип открытого управления). Необходимым и достаточным условием сообщения достоверной информации как доминантной стратегии при любых r является существование множеств X (s ), для которых выполнено условие совершенного i -i согласования.

Таким образом, принцип открытого управления является критерием неманипулируемости механизма планирования в АС с сообщением информации. Помимо манипулируемости, основным свойством любого механизма является его эффективность. Возникает вопрос, в каких случаях существует оптимальный неманипулируемый механизм (другими словами – в каких АС при поиске оптимального механизма можно ограничиться классом неманипулируемых механизмов). Частичный ответ на этот вопрос дает теорема 5.2.

Теорема 5.2. [52] В активной системе с одним активным элементом для любого механизма планирования существует механизм открытого управления не меньшей эффективности.

Итак, теорема 5.2 утверждает, что механизм ОУ оптимален в одноэлементной АС (другими словами, для любого механизма планирования в одноэлементной активной системе существует эквивалентный прямой механизм. Естественное желание обобщить этот результат на случай многоэлементных АС наталкивается на ряд проблем, * основная из которых – зависимость равновесного сообщения s (r) i каждого АЭ i I от типов других АЭ [13]. Поэтому в общем случае в многоэлементных АС механизмы открытого управления (неманипулируемые) не оптимальны. В то же время, для широкого класса практически важных частных случаев механизмов планирования в многоэлементных АС доказаны результаты об оптимальности механизмов ОУ. Некоторые из этих механизмов рассматриваются в работах В разделе 1.4 нумерация определений, лемм, теорем, формул и т.д. соответствует их нумерации в в источниках.

[8,13,19,48,52,55]. В данной работе УСС будут использованы в общем методе построения неманипулируемых механизмов обмена, а теорема 5. обосновывает оптимальность неманипулируемых механизмов обмена, которые будут построены в главе 1.

Оптимальность неманипулируемых механизмов распределения ресурсов [4,13,14,16-22,46,47,52,53,55,63]. Рассмотрим систему, состоящую из центра и n активных элементов. Центр владеет R единицами ресурса. Ценность ресурса для i -го элемента определяется его функцией полезности (x, r ), где x - получаемое им количество i i i i ресурса, а r - тип АЭ, параметризующий класс допустимых функций i полезности. Функция полезности может определять, например, прибыль АЭ от использования ресурса в количестве x.

i Предположим, что о функции полезности АЭ центр не имеет информации, за исключением той, что она принадлежит некоторому классу однопиковых функций с точкой пика r и однозначно i i определяется значением этого параметра, то есть получение ресурса в количестве x = r доставляет максимум функции полезности i-го АЭ.

i i Задачей центра является распределение ресурса с целью, например, максимизации суммарной полезности всех элементов (x, r ) max i i i x iI при ресурсном (балансовом, бюджетном) ограничении: x R.

i iI Распределение ресурса осуществляется следующим образом. Каждый активный элемент сообщает центру оценку s, i I, своего типа i i (параметра своей функции полезности) (x, r ) и получает ресурс в i i i количестве x = (s), где (s) = ( (s), (s),..., (s)) называется i i 1 2 n процедурой (механизмом) распределения ресурса.

Будем полагать, что множество возможных значений типов i-го АЭ i - является отрезком действительной оси: = [0, D] R, i I, i 0 < D < +. В качестве ограничения D можно выбрать, например, имеющееся в распоряжении центра количество ресурса R.

На процедуру распределения ресурса наложим следующие ограничения:

1. Функция (s) непрерывна по всем переменным и строго монотонна i n по s для всех s [0, D], i I.

i 2. Будем считать, что > R (гипотеза дефицитности) и весь ресурс r i iI распределяется полностью, то есть: x = R.

i iI 3. Каждая группа активных элементов может получить любое количество ресурса, меньшее того, что она уже получила:

s, W I x (s), i W s : x = (s, s ), i i W W W W W I \W где =.

W j jW 4. Если количество ресурса, распределяемого между АЭ из некоторого подмножества W I, увеличивается, то каждый АЭ получает количество ресурса, не меньшее прежнего.

В качестве модели поведения примем равновесие Нэша. Вектор сообщений s (r) называется равновесием Нэша при данном r, если i I, s выполняется следующее соотношение:

i i ( (s ), r ) > ( (s, s ), r ).

i i i i i i -i i Лемма 5.1. [52] Пусть s (r) - равновесие Нэша при данном r, тогда оно удовлетворяет следующим условиям:

1) если x < r, то s = D ;

i i i 2) если s [0, D), то x = r.

i i i Распределение ресурса в равновесии определяется следующим алгоритмом.

Алгоритм 5.1. [52] На нулевом шаге полагаем s = D для всех i I и i вычисляем распределение ресурса x = (D,..., D). Множество4 Q на i i нулевом шаге полагаем пустым Q =.

Некоторое условие, записанное для индекса W I, считается выполненным для всех АЭ i W.

j На шаге j 1 множество Q определяем следующим образом:

j j - Q = {i I | (x ) r }.

i i j Для АЭ из множества Q по условию 2 определяем s такие, j j Q Q что j- (s, s ) = r.

j j j j Q Q I \Q Q j j -1 j j В конце j -го шага получим s = (s, s ) и x = (s ).

j j Q I \Q k k - Если на некотором шаге k окажется, что Q = Q, то алгоритм k * k k останавливается, и полагаем: s = s, x = x, Q = Q. • Результаты применения данного алгоритма, заканчивающегося не более чем за n шагов, имеют следующие свойства:

k j j - Лемма 5.2. [52] 1) Если i Q, то на любом шаге 1 j k, x x и x x.

2) s - равновесие Нэша при данном r.

Определим соответствующий исходному механизму распределения ~ ресурса прямой механизм h(~) = (s (~)), r. Таким образом, в r r ~ механизме h(~) i-ый элемент сообщает r, при этом r может быть не r i i i равным ~.

r i Теорема 5.3. [52] Прямой механизм распределения ресурса h(~), r определяемый алгоритмом 5.1, является механизмом открытого управления.

Из теоремы 5.3 следует, что для любого механизма распределения ресурса, удовлетворяющего введенным предположениям, существует эквивалентный прямой механизм, то есть неманипулируемый механизм не меньшей эффективности. Этот результат будет использован в доказательстве оптимальности неманипулируемого механизма обмена в ОС с веерной структурой взаимодействия агентов.

Множество Q I включает активные элементы, получающие абсолютно оптимальные для себя планы ( xi = ri, i Q ). Такие АЭ называются «диктаторами» или (в механизмах распределения ресурса) приоритетными потребителями.

Неманипулируемость прямых механизмов и множества диктаторства [53,55,63].

Рассмотрим прямой механизм h : Rn Rn. Пусть для некоторого ~ сообщения r Rn выбирается вектор планов x = h(~). Так как полезность r каждого АЭ определяется однопиковой функцией полезности, то каждый АЭ может находиться в одном и только одном из трех возможных ~ состояний: (а) либо hi (~) > ri и тогда АЭ будет получать план, строго r ~ больший желаемого, (б) либо hi (~) = ri и АЭ будет назначаться r ~ оптимальный для него план, (в) либо hi (~) < ri и план будет r недостаточным. Для каждого активного элемента i I введем индекс состояния, принимающий значения из набора {a, c, m}=, где a соответствует состоянию (а), с - состоянию (б), а m - (в), и обозначим его через (символы индекса являются первыми буквами фр. слов manque i нехватка, contentement - удовлетворенность, abondance - избыток). Вектор индексов состояния всех АЭ обозначим через n.

Введем соответствия M:n2I, C:n2I, A:n2I, значениями которых для каждого вектора состояний n будет подмножество АЭ из I, таких, что индексы состояний этих элементов равны, соответственно, m, c и a: M()={jI: j=m}, C()={jI: j=c}, A()={jI: j=a}, n.

Очевидно, для каждого подмножества C(), A(), M () в совокупности являются разбиением множества всех элементов I.

Определение 2.1.1. [53] Разбиением D пространства Rn назовем совокупность множеств DRn, таких, что ~ если i M (), hi (~) = ~ если i C() D = {~ Rn hi (~) < ri r ri r r ~ и hi (~) > ri, если i A()}, n.

r ~ Сокращенно неравенства h (~) < r, при iM() будем записывать r i i ~ ~ ~ hM () (~) > rM (), а неравенства hi (~) > ri, при iA() как hA() (~) > rA().

r r r Как видно из определения, для каждого множества D разбиения D задано множество элементов C(), называемых диктаторами, которые получают оптимальные планы, остальные элементы при этом получают некоторые неоптимальные для себя планы. Разбиение B назовем разбиением на множества диктаторства, а сами множества D - множествами диктаторства.

Далее будем предполагать, что в каждом из множеств D разбиения D планы, назначаемые всем активным элементам зависят только от сообщений диктаторов C() в этом множестве и не зависит от сообщений ~ остальных элементов, если вектор сообщений r находится в этом множестве. То есть, существует функция x (~C() ), определенная на для r ~ ~ всех rC() ProjC() D, такая, что для всех r D выполняется h(~) = x (~C() ) и выполнено предположение r r А.2.1.1. [53] Для всех n существует функция x : ProjC()D Rn, такая, что ~ D выполнено h(~) = x (~C() ).

r r r Содержательно предположение А.2.1.1 означает, что планы, назначаемые для всех векторов сообщений из одного и того же множества диктаторства, не зависят от сообщений АЭ, не являющихся диктаторами.

Определение 2.1.2. [53] Определим совокупность множеств D ={rRn: rM()> xM () (rC() ), rC( ) = Proj D, rA()< xA() (rC() ) }, C() n.

Из определения 2.1.2 очевидно, что для любого n выполнено включение D D. Также очевидно, что если для любого вектора ~ сообщений r D выполняется h(~) = x (~C() ), то для любого вектора r r истинных точек пика r D сообщение достоверной информации является наилучшим сообщением из D для всех АЭ.

Теорема 2.1.1. [53] Пусть I - множество активных элементов, функции полезности которых обобщенно однопиковые. Пусть механизм h : Rn Rn удолетворяет А.2.1.1 и D=D0, тогда он неманипулируем.

Теорема 2.1.1. – это достаточные условия неманипулируемости прямых механизмов планирования, которые будут использованы в разделе 3.1 для доказательства неманипулируемости механизма обмена в ОС с веерной структурой взаимодействия агентов.

Стандартная модель теории контрактов [59,64,65,67-70,73-77,79 82,85-89,91,95].

Рассматривается система из центра (principal) и одного АЭ (agent).

Центр продает агенту некий товар в количестве q по цене t. Функция полезности центра (t,q) = t - C(q). Функция C(q) – стоимость производства товара для центра – дважды дифференцируемая выпуклая функция, C`(0)=0, C`()=. Функция полезности АЭ (t,q, ) = u(,q) - t.

= [, ] – положительный параметр, тип АЭ, характеризующий его «вкус». Функция является монотонно возрастающей функцией своих аргументов.

Центру известно множество и вероятностное распределение типа АЭ на этом множестве F().

Задача центра – максимизировать свою полезность.

На основании принципа выявления5 (revelation principle) строится неманипулируемый механизм – «меню» контрактов {q(.),t(.)}, зависящий от сообщаемой АЭ оценки своего типа.

Необходимые условия неманипулируемости механизма имеют следующий вид:

dt u dq ( ) = (q( ), ) ( ) (IC ),d u dq d (IC ) (q( ), ) ( ) q d При выполнении условий Спенса-Мирлиса [91] u q,, (q, ) > 0, доказано, что функция q( ) является неубывающей q функцией своего аргумента.

Принцип выявления – западный аналог принципа открытого управления, сформулированного в ТАС. Для АС с одним АЭ эти принципы эквивалентны [10,53] u Предполагается, чтоq,, (q, ) > 0. Вводится функция прибыли агента при использовании оптимального неманипулируемого механизма в зависимости от его типа - ( ) = u(q( ), ) - t( ). Причем, при выполнении d u условия IC1,, ( ) = (q( ), ) > 0. Поэтому, выполнение d условий индивидуальной рациональности агента (, ( ) 0) может быть обеспечено следующим образом - ( ) = 0, из чего следует, что u ( ) = (q( ), )d, и u t( ) = u(q( ), ) - (q( ), )d.

Задача центра (построение механизма, максимизирующего его прибыль) сводится к решению следующего уравнения:

H dq (q ( ), ) = 0 при условии ( ) 0. Здесь H (q( ), ) = (q( ),t( )).

q d Данный принцип построения неманипулируемых механизмов для решения задач теории контрактов является частным случаем общего принципа построения неманипулируемых механизмов обмена, который будет введен в разделе 1.5.

Обменная экономика Эджворта.[81,85,94,95] Данная модель экономики известна также как экономика чистого обмена (pure exchange economy). Рассматривается система из двух агентов. В системе имеются товары (ресурсы) двух типов в ограниченном количестве, распределенные между агентами. Используя терминологию, введенную в разделе 1.1, 0 1 y y 1 заданы начальное распределение ресурсов y = и ресурсные 0 2 y y 1 0 0 0 1 2 1 2 1 ограничения Y1 и Y2 ( y + y = Y и y + y = Y, y = (y, y ), 1 1 2 2 1 1 2 2 y = (y, y ) ).

1 Каждый из агентов обладает собственными отношениями предпочтения на множестве возможных распределений товаров, заданными неприрывными функциями предпочтения (y ) и ( y ), 1 1 2 которые также строго монотонны и квазивыпуклы (множество значений y для которых (y) (x) выпукло для x ) [28,56,60,81,85,95].

Кроме того, задана рыночная стоимость каждого вида товаров p = ( p, p ), в соответствии с которой определяется рыночная ценность 1 набора товаров каждого из агентов - p y,i =1,2.

i Агенты могут перераспределять между собой ресурс с целью увеличит рыночную стоимость своего набора товаров (с учетом своих предпочтений). Задача заключается в определении оптимальных по Парето распределений ресурсов (распределение ресурсов Парето оптимально, если не существует другого распределения ресурсов, которое не менее предпочтительное для каждого из агентов и более предпочтительное для одного из них) с учетом заданных рыночных цен.

Для исследования описанной выше модели применяется «ящик Эджворта» - графическое отображение на множестве возможных распределений ресурсов (см. рисунок 4.) y А P P y* y Cc Bl y y Ps А y Рис. 4. «Ящик Эджворта» Длины сторон ящика равны общему количеству каждого из видов ресурсов в системе (Y1 и Y2). Левый нижний угол - агент 1, верхний правый – агент 2. Точка y0 – начальное распределение ресурсов в системе, 1 2 1 2 1 (учитывая, что y + y = Y и y + y = Y, берется y = y = (y, y ) ).

1 1 2 2 1 1 2 Кривые Р1 и Р2 - кривые равных предпочтений агентов (y P (y ) = (y ),i =1,2). Заштрихованная область между ними – i i i i i множество распределенй ресурсов, предпочтительных с точки зрения каждого из агентов. Линия Bl - «бюджетная» линия - множество распределений ресурсов, чьи рыночные стоимости эквивалентны (y BL p y = p y ). Кривая Ps - множество оптимальных по Парето распределений ресурсов между агентами. Кривая Сс - контактная кривая (contact curve) – часть кривой Ps, принадлежащая области предпочтительных распределений ресурсов с точки зрения каждого из агентов. Точка y* - точка пересечения кривой Сс и линии Bl – точка равновесного по Вальрасу перераспределения ресурсов между агентами, которая и является искомым рыночным равновесием. Само же равновесие по Вальрасу определяется равновесными ценами p* и равновесным перераспределением ресурсов y*.

Ящик Эджворта может быть широко использован для рассмотрения задач обмена в активных системах, состоящих из двух агентов, и в которых имеется два вида ресурсов. Подобные ОС будут рассмотрены в главе данной работы, а данный графический метод будет использован в дискретном подходе к построению неманипулируемых механизмов обмена.

Механизмы Маскина и МакКельви. Данные механизмы известны, как механизмы, реализующие заданное соответствие группового выбора (СГВ).

Теория реализуемости представляет собой раздел теории управления социально-экономическими системами с сообщением информации.

Наиболее полный обзор существующих результатов теории реализуемости можно найти в [27,53,60,83,84,92,93]. В теории реализуемости исследуется реализуемость соответствий группового выбора, свойства реализующих механизмов [78,80,83,92], модели поведения АЭ в детерминированном случае, и в случае наличия вероятностной неопределенности [87,88] и их влияние на реализуемость СГВ.

Приведем известные условия реализуемости соответствий группового выбора [66,83,90].

Говорят, что механизм G (полностью) реализует СГВ f [66], если для всех R :

1) EG (R) не пусто;

2) g(EG (R)) (=) f (R).

Другими словами, при всех R равновесие существует и в любом из возможных при данном R равновесии s(R) EG (R) принимаемое решение g(s(R)) лежит в f (R).

Говорят, что прямой механизм H = (, h) реализует СГВ f : A достоверно, если R выполнены:

D 1) R EH (R) ;

2) h(R) f (R).

Достоверная реализуемость означает, что сообщение достоверной информации в механизме H является доминантной стратегией, и при сообщении достоверной информации выбирается допустимая для центра альтернатива.

Рассмотрим некоторые свойства соответствий группового выбора, необходимые для исследования реализуемости СГВ.

Рассмотрим бинарное отношение RA над множеством A и некоторую альтернативу a A. Нижним срезом L(a, RA ) отношения RA по a называется множество X A, определяемое следующим образом:

X = {b A : aRAb}. Верхним срезом H (a, RA ) отношения RA по a называется множество X A, определяемое следующим образом:

X = {b A : bRAa}.

Говорят, что СГВ f : A удовлетворяет условию монотонности Маскина (ММ) если {R, R }, a f (R) таких, что a f (R) и i I, L(a, Ri ) L(a, Ri ) выполняется a f (R ).

Содержательно, ММ означает, что, если при некотором профиле предпочтений R одной из альтернатив, выбираемых по СГВ будет альтернатива a f (R), и профиль предпочтений элементов изменятся на R таким образом, что в новом профиле позиция альтернативы a по отношению к другим альтернативам для всех элементов не ухудшается, т.

е. i I, L(a, Ri ) L(a, Ri ), то альтернатива a будет выбираться и при новом профиле предпочтений a f (R ).

Для однозначных соответствий группового выбора (ОСГВ), то есть таких, что R f (R) = 1, определяется следующее свойство ОСГВ f : A удовлетворяет независимой слабой монотонности (НСМ) тогда и только тогда, когда i I, R f (R) H ( f (Ri, R-i ), Ri ).

R Содержательно, НСМ означает, что при сообщении достоверной информации, для всех элементов назначается наилучшая альтернатива, что является аналогом УСС.

Говорят, что СГВ удовлетворяет свойству отсутствия права вето (ОПВ), если a A, i I, R : i j, b A, aR b выполнено j a f (R). То есть, если есть альтернатива a наилучшая с точки зрения всех активных элементов кроме некоторого j, то a f (R).

СГВ f : R A называется диктаторской, если i I такой, что R, a A, a f (R) тогда и только тогда, когда b A, aRib. Это означает, что среди элементов I найдется элемент j такой, что альтернатива a выбирается по СГВ тогда и только тогда, когда для j - го элемента нет никакой другой альтернативы, строго лучшей её.

СГВ f : A называется Парето - оптимальной, если R, {a, b} Aесли i I, aPib, то b f (R). Парето - оптимальность означает, что если какая - то альтернатива b для всех элементов строго хуже альтернативы a, то альтернатива b не может быть выбрана по этой СГВ.

Еще одним важным свойством СГВ является существенная монотонность [66].

Альтернатива a X A называется существенной для активного элемента i I во множестве X если существует профиль предпочтений R такой, что a f (R) и L(a, Ri ) X.

Множество всех существенных для элемента i I во множестве X A обозначим Ess (i, X ).

СГВ f : A называется существенно монотонным если R, R и a f (R) таких, что i I выполняется Ess (i, L(x, Ri )) L(x, Ri ) a f (R ).

Приведем далее результаты, дающие необходимые и достаточные условия реализуемости СГВ при использовании понятий равновесия Нэша и равновесия в доминантных стратегиях. Теоремы 1.3.1-1.3.4 представляют условия реализуемости при использовании определения равновесия в доминантных стратегиях, теоремы 1.3.5-1.3.7 являются условиями реализуемости при использовании определения равновесия Нэша.

Теорема 1.3.1. [53,66]. Для того, чтобы ОСГВ f : A было достоверно реализуемо в доминантных стратегиях, необходимо и достаточно, чтобы оно удовлетворяло НСМ.

Теорема 1.3.2 [53,66]. СГВ f : A достоверно реализуема в доминантных стратегиях тогда и только тогда, когда существует ОСГВ f, удовлетворяющая НСМ, такая, что для всех R, f (R) f (R).

Теорема 1.3.3 [53,66]. Пусть содержит только строгие порядки, СГВ f : A достоверно реализуема в доминантных стратегиях тогда и только тогда, когда f является ОСГВ и удовлетворяет НСМ.

Теорема 1.3.4. [53,66]. Предположим, что включает все возможные строгие предпочтения над A. Тогда не существует ОСГВ f, множество значений которой содержит не менее трех различных альтернатив, которая достоверно реализуема в доминантных стратегиях.

Вместе с теоремой 1.3.2, последний результат утверждает, что ни одно достаточно сложное СГВ не может быть реализовано в доминантных стратегиях, если на множество возможных профилей предпочтений не наложены дополнительные ограничения.

Гораздо более обширен класс СГВ, реализуемых по Нэшу.

Необходимое условие реализуемости СГВ по Нэшу устанавливает следующая Теорема 1.3.5. [53,66]. Если СГВ f : A реализуема по Нэшу, то она удовлетворяет монотонности Маскина.

Для получения достаточных условий реализуемости используют следующий подход. Для исследуемой СГВ определяют в явном виде механизм и доказывают, что он реализует данную СГВ, поэтому одни и те же условия будут фигурировать в различных теоремах, доказывающих реализуемость различными механизмами.

Следующий механизм, реализующий СГВ, удовлетворяющую условиям ММ и ОПВ, был получен Е. Маскиным (E.Maskin). Пусть I множество активных элементов, профили предпочтений которых принимают значения из множества. Задано СГВ f : A. Каждый активный элемент сообщает в центр профиль предпочтений всех элементов из, альтернативу из A и натуральное число. Таким образом для каждого элемента Si = A N и множество возможных сообщений S =. Назовем множеством согласованных сообщений множество S i iI Sa = {s S j I, R, a f (R) : i j, si = (a, R, 0)}.

Множество несогласованных сообщений определим как дополнение к множеству Sa :

Sd = {s S s Sa}.

Таким образом определенные множества Sa и Sd являются разбиением S.

Процедура принятия решения g : S A определяется двумя правилами.

Правило 1.3.1. Если s S, то по определению существуют a j I, R, a f (R) такие, что i j, si = (a, R, 0). Пусть j - ый активный элемент сообщает альтернативу a. В этом случае выбираемая j альтернатива a, при a j Pj a;

g(s) = j a j, при aRa j.

Правило 1.3.2. Если s Sd, то g(s) = ak(s), где k(s) = max{i I zi z, j I}.

j Введенный таким образом механизм назовем механизмом Маскина.

Первое правило определяет действие механизма в случае, когда все активные элементы, кроме быть может одного, сообщают одинаковые профили предпочтений R, одинаковые альтернативы a f (R) и не желают принять участие в лотерее, то есть i j, zi = 0. В этом случае считается, что все кроме j -го элемента сообщают достоверный профиль предпочтений R, соответствующий действительному профилю предпочтений всех элементов, и большинство голосует за альтернативу a. При этом из согласованных сообщений остальных АЭ делается однозначное предположение R о предпочтениях j -го элемента и j выбирается альтернатива, наихудшая для j -го АЭ. Второе правило определяет так называемую целочисленную игру. Если сообщения элементов не согласованны, то любой элемент выбором соответствующего натурального числа может добиться выбора наилучшей для себя альтернативы. Имеет место следующая Теорема 1.3.6 [53,66]. Если I 3 и f : A монотонная по Маскину СГВ, удовлетворяющая ОПВ, то механизм Маскина реализует эту СГВ по Нэшу.

Как видно из определения, в механизме Маскина каждый активный элемент сообщает профиль предпочтений всех элементов, точное знание которого не всегда возможно. Множество возможных сообщений было значительно сужено в работах Сайжо (Saijo) [90] и МакКельви (McCelvey) [83]. Перейдем к описанию введенного ими механизма.

Определим механизм МакКельви следующим образом. Обозначим множество элементов через I = {1,..., n}. Будем считать, что элементы нумеруются по mod n, то есть номер k Z соответствует элементу с номером k (mod n). Каждый элемент i I = {1,..., n} посылает в центр сообщение следующей структуры:

si = (ai, Ai, Bi, ni ), где ai A, и R такое, что либо Ai = L(a, Ri ) и Bi = L(a, Ri+1), либо A = L(a, R ) и Bi =. Таким образом i i Si = A 2A 2A N и S =.

S i iI Для любых s S и j I, обстановка s- j называется f согласованной, если a A и R такие, что 1) a f (R) ;

2) ai = a, i I \{ j};

3) i j, Ai = L(a, Ri) и Bi = L(a, Ri+1).

Процедура принятия решения механизма МакКельви определяется следующими правилами.

Правило 1.3.3. Пусть число элементов I 3, тогда для любого s S если j I такой, что a a и обстановка s- j является f j j- согласованной, то j j j- a, a B ;

g(s) = a j-1, a j B j-1.

Правило 1.3.4. В противном случае, g(s) = ak(s), где k(s) = (mod n).

n i iI Как оказалось, для любой СГВ с количеством активных элементов больше трех верна следующая Лемма 1.3.1. [53,83]. Пусть I 3, тогда для любой СГВ f : A и определенного для неё механизма МакКельви верно N R, f (R) g(EG (R)).

Таким образом, любая СГВ, удовлетворяющая условиям леммы 1.3.1, может оказаться нереализуемой лишь в том случае, когда имеются дополнительные равновесия s такие, что g(s) f (R).

Теорема 1.3.7. [53,83]. Пусть I 3 и пусть f : A монотонное по Маскину СГВ, удовлетворяющее ОПВ, тогда механизм МакКельви реализует по Нэшу СГВ f.

Принципы построения механизмов Маскина и МакКельви, используются при простроении «консолидированных» механизмы обмена для ОС типа цепочка, рассматриваемых в разделе 3.2.

Завершив обзор основных результатов ТАС и микроэкономической теории, применимых для построения неманипулируемых механизмов обмена в активных системах, перейдем к формулировке общего метода построения неманипулируемых механизмов обмена для ОС 1.5. Общий метод построения неманипулируемых механизмов обмена в активных системах Обменная схема состоит из n+1 агентов (Центр и n активных элементов) и m видов ресурсов. Заданы функции полезности АЭ, m+ зависящие от вектора трансфертов ресурсов f (x,r ) : R R, r, i i i i i i = 1,..., n. Параметр ri – тип элемента, характеризующий некоторым образом его функцию полезности.

Агенты ОС информированы ассиметрично – центр знает все параметры схемы, кроме значений типов АЭ – ему известны лишь множества возможных значений и, быть может, вероятностное распределение типа на множестве возможных значений.

Информированность АЭ не существенна для общего метода построения неманипулируемых механизмов обмена.

Данный прием является стандартным для введения внутренней неопределенности в систему [10-12,18,22,29,45,53,57,59,64,65,81,82,86,91], и достаточно легко трактуется на качественном уровне – в большинстве задач ТАС тип активного элемента отражает его ценность с точки зрения центра – чем выше тип, тем лучше этот элемент для центра (тем большую полезность центр может получить от взаимодействия с таким элементом).

Задача центра – построить механизм обмена x= (s), максимизирующий некий функционал (целевую функцию центра) Ф( s,x) :

K(s) = min (s, (s)) max, s ( s ) где s = (s,..., s ) - вектор заявок АЭ. АЭ сообщают центру оценки своих 1 n типов, то s,i =1,n - т.е ищется прямой механизм обмена.

i i Порядок функционирования механизма обмена стандартен для механизмов планирования:

Центр объявляет механизм обмена (s);

АЭ сообщают центру свои заявки s = (s,..., s ) ;

1 n Центр назначает обмен x = (s).

Механизм обмена ищется в классе прямых неманипулируемых механизмов – т.е. механизмов, для которых доминантной стратегией каждого АЭ будет сообщение истинной заявки - s = (r,..., r ).

1 n Введем ограничения, необходимые для общего решения поставленной задачи. Прежде всего это ограничения на вид функции полезности АЭ.

Нам необходима непрерывность функции полезности, существование и непрерывность ее частных производных вплоть до второго порядка по всем переменным. Кроме того частная производная функции полезности по типу АЭ должна быть монотонна, например f i (F1) (x, r ) 0, i = 1, n, r.

i i i i r i Кроме того, решение поставленной задачи сильно упрощается, если мы используем условия Спенса-Мирлиса – постоянство знака смешанной 2 i производной f / x r [91], например такое: i, l(i), такое, что i j i f i (F2а) r,x, (x,r ) > 0, i i i i i i x r l i и f i i (F2b) i, j l(i), r, x, (x, r ) 0.

i i j i i i x r l i Также, необходимо записать условия индивидуальной рациональности (ИР) для всех АЭ. Без потери общности, можно предложить простейшие условия – прибыль любого АЭ (значение функции полезности) должна быть неотрицательна.

Ограничения на ресурсы и возможность взаимодействия между агентами схемы не уточняются, хотя они безусловно отразятся на конечном решении задачи для конкретных моделей. Кроме того, множество возможных вариантов обмена непусто (это следует из постановки задачи – мы сразу рассматриваем обменную схему).

Прямой неманипулируемый механизм должен отвечать условию совершенного согласования (УСС)[52]:

f (x,s ) = max f (z,s ) i i i i i zXi ( s-i ) X (s ) - Множество возможных трансфертов для i-го АЭ при i -i фиксированном векторе сообщений остальных АЭ s-i.

Введем функцию зависимости прибыли i-го АЭ от значения собственного параметра ri, своей заявки si, и заявки остальных участников обменной схемы s-i:

V (r, s, s ) = f (x (s, s ), r ).

i i i -i i i i -i i УСС можно проинтерпретировать следующим образом:

V i (r, r, s ) = i i -i s i (1)r, s, V i i -i -i i (r, r, s ) i i -i s i Из первого условия (1а) очевидным образом следует, что i m dx f j i (2) (x (r, s ), r ) (r, s ) = 0.

i i -i i i -i i j =1 x dr j i Лемма 1. Условие (1b) r,s эквивалентно неравенству i i -i -i i m dx f j i (3) (x (r, s ), r ) (r, s ) 0.

i i -i i i -i i j =1 x r ds j i i Доказательство. В развернутом виде, условие (1b) записывается следующим образом:

i 2 i m m dx f dx j i l [ (x (r,s ),r ) (r,s ) (r,s ) + i i -i i i -i i -i i i j=1 l=1 x x ds ds j l i i (4) 2 i d x f j i + (x (r,s ),r ) (r,s )] 0.

i i -i i 2 i -i i x ds j i Продифференцировав выражение (2) по ri, получаем:

i 2 i m m dx f dx j i l [ (x (r,s ),r ) (k,s ) (r,s ) + i i -i i i -i i -i i i j=1 l=1 x x ds dr j l i i i dx f j i (5) + (x (r,s ),r ) (r,s ) + i i -i i i -i i x r ds j i i 2 i d x f j i + (x (r,s ),r ) (r,s )] = 0.

i i -i i i -i i x ds dr j i i Очевидно, что i i dx dx j j (r, s ) = (r, s ).

i -i i -i ds dr i i Вычитая из равенства (5) неравенство (4) получим выражение (3).

Теорема 1. В рамках введенных предположений следующие условия:

i m dx f j i 1. (x (r, s ), r ) (r, s ) = 0.

i i -i i i -i i j =1 x dr j i i m dx f j i 2. (x (r, s ), r ) (r, s ) 0.

i i -i i i -i i j =1 x r ds j i i 3.Все компоненты планов, назначаемых центром каждому АЭ изменяются монотонно в зависимости от заявки данного АЭ:

i dx i j i, j, s, s, x, (s, s ) 0.

i i -i -i j i -i ds i достаточны для неманипулируемости механизма обмена. Т.е глобальный максимум любого из f ( (s, s ), r ) достигается при s = r.

i i - i i i i Доказательство. Требования 1 и 2 данной теоремы – это необходимые и достаточные условия существования локального максимума функции V (r, s,s ) при s = r.

i i i -i i i Рассмотрим следующее выражение:

i m dx V f j i i (r, s, s ) = (x (s, s ), r ) (s, s ).

i i -i i i -i i i -i i s j =1 x ds i j i Учитывая (1), можно записать i m dx V f f j i i i (r, s, s ) = (x (s, s ), r ) - (x (s, s ), s ) (s, s ).

i i -i i i -i i i i -i i i -i i i s j =1 x ds x i j j i Знак левой части данного выражения определяется i m dx f j i (6) (r - r ) (x (r, s ), r ) (s, s ).

i i i i -i i i -i i j =1 x k ds j i i где r лежит между r и s.

i i i Анализируя (6), видно, что при выполненных условиях Спенса Мирлиса (F2а) и (F2b)6 и при i dx i j i, j, s, s, x, (s, s ) 0 функция V (r, s, s ) не i i -i -i j i -i i i i -i ds i убывает при r < s, и не возрастает при r > s. Т.е глобальный максимум i i i i любого из f ( (s, s ), r ) достигается при s = r.

i i - i i i i Условия 1 и 2 теоремы 1 можно классифицировать как необходимые условия неманипулируемости механизма обмена. Условие 3 является достаточным для неманипулируемости механизма обмена при выполеных условиях 1 и 2.

При выполнении данных условий, обозначим прибылькаждого АЭ (r, s ) = f ( (r, s ), r ).

i i - i i i - i i Очевидно, что, с учетом (2):

Необходимо заметить, что если в условиях (F2а) и (F2b) взять произвольные знаки неравенств, то смысл теоремы 1 не изменится. Изменятся лишь знаки неравенств для соответствующих i dx / ds (s, s ).

j i i -i d f i i (7) (r, s ) = (x (r, s ), r ).

i -i i i -i i dr r i i В соответствии с (F1) выражение (7) положительно. В литературе функция (r, s ) называется «информационной рентой» АЭ [91]. Из (7) i i -i видно, что данная рента является возрастающей функцией от типа АЭ. Т.е., чем лучше тип АЭ, тем большую прибыль он получает от неполной информированности центра о своем типе.

Так как в нашей модели условия индивидуальной рациональности (ИР) не зависят от типа АЭ, можно нормализовать минимальную прибыль для каждого АЭ, и записать ИР следующим образом:

(8) i, r, s, (r, s ) 0.

i i -i -i i i -i Механизм ОУ следует создавать таким образом, что бы прибыль любого АЭ, в случае, если его тип окажется наихудшим из возможных для него, была минимальна, т.е. не нарушала требования ИР:

i, s, (r, s ) = 0.

i -i -i i -i Следовательно, с учетом (7):

ri f i (9) (r,s ) = (x (,s ), )d.

i i -i i -i r ri i Выражение (9), вместе с теоремой 1 являются основными результатами данного раздела. Они позволяют определить семейство механизмов, в которых доминантой стратегией АЭ является сообщение истинных заявок. Данные результаты получены из анализа УСС для АЭ.

Задача центра - выбрать из полученного семейства механизмов оптимальный по заданному критерию. Конечное решение для каждой задачи будет зависеть от вида критерия оптимальности, вида функций полезности агентов, ограничений на ресурсы в системе, ограничений на взаимодействия между агентами и т.д.

Кратко сформулируем результаты первой главы. В разделе 1. разработана теоретико-игровая модель обменной схемы, в рамках которой обмен определен как процесс перераспределения ресурсов между участниками активной системы, а обменная схема (множество вариантов обмена) – как совокупность всех индивидуально рациональных распределений ресурсов, достижимых в рамках заданных ограничений на ресурс взаимодействие между агентами.

В разделе 1.2 задача обмена сформулирована как задача управления в активной системе. В разделе 1.3 обоснована актуальность рассмотрения задач теории активных систем (ТАС) как задач обмена. Приведен сравнительный анализ классификации активных система (АС) и классификации ОС. В раздел 1.4 рассмотрены основные математические модели и методоы, которые могут быть использованы для построения неманипулируемых механизмов для ОС. В разделе 1.5 дана общая постановка задачи построения неманипулируемых механизмов обмена для АС с неполной информированностью центра. Сформулирован общий метод построения неманипулируемых механизмов обмена в активных системах с неполной информированностью центра;

получены необходимые и достаточные условия неманипулируемости механизмов обмена.

ГЛАВА II. НЕМАНИПУЛИРУЕМЫЕ МЕХАНИЗМЫ ОБМЕНА В ДВУХЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ В данной главе производится анализ «базовых» обменных схем – схемы, состоящих из двух агентов (рисунок 5).

Рис. 5. «Базовая» обменная схема Относительная простота задач, сформулированных на основе данных ОС, наглядность их решения, возможность представления немалого числа фундаментальных задач из области математической экономики виде подобных ОС – все это делает изучение простейших обменных схем крайне актуальным. В разделе 2.1 строится модель ОС, соответствующая модели АС для задача стимулирования. Доказывается эквивалентность решений детерминированных задач стимулирования и обмена для соответствующей ОС. Осуществляется переход от детерминированной ОС к ОС с внутренней неполной информированностью центра – вводится тип АЭ, не известный центру. Формулируются условия на зависимость функции предпочтения АЭ от типа, при выполнении которых возможно применение общего метода построения неманипулируемого механизма обмена.

Раздел 2.2 посвящен построению механизмов ОУ в двухэлементных ОС с внутренней неполной информированностью. Рассматриваются дискретный и непрерывный методы построения механизмов ОУ.

Дискретный метод построения неманипулируемых механизмов обмена основан на «графическом» анализе функций предпочтения агентов.

Непрерывный метод является частным случаем предложенного в разделе 1.5 общего метода построения неманипулируемых механизмов обмена.

Доказана эквивалентность двух предложенных методов.

Раздел 2.3 посвящен решению двухэлементных задач обмена без иерархии. Предлагается метод решения подобных задач, основанный на механизмах ОУ для аналогичных двухэлементных иерархических ОС.

Агенты самостоятельно распределяют между собой роли Ц и АЭ.

Определяется распределение ролей в зависимости от параметров ОС для «квазиинтеллектуальных» (не производящих анализ сообщений оппонента) и «интеллектуальных» (анализирующих сообщения оппонента) агентов.

Полученные автором результаты, содержащиеся в данной главе, были опубликованы в работах [33,34,36,39,41].

2.1. Представление задачи стимулирования в виде задачи обмена Рассматривается задача стимулирования в АС, состоящей из центра (Ц) и одного активного элемента (АЭ) [18,45,53]. Целевая функция центра (, y) представляет собой разность между его доходом H(y) и стимулированием (y) АЭ. Целевая функция АЭ f(, y) - разность между стимулированием, получаемым от центра, и затратами c(y):

(10) (, y) = H(y) - (y);

(11) f(, y) = (y) - c(y).

y Y - действие АЭ.

Относительно параметров АС принимаем стандартные предположения [18,45,53]:

А.1. 1) функция c() непрерывна по действию АЭ;

2) y Y c (y) 0;

3) y Y, c (y) 0;

4) c(0) = 0.

А.2. Функции стимулирования кусочно-непрерывны и принимают неотрицательные значения.

А.3. Функция дохода центра непрерывна по всем переменным и достигает максимума при ненулевых действиях АЭ.

Задача синтеза оптимальной функции стимулирования заключается в * поиске допустимой системы стимулирования, имеющей максимальную гарантированную эффективность K( ) = min (, y), определяемую как yP( ) гарантированное значение целевой функции центра на множестве решений игры Р( ) = arg max f(,y):

yY * (12) = arg max K( ), M где М - множество систем стимулирования, удовлетворяющих предположению А.2.

В [45,52] доказано, что решение задачи стимулирования в рассматриваемой модели имеет вид * * c( y ), y = y (13) ( y) =, * 0, y y где (14) y* = arg max {H(y) – с(y)}.

yY Для рассмотрения действия АЭ как некоего ресурса, область его возможных значений Y можно задать как отрезок [0,Y2]. Сформулируем описанную задачу как задачу обмена. Схема состоит из двух участников (центр и АЭ), один из которых - организатор обмена (центр) обладает полной информированностью о параметрах обменной схемы. В схеме имеются ресурсы двух типов – «деньги» и «действие». Наложены 0 1 0 ресурсные ограничения A = {y + y = Y ;

y + y = Y } 1 1 2 1 Функция предпочтения центра записывается следующим образом:

0 0 0 (15) (y, y ) = y + H (y ).

1 2 1 Функция предпочтения АЭ:

1 1 1 (16) (y, y ) = y - c(Y - y ).

1 2 1 1 Ограничения индивидуальной рациональности достаточно просты – IR(y0)={i = 0,1, (y ) (y )}.

i i i i Ограничений на возможность взаимодействия между Ц и АЭ также нет – они могут осуществлять между собой трансферты ресурсов всех типов, присутствующих в модели.

Начальное распределение ресурсов задано следующим образом - весь ресурс первого типа сосредоточен у центра, весь ресурс второго типа – у Y АЭ: y =.

0 Y Значения Y1 и Y2 выбираются таким образом, что бы рассматриваемая модель могла соответствовать определению обменной схемы.

Запишем функции прибыли от обмена для центра:

(17) f (x, x ) = (Y - x, x ) - (Y,0) = H (x ) - x ;

0 1 2 0 1 1 2 0 1 2 для АЭ:

(18) f (x, x ) = (x,Y - x ) - (0,Y ) = x - c(x ).

1 1 2 1 1 2 2 1 2 1 Следует отметить, что заданные ограничения ИР можно достаточно просто выразить через функции прибыли агентов от обмена:

IR={ f (x) 0;

f (x) 0 }.

0 Из чего следует, что множество возможных вариантов обмена задается следующими условиями:

(19)Х= { x = (x, x ) : x [0,Y ] [c(x ), H (x )];

x [0,Y ] arg{H (x ) - c(x ) 0}} 1 2 1 1 2 2 2 2 2 Стандартный порядок функционирования в задаче стимулирования [52] в терминах обменных схем можно сформулировать следующим образом: центр предлагает АЭ некоторый набор вариантов обмена, из которых АЭ выбирает наиболее выгодный с его точки зрения.

Предположим, что целью центра является максимизация его функции полезности от обмена. Также примем, что в данной ОС выполнена гипотеза благожелательности относительно поведения АЭ, заключающаяся в том, что АЭ выбирает из множества решений игры альтернативу, наиболее предпочтительную с точки зрения центра [18,45,52].

Утверждение 1. Решение задачи обмена в рассматриваемой ОС эквивалентно решению задачи стимулирования.

Д о к а з а т е л ь с т во. Найдем точку x = (x, x ), в которой 1 достигается max f (x).

В соответствии с принципом индивидуальной рациональности для АЭ имеем:

(20) x1 c(x2).

Поэтому можно записать, что (21) f (x, x ) H(x2) - c(x2).

0 1 Следовательно для центра оптимальным будет обмен в точке x = (x, x ), где 1 (22) x = arg max {H (x ) - c(x )}, 2 2 x2[0,Y2 ] что эквивалентно (14), а x1*= c(x2*), что эквивалентно (13).

Итак, предположим, что целью центра является максимизация его функции полезности от обмена. Также примем, что в данной ОС выполнена гипотеза благожелательности относительно поведения АЭ, заключающаяся в том, что АЭ выбирает из множества решений игры альтернативу, наиболее предпочтительную с точки зрения центра [18,45,52].

Предположим, что целью центра является максимизация его функции полезности от обмена. Также примем, что в данной ОС выполнена гипотеза благожелательности относительно поведения АЭ, заключающаяся в том, что АЭ выбирает из множества решений игры альтернативу, наиболее предпочтительную с точки зрения центра [18,45,52].

Утверждение 1 устанавливает эквивалентность задачи стимулирования задаче обмена в детерминированных АС при некоторых требованиях к множествам возможных значений трансфертов ресурсов.

Приведенное выше решение детерминированной задачи обмена можно изобразить графически, используя ящик Эджворта. На левой части рисунка 6 он изображен в «классическом» виде – в координатах ресурсов с изображением линий равных предпочтений для каждого из агентов. На правой части рисунка 6 он изображен в преобразованном виде – в координатах трансфертов, с изображением линий равной полезности для каждого агентов.

х АЭ y y* 1( y) = 1( y0 ) f0 (x) = f1 ( x) = х* 0 (y) = 0 (y0 ) Ц х Рис. 6. Задача стимулирования как задача обмена На обоих рисунках кривые f (x) = 0 (или ( y) = ( y ) ) и f (x) = 0 0 0 (или ( y) = ( y )) характеризуют ограничения ИР для центра и АЭ 1 соответственно. Затемненная область показывает множество возможных вариантов обмена. Точка x = (x, x ) (или у*), являющаяся решением 1 рассматриваемой выше задачи, лежит на кривой f (x) = 0, показывая, что прибыль АЭ от обмена нулевая. АЭ соглашается на данный обмен только благодаря введенной гипотезе благожелательности.

Введем неопределенность в рассматриваемую модель ОС, следующим образом. Пусть функция затрат АЭ зависит от параметра r*, который может принимать значения из интервала = [rmin,rmax]. Точное значение данного параметра известно АЭ, а центр знает лишь диапазон возможных его значений (с некоторого момента далее мы будем считать, что центр также знает вероятностное распределение параметра на данном отрезке).

Задачей центра является поиск вариантов обмена, максимизирующих некий критерий эффективности – критерий эффективности обмена K(x1,x2).

Это полностью соответствует постановке задачи построения механизма ОУ для ОС, введенной в предыдущей главе.

Для решения поставленной задачи необходимо уточнить вид функции полезности от обмена для АЭ. Для этого введем следующие предположение относительно функции c(y,r):

А.4. r, х2 Х 1) c(х2,r) непрерывна по r;

dc(x,r) 2) < 0;

dr d c(x,r) 3) < 0;

dx dr 4) c(х2,r) удовлетворяет А.1.

Содержательно, данное условие прежде всего показывает, что, чем больше значение типа АЭ, тем меньше его затраты на выполнение одного и того же действия.

Лемма 2. Условие А.4. обеспечивает выполнение условия F1 и F2 для функции прибыли от обмена АЭ f (x, x,r).

1 1 Доказательство. Т.к f (x, x,r) = х1 - c(х2,r), то, с учетом А.4.

1 1 f (x, x,r) dc(x,r) 1 1 2 r, х Х = - > 0, r dr т.е. выполнено F1. Также, из А.4. следует f (x, x,r) d c(x,r) 1 1 2 r, х Х = - > 0, x r dx dr 2 что соответствует F2a. Также очевидно, f (x, x,r) 1 1 r, х Х = 0, x r что соответствует F2b.

Следовательно, для построения механизма ОУ для данной обменной схемы можно использовать общий метод построения неманипулируемых механизмов обмена, полученные в главе 1.

2.2. Построение эффективных и неманипулируемых механизмов обмена для двухэлементных иерархических обменных схем Дискретный подход. Рассмотрим случай, когда параметр r (тип АЭ) может принимать только два “граничных” значения, т.е. АЭ может быть двух типов - с функцией затрат c(y,r0) или с c(y,r1), где r0 = rmin, r1 = rmax.

Рисунок 7 иллюстрирует “графический” метод построения неманипулируемого механизма обмена. На рисунке изображен преобразованный ящика Эджворта в координатах трансфертов. Линия f (x) = 0 задает ограничения ИР для центра, линии f (x,r ) = 0 и 0 1 f (x, r ) = 0 для АЭ соответствующих типов. Для каждого из возможных 1 i i i типов АЭ выбирается точка на множестве Х - r x = (x, x ).

i 1 Рис. 7. «Графический» метод Точка для наихудшего типа АЭ (в нашем случае наименьшего) выбирается на кривой f (x, r ) = 0, точка для наилучшего типа АЭ 1 выбирается на кривой f (x, r ) = C, так чтобы f (x, r ) = C. Учитывая вид 1 1 1 1 1 функции полезности АЭ, получим (23) x10 = c(x20,r0);

(24) x11 = c(x21,r1) + C1;

(25) С1= c(x20,r0) – c(x20,r1).

Значения величин x20 и x21 определяются из решения задачи нелинейного программирования:

(26) x2i = arg max K(x1(x2),x2,ri), 0 x2i Y2, 0 x1i Y1, i=0,1, x где K() – критерий эффективности, т.е. действие АЭ x2i должно быть оптимальным (с точки зрения центра) при условии, что в обмене участвует АЭ типа ri. На критерий эффективности необходимо наложить следующие требования:

А.5 В детерминированной ОС, соответствующей рассматриваемой ОС с неопределенностью, решение задачи обмена с критерием K() эквивалентно решению детерминированной задачи, т.е. при r0 = r1 (26) и (20) дают одинаковое значение x2.

Данное требование всего лишь обеспечивает возможность анализа задач с неопределенностью путем экстраполяции их к детерминированным задачам. Например, если целью центра является максимизация ожидаемой прибыли от обмена (критерием эффективности является ожидаемая полезность центра Ef0), и он имеет некоторую информацию о вероятностном распределении типов АЭ - pi, i = 0,1, p0 + p1 = 1, то можно записать:

x2i = arg max {(H(x20 ) – c(x20,r0)) p0 + (H(x21) – c(x21,r1) – C1) p1}, i = 0,1.

x Собственно сам механизм таков – АЭ сообщает центру оценку s=ri i i i своего типа, центр назначает АЭ обмен x = (x, x ) 1 Для предложенного «графического» метода справедлива следующая лемма.

Лемма 3. Для сообщения АЭ истинной оценки своего типа необходимы следующие ограничения:

0 (27) x x, j =1,2.

j j Доказательство. Принцип построения механизма, который выражен в (23) - (25) требует, что бы 0 f (x, x,r ) = 0 ;

1 1 2 0 0 1 f (x, x,r ) = f (x, x,r ) = C.

1 1 2 1 1 1 2 1 Из (23) - (25) также следует 1 1 1 1 0 f (x, x,r ) = [c(x,r ) - c(x,r )] - [c(x,r ) - c(x,r )] 1 1 2 0 2 1 2 0 2 1 2 Из условия А.4 (точнее, его трактовки в дискретном случае) следует, 1 0 1 0 0 что c(x,r ) - c(x,r ) c(x,r ) - c(x,r ) при x x.

2 0 2 0 2 1 2 1 2 0 1 0 1 0 Также, из (23) - (25) и А.4 получаем, что x = x при x = x, x > x 1 1 2 2 1 0 1 0 1 0 при x > x, x < x при x < x.

2 2 1 1 2 1 1 0 Получается, что f (x, x,r ) 0 при x x, j =1,2, и 1 1 2 0 j j 1 1 0 f (x, x,r ) > 0 при x > x, j =1,2 соответственно. С учетом гипотезы 1 1 2 0 j j благожелательности получаем, что при выполнении (27) АЭ будет сообщать истинную оценку своего типа ri.

Из (23) - (25) видно, что, если x20 = x21, то x10 = x11. Т.е. для АЭ разных типов назначается одинаковый план. Данная ситуация не противоречит принципу открытого управления, так как, с учетом гипотезы благожелательности, АЭ будет сообщать свой истинный тип, что следует из леммы 3.

Итак, (23) - (25) с учетом требования (27) дают решение поставленной нами задачи при условии, что возможны только два типа АЭ. При увеличении количества возможных значений типов АЭ принцип построения механизма обмена не меняется. Запишем множество возможных типов АЭ: = (r0,r1,…,rn), r0 = rmin, rn = rmax. Тогда для пары i i i x = (x, x ), i = 0,n по аналогии с (23) - (26) можно выписать следующие 1 условия:

(28) x1i = c(x2i,ri) + Ci, i = 0,n ;

i j-1 j- (29) Сi= (c(x,r ) - c(x,r )), C0=0, i = 0,n ;

2 j-1 2 j j= (30) x2i = arg max K(x2,ri), 0 x2i Y2, 0 x1i Y1, i = 0,n.

x При сообщении АЭ заявки s = ri центр назначает ему план обмена i i i x = (x, x ). Также сохраняется требования (27):

1 i-1 i (27а)i =1,n, x x, j =1,2.

j j Также, очевидно, что если совпадение одной из компонентов плана для разных типов АЭ означают, что планы для данных типов АЭ эквивалентны (можно сказать, что с точки зрения центра данные типы АЭ эквивалентны) Теорема 2. Если выполнена гипотеза благожелательности, то доминантной стратегией АЭ в предложенном механизме обмена будет сообщение истинной оценки своего типа. Т.е. s = r*.

Доказательство. Запишем прибыль АЭ типа i (r* = ri) - f (x, x,r ) 1 1 2 i при выполнении им плана, предлагаемого для типа j (s = rj), используя (28) и (29):

j j j i (31) f (x, x,r ) = c(x,r ) + C - c(x,r ).

1 1 2 i 2 j j 2 i Из (31) получаем, что f1(x1i,x2i, ri) = Ci. Также из (31) и (29) следует, что i-1 i-1 i-1 i f (x, x,r ) = c(x,r ) + C - c(x,r ) f1(x1i-1,x2i-1, ri)= Ci. Для случая j 1 1 2 i 2 i-1 j 2 i = i + 1 (31) с учетом (29) (выразив Ci+1 через Ci) можно записать:

i+1 i+1 i+1 i i i+ (32) f (x, x,r ) = C + c(x,r ) - c(x,r ) + c(x,r ) - c(x,r ).

1 1 2 i i 2 i+1 2 i+1 2 i 2 i Из условия А.4, с учетом (27а), очевидно, что i+1 i i+1 i c(x,r ) - c(x,r ) c(x,r ) - c(x,r ).

2 i 2 i 2 i+1 2 i+ i+1 i+1 i i Следовательно, f (x, x,r ) f (x, x,r ).

1 1 2 i 1 1 2 i Аналогично, можно показать, что j = i +1,n j j i i f (x, x,r ) f (x, x,r ).

1 1 2 i 1 1 2 i Для случая j = i - 2 (31) с учетом (29) (выразив Ci-2 через Ci) можно записать:

i-2 i-2 i-2 i-2 i-1 i- (33) f (x, x,r ) = C + c(x,r ) - c(x,r ) + c(x,r ) - c(x,r ).

1 1 2 i i 2 i-1 2 i 2 i 2 i- Из условия А.4, с учетом (27а), очевидно, что i-1 i-2 i-1 i- c(x,r ) - c(x,r ) c(x,r ) - c(x,r ).

2 i-1 2 i-1 2 i 2 i i-2 i-2 i i Следовательно, f (x, x,r ) f (x, x,r ).

1 1 2 i 1 1 2 i По аналогии с (П.4) можно показать, что j = 0,i - j j i i f (x, x,r ) f (x, x,r ).

1 1 2 i 1 1 2 i Из приведенных выше рассуждений следует, что АЭ типа ri получает максимальную прибыль от обмена при сообщениях s = ri и s = ri-1.

Учитывая гипотезу благожелательности, получаем, что АЭ типа ri сообщит s = ri, потому что из двух эквивалентных планов он выберет лучший для центра, т.е. (x1i, x2i).

Т.е. построенный механизм обмена (s) = (x (s), x (s)), определяемый 1 (28) - (30), является механизмом открытого управления. Учитывая, что для двухэлементных задач поиск механизмов планирования можно ограничить классом механизмов ОУ [52], получаем, что дискретный метод позволяет найти механизм обмена максимальной эффективности.

Задача 1. Построить эффективный и неманипулируемый механизм обмена для ОС, рассмотренной в разделе 2.1. Функция полезности центра x от обмена f (x, x ) = x - x. Функция полезности АЭ - f (x, x ) = x -.

0 1 2 2 1 1 1 2 2r Критерий эффективности центра - максимизация ожидаемой полезности от обмена Ef0( (s)) max. Множество возможных значений типа АЭ – ( s) n+1 точек на отрезке [rmin,rmax], r0 = rmin>0, rn = rmax.

Функция затрат АЭ имеет следующий вид x c(x,r) =.

2r Данная функция удовлетворяет требованиям А.4. r, х > x 1) непрерывна по r и по х;

2r dc(x,r) x 2) = - < 0;

dr 2r d c(x,r) x 3) = - < 0;

dxdr r dc(x,r) x 4) = > 0;

dx r d c(x,r) - 5) = r > 0.

dx i i Следовательно, можно построить механизм ОУ (i) = (x, x ). Из (28) 1 и (29) получаем.

j i- x 1 Сi= ( - ), i=1, n, C0=0;

j=0 2 r r j j+ i x x1i = + Ci, i = 0, n.

2r i Механизм должен максимизировать ожидаемую прибыль центра при ограничениях 0 x2i Y2, 0 x1i Y1, i = 0, n. Т.е. необходимо решить задачу нелинейного программирования:

L L L L (x, ) 0;

(x, ) 0;

(x, )x = 0;

(x, ) = 0;

2 2 2 2 x x 2 x 0, 0.

Здесь n 0 n i i x = (x,..., x ), = (,..., ), L = Ef + [ (Y - x ) + (Y - x )].

2 2 2 0 2n+1 0 2i 2 2 2i+1 1 i= Учитывая, что 2 i n n n-1 n x p 1 1 x i i i n 2 i Ef () = p (x -x ) = p x - ( + ( - ) p ) + p (x - ) 0 i 2 1 i 2 n j i=0 i=0 2 r r r j=i+1 2r i i i+ n получим:

p i i n n i ~ (34) x = min(, x,Y ), i=0, n - 1, x = min(r,~,Y );

x 2 2 2 2 n 2 n n 1 p - p j j r j=i r j=i+ i i+ 1/ i- r r i j ~ i i x =, i=0, n ;

2rY - (r - r )x 2 i 1 j= j j+ 2 2 i j i- x x 1 1 x i 2 2 (35) x = + ( - ), i=1, n, x =.

1 2r j=0 2 r r 2r i j j+1 i ~ Точки x, i=0, n - значение трансферта типа 2 при выходе на ограничение x1i Y1. Очевидно, что если для некого типа АЭ rl данное l ~ ограничение вступает в силу (x2l= x ), то для всех j=l + 1, n x2j= j l ~ ~ x = x.Т.е. планы для всех типов АЭ, начиная j и лучше, совпадают. При 2 этом планы для типов АЭ, хуже j остаются неизменными.

Если распределение типа АЭ взять равномерным - p =, то (34) i n + можно переписать следующим образом:

- - i n - i n + i i n n x = min( -,~,Y ), i=0, n - 1, x = min(r,~,Y ).

x x 2 2 2 2 n 2 r r i i+ Задача 2. Построить эффективный и неманипулируемый механизм обмена для ОС с линейными функциями полезности Ц и АЭ:

(36) f (x, x ) = x - cx ;

0 1 2 2 (37) f (x, x ) = rx - x.

1 1 2 1 Данный вид функций полезности используется чаще всего при описании процессов обмена между крупными промышленными предприятиями. Задача центра – максимизация гарантированной f ( (s)) относительной прибыли от обмена min max. Множество det s max f (s) возможных значений типа АЭ – n+1 точек на отрезке [rmin,rmax], r0 = rmin>0, rn = rmax.

Распределение ресурса в схеме такое же, как в рассмотренном выше примере - весь ресурс первого типа Y1 сосредоточен у центра, весь ресурс второго типа Y 2 – у АЭ. Причем существенным будем считать ограничение на ресурс первого типа.

n 1 µ i i n i Механизм имеет следующий вид: x = µ Y (r - c(1- )), x = Y, 2 1 1 i i µ n i r - r i - µ = (1 + ), i=0, n.

j n j=1 r - c Получив механизм ОУ для задачи обмена в схеме из двух участников с внутренней неопределенностью в случае дискретного распределения возможных типов АЭ, перейдем к рассмотрению непрерывного случая распределения.

Непрерывный подход к построению эффективного и неманипулируемого механизма обмена для «базовых» ОС основан на методе, изложенном в разделе 1.5.

В непрерывном случае область возможного значения типа АЭ будет задаваться как отрезок - = [rmin,rmax]. Получаем, что механизм ОУ (s) = (x (s), x (s)) должен удовлетворять следующим требованиям:

1 dx c dx 1 (r) - (x (r),r) (r) = 0;

dr x dr c dx (x (r),r) (r) 0.

x r dr Обе компоненты плана являются неубывающими функциями своего dx dx 1 аргумента s, (s ) 0, (s ) 0.

ds ds Так как наихудшим из возможных типов АЭ является тип rmin, то, с учетом условий ИР (r ) = 0. Выражение (9) для рассматриваемого 1 min случая запишется следующим образом:

r c (38) (r) = - (x ( ), )d.

1 r rmin Учитывая, что (r ) = x (r) - c(x (r),r), 1 1 можно сделать замену переменных r c (39) x (r) = c(x (r),r) - (x ( ), )d, 1 2 r rmin которая позволяет свести задачу построения механизма ОУ к решению следующей задачи.

(40) x2(r) = arg max K(x1,x2,r), 0 x2(r) Y2, 0 x1(r) Y1.

x Произведем проверку эквивалентности дискретного и непрерывного решений рассматриваемой задачи. Переменная n отражает мелкость разбиения множества = [rmin,rmax]:

r - r max min r = r, r = r + i, i =1...n, =.

0 min i n Справедлива следующая лемма Лемма 4. (r ) = limC, где Ci определяется из (29), (r ) - из (38).

i i i n Доказательство. Выражение (29) можно переписать следующим образом:

i- j-1 j- Сi= (c(x,r ) - c(x,r + )), C0=0, i = 0...n.

2 j-1 2 j- j= Очевидно, что c j-1 j-1 j- lim(c(x,r ) - c(x,r + ))= - (x,r )dr.

2 j-1 2 j-1 2 j- r i i Учитывая, что x соответствует r, т.е x = x (r ), получаем, что 2 i 2 2 i r c limC = limC = - (x ( ), )d.

i i n r rmin Как следствие леммы 4, получаем, что при n, выражения (28) и (39) эквивалентны. Т.е. решение задачи в дискретном случае соответствует решению задачи в непрерывном случае. Проиллюстрируем полученное решение на примере.

Задача 3. Построить эффективный и неманипулируемый механизм обмена для ОС, рассмотренной в разделе 2.1. Функция полезности центра x от обмена f (x, x ) = x - x. Функция полезности АЭ - f (x, x ) = x -.

0 1 2 2 1 1 1 2 2r Критерий эффективности центра Ef0( (s)) max. Множество ( s) возможных значений типа АЭ –отрезок [rmin,rmax], rmin>0.

Функция затрат АЭ имеет следующий вид x c(x,r) =.

2r Как было показано в примере 3, данная функция затрат удовлетворяет требованиям А.4. В соответствии с (39) получаем 2 r x (r) x ( ) 2 x (r) = + d.

2r rmin Задача динамического программирования, которую необходимо решить для построения механизма ОУ:

rmax 2 r x (r) x ( ) 2 (41)Ef () = [x (r) - - d ](r)dr max, 0 x 2r rmin rmin (42) 0 x2(r) Y2, 0 x1(r) Y1.

Предположим, что ограничения (42) выполнены для r, т.е.

множество вариантов обмена, составляющих механизм ОУ, лежит внутри множества возможных вариантов обмена. В таком случае решение (41) Ef сведется к решению уравнения = 0. Т.е.

x r x (r) x (r) 1 - F(r) 2 1 - - = 0, где F(r) = (s)ds.

r r (r) rmin Получаем, что механизм ОУ будет иметь следующий вид r (r) (43) x (r) =, r ;

r(r) + 1- F(r) 2 r x (r) x ( ) 2 (44) x (r) = + d, r.

2r rmin r - r min Для равномерного распределения типов АЭ - F(r) =, вид r - r max min механизма ОУ можно упростить:

r (45) x (r) =, r ;

r max 3 4r - r min (46) x (r) =, r.

6r max Оценим ожидаемую прибыль центра от обмена при применении механизма (45), (46) 2 Ef () = (r + r r + r ).

0 max max min min 6r max Сравним полученный результат с ожидаемой полезностью, получаемой при решении эквивалентной задачи стимулирования путем построения механизма без сообщения информации АЭ центру [48]:

r r max min Ef () = max[, ].

0 class 4 Сравнение ожидаемой полезности для двух механизмов показывает, что при условии на :

r max < (1+ 3).

r min механизм открытого управления с сообщением информации эффективнее механизма, описанного в [48], при равномерном вероятностном распределении типа АЭ на множестве возможных типов. Преимуществом механизма открытого управления является тот факт, что обмен совершается с АЭ любого типа, в то время как в механизме без сообщения rmax информации АЭ типа хуже, чем, вынужден отказываться от обмена.

Вернемся к рассмотрению поставленной задачи в случае, когда ограничения (42) существенны. Выражение (43) можно трактовать, как фазовую траекторию, соответствующую оптимальному управлению. В соответствии с принципом оптимальности Беллмана [28] – отдельный участок оптимальной траектории является также оптимальной траекторией. Т.е решение задачи (41) сохранит свой вид в области ~ r = [rmin,~], где r = min{arg{x1(r) = Y1},arg{x2 (r) = Y2}}. Для r r / = (~;

r ] (r) = (~). Для равномерного распределения типов r r max АЭ можно записать r (47) x (r) =, r ;

r max 3 4r - r min (48) x (r) =, r ;

6r max 3 2 ~ r = min{(rmaxY2 )1/ 2,( rmaxY1 + rmin )1/ 3}.

2 Ожидаемая прибыль центра будет иметь более сложный вид ~ 1 r - r 2 2 2 2 min ~r (49) Ef () = [2r (~ + r + r ) - (~ + r )(~ + r ) + r ] r r r 0 max min min min min min 6r (r - r ) max max min Задача 4. Построить эффективный и неманипулируемый механизм обмена для ОС с линейными функциями полезности Ц - f (x, x ) = rx - x, 1 1 2 1 и АЭ - f (x, x,r) = rx - x. Задача центра – максимизация 1 1 2 1 гарантированной относительной прибыли от обмена f ( (s)) min max.

det s max f (s) Множество возможных значений типа АЭ –отрезок [rmin,rmax].

Распределение ресурса в схеме такое же, как в рассмотренном выше примере - весь ресурс первого типа Y1 сосредоточен у центра, весь ресурс второго типа Y 2 – у АЭ. Причем существенным будем считать ограничение на ресурс первого типа.

Легко видеть, что функция полезности АЭ удовлетворяет требованиям (F1) и (F2):

f (x, x,r) 1 1 r, х Х = x 0, r т.е. выполнено F1. Также, f1(x1, x2, r) = r, х Х, x2r что соответствует F2 b. Также очевидно, f1(x1, x2, r) = 1 > r, х Х,, x1r что соответствует F2a.

В соответствии с (39) получаем r x (r) = rx (r) + x ( )d.

2 1 rmin Для построения механизма ОУ необходимо решить следующее уравнение:

d f ( (s)) ( ) = 0.

det ds max f (s) det Очевидно, что max f (s) = (s - c)Y. Поэтому получаем, что 0 r dx (r) x (r) 1 (50) - + x ( )d = 0, dr r - c (r - c) rmin (51) 0 x1(r) Y1.

Механизм имеет следующий вид:

1 µ(r ) r - c - max x (r) = µ(r )Y (r - c(1- )), x (r) = Y, µ(r) = (1 + ln ).

2 max 1 1 (r) µ(r) r - c min Относительная гарантированная прибыль центра f ( (r)) = µ(r ).

det max max f (r) Следует заметить, что из процесса взаимодействия между центром и АЭ можно исключить этап сообщения оценки своего типа активным агентом. Т.е для полученного прямого неманипулируемого механизма можно привести эквивалентный непрямой механизма. Данный переход может быть полезен с практичной точки зрения – т.к. в процессе переговоров фигурируют только сами товары, предлагаемые к обмену.

Взаимодействие между центром и АЭ будет выглядеть следующим образом.

1) Центр сообщает АЭ «меню» - множество вариантов обмена.

2) АЭ выбирает оптимальный с его точки зрения вариант обмена.

3) Производится обмен в соответствии с выбранным вариантом.

Для задач 3 и 4, множество вариантов обмена, предлагаемых центром, будет выглядеть следующим образом. Для случая дискретного i i распределения типа АЭ µ = (x, x ), i =1...n, где х2i определяется из (34), х1i 1 из (35). Для непрерывного случая, µ = x (x ), x [x (r ), x (r )], и 1 2 2 2 min 2 max определяется из (45) и (46). Очевидно, что (x, x ) µ, оптимальные для 1 АЭ, будут совпадать с (r) = (x (r), x (r)), определяемым по все тем же 1 (34) и (35) (или (45) и (46)). На левой части рисунка 8 представлено множество вариантов обмена, получаемое в задаче 3. На правой - для задачи 4.

x x (r ) Y (r ) max 1 max (~) r Y x exp(x ) + cx 2 1 x (x ) 1 Y µ(r ) (r ) 1 max min (r ) min x r / r r x min max max Рис. 8. «Меню» 2.3. Решение задачи обмена для двухэлементных обменных схем без иерархии Рассмотрим обменную схему из двух агентов, в которой отсутствует иерархия, т.е. нет отношений подчиненности типа Ц – АЭ. Т.к. понятие ОС подразумевает, что у агентов имеется возможность увеличить свою полезность путем обмена, то возникает вопрос поиска равновесия – обмена (множество обменов), устраивающего каждого из участников обмена. В качестве критерия, определяющего равновесие, например, могут выступать некие внешние цены на товары, которые присутствуют в ОС.

Данный критерий, как было показано в разделе 1.4, использовался в модели обменной экономики Эджворта, а само равновесие называлось равновесием Вальраса [81]. Но как быть, если применение подобного затруднительно. В данном разделе рассматривается модель, в которой агенты не полностью осведомлены о параметрах друг друга. В такой ситуации задача поиска равновесия осложняется возможностью агентов манипулировать информацией при обмене. Предлагаемый метод решения подобных задач основан на рассмотренном выше механизме ОУ – каждый из агентов предлагает в качестве вариантов обмена свой механизм ОУ, где он выступает в роли центра. Выбранная модель ОС является модификацией модели ОС, рассматриваемой в разделе 1.1.

Агенты имеют следующие функции полезности:

0 0 0 0 0 (y, y,r ) = r y + y ;

1 2 2 1 1 1 1 1 2 (y, y,r ) = y - (Y - y ) / 2r.

1 2 1 1 Начальное распределение ресурсов остается прежним:

Y y =.

0 Y Также, как и ограничения индивидуальной рациональности:

IR(y0)= {i = 0,1, i ( yi ) i ( yi 0 )}.

Информационное состояние схемы выглядит следующим образом.

Каждый из агентов знает все параметры схемы за исключением точного значения типа оппонента – ему известно множество возможных значений типа и вероятностное распределение типа – -i = [r-imin,r-imax], -i(r-i), r- i max -i (r )dr =1. Для простоты дальнейших вычислений будем -i r-i min рассматривать именно непрерывный случай с равномерным -i распределением (r ) = =const. Каждый агент знает точное -i -i -i r - r max min значение собственного типа.

Функции полезности агентов от обмена в данной модели записываются следующим образом (17), (18):

0 f (x, x,r ) = r x - x ;

0 1 2 2 1 f (x, x,r ) = x - x / 2r.

1 1 2 1 Процесс обмена (игра) происходит следующим образом:

1. Каждый из агентов сообщает свое «меню» или множество предлагаемых вариантов обмена, соответствующее механизму ОУ, в котором он выступает в роли центра.

2. Каждый из агентов сравнивает прибыль от наилучшего варианта обмена из предложенных оппонентом с ожидаемой прибылью от своего механизма обмена.

3. Каждый из агентов сообщает оппоненту свою заявку - по какому из предложенных механизмов он готов обмениваться (кем готов быть – центром или АЭ).

4. Если позиции агентов не противоречивы (Ц - АЭ или АЭ – Ц), то тот из них, кто выбрал роль АЭ, сообщает вариант обмена из меню оппонента, который его устраивает (или просто свой тип в случае прямого механизма). Если позиции элементов противоречивы (Ц - Ц или АЭ – АЭ), то возникает конфликтная ситуация, варианты решения которой будут рассмотрены позже.

5. Элементы совершают обмен в соответствии с выбранным планом в случае непротиворечивости выбранных ими ролей.

Предполагается, что при одинаковой выгодности роли Ц и АЭ, любой из агентов предпочтет роль АЭ.

Данный вариант игры является «квазиинтеллектуальным», т.к. агенты не используют предлагаемый оппонентом план для вычисления типа оппонента.

Оба агента строят механизмы ОУ, основываясь на максимизации C i -i собственной ожидаемой прибыли Ef (r, (s )) max i (s-i ) Механизм ОУ, предлагаемый агентом 0. Данная задача имеет вид, аналогичный задаче из примера 4, за исключением вида функции полезности от обмена для центра. Т.е. задача динамического программирования, которую необходимо решить для построения механизма ОУ, имеет следующий вид (41):

0 1 r1 r1 0 max x (r,r ) x (r, ) 0 1 0 0 1 1 2 Ef (r, ) = [r x (r,r ) - - d ] (r )dr max, 0 2 1 x 2r r1 r min min при условиях 0 x2(r0, r1) Y2, 0 x1(r0, r1) Y1.

Решение данной задачи для равномерного распределения типа АЭ будет иметь следующий вид (43), (44):

0 r r 0 1 0 0 1 (52) x (r,r ) =, r, r ;

r max 13 2 4r - r min 0 1 0 0 0 1 (53) x (r,r ) = r, r, r.

6r max 3 2 1 2 ~ 1 = [r1,~1], r = min{(rmaxY2 / r0 )1/ 2,( rmaxY1 / r0 + rmin )1/ 3}.

min r 2 Для простоты анализа, но без потери общности, примем, что ресурсные ограничения выполняются для всех значений типов агентов.

При данных предположениях ожидаемая прибыль агента 0 в качестве центра будет иметь следующий вид:

r 0 1 12 1 1 (54)Ef (r, ) = (r + r r + r ).

max max min min 6r max Прибыль АЭ 13 2 r - r min 0 1 (55) f (r,r ) = r ( ).

6r max Механизм ОУ, предлагаемый агентом 1.

0 Задача центра – Ef (,r ) max. Проверим, удовлетворяет ли модель свойствам, позволяющим построить механизм ОУ. Функция полезности АЭ 0 f (x, x,r ) = r x - x.

0 1 2 2 Соответственно, f (x, x,r ) 0 1 r0 0, х Х = x 0, r т.е. выполнено F1. Также, f (x, x,r ) 0 1 r0 0, х Х =1 > 0, x r что соответствует F2a. Также очевидно, f (x, x,r ) 0 1 r0 0, х Х = 0, x r что соответствует F2b.

Приступим к построению механизма ОУ. Из (9) получаем r 0 1 0 0 1 x (r,r ) = r x (r,r ) - x (,r )d.

1 2 r min Необходимо решить следующую задачу 0 1 r0 r max x (r,r ) 0 1 0 0 1 1 0 Ef (,r ) = [r x (r,r ) - - x (,r )d ] (r )dr max, 1 2 2 x 2r r0 r min min при условиях 0 x2(r0, r1) Y2, 0 x1(r0, r1) Y1.

Выше мы приняли, что ресурсные ограничения выполняются для любых типов агентов, поэтому решение поставленной задачи будет иметь следующий вид:

0 1 1 0 0 0 0 0 0 1 (56) x (r,r ) = r (2r - r ), r = [r,r ], r ;

max max 0 1 0 0 0 1 x (r,r ) = 0, r /, r ;

0 1 1 0 0 0 0 0 0 0 0 1 (57) x (r,r ) = r (r - (r - r )r ), r = [r,r ], r ;

max max 0 1 0 0 0 1 x (r,r ) = 0, r /, r где 0 0 (58)r = max[r,r / 2].

min max Ожидаемая прибыль агента 1 в роли центра 0 0 2 r r r 0 1 1 max max (59) Ef (,r ) = r ( - + r ).

3 4 Прибыль АЭ 0 1 1 0 0 0 0 0 (60) f (r,r ) = r [(r - r )r - (r - r )r ].

0 max max На рисунке 9 приводится вид «меню» - множества вариантов обмена, предлагаемых агентом 1.

x (r ) max ~) (r Y x (x ) 1 r x (r) max Рис. 9. Вид множества вариантов обмена, предлагаемых агентом 1.

Построив механизмы ОУ (52), (53) и (58), (59), можно проанализировать, какая из возможных позиций в иерархии выгодна для каждого из агентов, в зависимости от следующих параметров модели – качество типа каждого из агентов, определяемое как отношение истинного типа агента к лучшему и его информированность – отношение худшего из возможных типов оппонента к лучшему. Для этого необходимо сравнить (54) и (60) для агента 0 и (59) и (55) для агента 1.

Для анализа выгодности позиций для агентов, введем следующие 0 0 0 0 1 1 1 замены: r = r, r = r, r = r, r =r. Причем очевидно, что max max max min max (61) 0 < 1, и из (58) – (62) 1/ 2 1.

Множество всех значений переменных,,,, удовлетворяющих (61) и (62) обозначим Введенные переменны можно трактовать следующим образом:

- осведомленность агента 0, чем больше ее значение, тем лучше информирован данный агент;

- тип агента 1;

- осведомленность агента 1, чем больше ее значение, тем лучше информирован данный агент;

- тип агента 0;

С учетом данной замены переменных, получаем (63) Ef (I,,) = I (1 + + ) ;

3 (64) f (I,,,) = I ( - );

2 (65)Ef (I,, ) = I ( - + );

3 4 (66) f0 (I,,, ) = I [(1 - ) - (1 - )].

0 Здесь I = r r - константа, определяемая параметрами обменной max max схемы.

Проанализируем зависимость выражений (63) - (66) от новых переменных.

Ef (I,,) = I (1 + + ) - ожидаемая прибыль агента 0 в роли центра растет с улучшением его типа.

Ef (I,,) = I (1+ 2) - ожидаемая прибыль агента 0 в роли центра растет с улучшением его информированности.

f (I,,, ) = I [2 -1] - с учетом (62), прибыль агента 0 в роли АЭ растет с улучшение его типа (собственно на этом принципе и строился механизм ОУ) f (I,,, ) = I[1 - 2 ] - с учетом (62), прибыль агента 0 в роли АЭ убывает с улучшение информированности агента 1.

f (I,,, ) = I[(1 - ) - (1 - ) ] - прибыль агента 0 в роли АЭ растет с улучшением типа агента 1.

Ef 2 (I,, ) = I ( - + ) - с учетом (62), ожидаемая прибыль 3 4 агента 1 в роли центра растет с улучшением его типа.

Ef 2 (I,, ) = I (2 - ) - ожидаемая прибыль агента 1 в роли 3 центра растет с улучшением его информированности.

f (I,,,) = I - прибыль агента 1 в роли АЭ растет с улучшение его типа.

f (I,,,) = -I - прибыль агента 1 в роли АЭ убывает с улучшение информированности агента 0.

f 3 (I,,,) = I ( - ) - прибыль агента 1 в роли АЭ растет с улучшением типа агента 0.

Можно сформулировать следующее качественное утверждение – для любого из агентов позиция АЭ может быть более предпочтительна, если он плохо информирован, но и его оппонент плохо информирован также, и, если тип оппонента высокий. Кроме того, учитывая, что прибыль агента с худшим типом при использовании механизма ОУ нулевая, а прибыль в роли центра очевидным образом положительна, можно предположить, что позиция АЭ предпочтительна, когда тип агента достаточно высокий.

Предпочтительность позиции АЭ можно сформулировать следующим образом.

Для того, что бы агент 0 предпочел роль АЭ роли центра необходимо выполнение следующего неравенства (67) F (,,,) = [(1- ) - (1-)] - (1+ + ) 0.

Для того, что бы агент 1 предпочел роль АЭ роли центра, необходимо, что бы 2 3 3 (68) F (,,,) = ( - ) - ( - + ) 0.

6 3 4 В следующей лемме определяются условия необходимости, которые накладываются на тип агента 1 и область его значений, при которых возможна ситуация, когда агент 0 предпочтет позицию АЭ.

1 + + Лемма 5. При < неравенство (67) не выполняется для и.

Доказательство. Функция F (,,,) достигает своего глобального 1 + + - экстремума по при = (2 - ) т.к F 1 + + (69) (,,,) = 2 - -.

Данный экстремум является минимумом, если 2 F 1 + + (70) (,,,) = 2 - > 0.

Кроме того, очевидно, что (71) F (,,,) = - (1 + + ) < 0.

Следовательно, для,,, удовлетворяющих (61), (62), и (70), при 1+ + - [,(2 - ) ] неравенство (67) не выполняется. Если 2 2 1 + + 1 + + 1 + + - [, ], то (2 - ) 1, т.е на всей области 6 3 возможных значений неравенство (67) не выполняется.

1 + + Если (70) является равенством - =, то (65) отрицательно для и. С учетом (71) получаем, что на всей области возможных значений неравенство (67) не выполняется.

1 + + Если <, то функция F (,,,) достигает при 1+ + - = (2 - ) своего максимума, причем очевидно, что < 0.

Следовательно, с учетом (71) получаем, что на всей области возможных значений неравенство (67) не выполняется.

Общее условие предпочтительности позиции АЭ для «квазиинтеллектуального» агента 0 можно записать в следующем виде.

Утверждение 2. Существует область значений параметров,,,, 0ae 0ae 0ae 0ae 0ae =, в которой роль АЭ предпочтительнее для «квазиинтеллектуального» агента с номером ноль. Область 0ae 0ae 0ae 0ae 0ae = задается следующим образом:

0ae - (72) = [(1 + 2(1- ) + 1- 4(1- ) )(2 - ),1];

1 0ae (73) = [ ;

(1 + 1- 2 )];

2 2(1 + + ) 0ae (74) = [,1];

0ae (75) = (0, ( 3 -1)].

1 + + Здесь используется замена =.

Доказательство. Из леммы 5 следует, что <1. Также очевидно, что > 0.

Решив (67) как квадратичное неравенство относительно, получим, - + что (-, ] [,), где ± - = (1 ± 2(1 - ) +1 - 4(1 - ) )(2 - ).

Покажем, что - < 1/2. Очевидно, что данное утверждение эквивалентно неравенству (76) 2(1 - ) +1 - 4(1 - ) >.

Неравенство (76) выполнено для (8(1 - ) - 2,2). Учитывая (62) получаем, что данное неравенство выполнено всегда. Т.е - < 1/2 для любых параметров модели. Следовательно, с учетом (62), (67) выполнено 0ae - для = [(1 + 2(1- ) + 1 - 4(1 - ) )(2 - ),1].

0ae Для того, что бы множество было не пусто, необходимо, что бы (77) 2(1 - ) +1 - 4(1 - ) 1 -.

Неравенство (77) можно переписать следующим образом (78) - 2(1+ (1 - ) ) + 4(1 - ) 0.

Решив данное неравенство относительно, получаем 1 1 [ (1 - 1 - 2 );

(1 + 1 - 2 )] и 2 2 1 Очевидно, что (1 - 1 - 2 ). Следовательно, с учетом 2 1 0ae ограничений на и (62), получаем = [ ;

(1 + 1 - 2 )], 2 2(1 + + ) 0ae 0ae = [,1]. Множество не пусто при 0ae = (0, ( 3 -1)].

На качественном уровне – если информированность обоих агентов достаточно плоха, а качество типов агентов достаточно высоко, то «квазиинтеллектуальный» агент 0 может добровольно согласиться на роль АЭ.

Утверждение 3. (,,,) роль АЭ не выгодна для «квазиинтеллектуального» первого агента.

Доказательство. Утверждение трактуется следующим образом – для (,,,) неравенство (68) не выполнено.

Введем следующие замены (79) = - + ;

4 3 3 (80) L = (108 + 12 81 - 768 ).

Решив (68) как кубическое неравенство относительно, получим, что L [,), где = + 8.

6 L Очевидно, что > 0. Следовательно, с учетом (61), получаем, что для L 1ae 1ae = [ + 8,1] неравенство (68) выполняется. Множество не 6 L пусто, если 1.

Минимальное значение, для, удовлетворяющих (62) достигается 1 при = - =.

2 L Следовательно +.

6 L L Очевидно, что + >1 при любых неотрицательных L. Поэтому 6 L 1ae множество пусто для любых,,, удовлетворяющих (61) и (62). Т.е.

не существует таких,,,, удовлетворяющих (61) и (62), для которых выполняется неравенство (68).

Итак, было доказано, что для агента 1 всегда предпочтительнее позиция Центра, в то время, как для агента 0 существует область значений 0ae 0ae 0ae 0ae 0ae параметров,,,, - =, в которой для него предпочтительнее позиция АЭ. Т.е в обменной схеме возможны следующие варианты распределения позиций агентов: Ц-Ц и АЭ-Ц.

Ситуация, когда оба элемента претендуют на роль центра – является конфликтной. Рассматривается метод разрешения данного конфликта, основанный на компенсации за роль АЭ - элемент, претендующий на роль центра, предлагает своему оппоненту некоторую компенсацию за то, что тот откажется от роли центра. Очевидно, что размер компенсации, которую необходимо выплатить агенту определяется абсолютным значением функций F (,,,) для агента 0 и F (,,,) для агента 1.

0 А определить агента, который займет позицию центра можно исходя из разницы данных функций:

2 1 2 3 (81) F(,,,) = [- + 4 - - (1 - )] - (1 + + + - ).

6 3 Если данное выражение отрицательно, то позиция центра доступна агенту 0, если положительна, то агенту 1. Выше было показано, что позиция центра всегда предпочтительнее позиции АЭ для агента 1.

Поэтому нас будет интересовать – возможно ли ситуация, когда агент 0 в состоянии компенсировать агенту 1 отказ от позиции центра.

Теорема 3. (,,,) только агент 1 может выступать в роли центра. Т.е (,,,) F(,,,) > 0.

Доказательство. Произведем анализ функции F(,,,). Для этого будет достаточно исследовать частные производные данной функции по параметрам и :

F 2 3 (82) (,,,) = (2 -1) - (1 + + + - );

F (83) (,,,) = (4 - ).

F Можно показать, что при выполнении (61) производная (,,,) всегда положительна, т.е с улучшением типа агента 0 его шансы стать центром уменьшаются. Неотрицательность (82) легко показать, приняв во внимание результаты утверждения 3 – агенту 0 не выгодно быть АЭ, если 2(1 + + ) < :

F (,,,) (1 - ) + > 0.

2 F Также не трудно показать, что производная (,,,) положительна, т.е с улучшением информированности агента 1 шансы агента 0 стать центром уменьшаются. Из (62) следует, что F (,,,) > 0.

С учетом результатов утверждения 3 – агенту 0 не выгодно быть АЭ, 2(1 + + ) если <, можно показать, что значение функции F(,,,) при = = положительно:

1 1 7 1 9 2 3 F(,,,) = - (1 + + + - ) > + > 0.

2 2 6 24 8 для,, удовлетворяющих (61). Следовательно, в рамках рассматриваемой модели функция F(,,,) всегда положительна.

Теорема 3 может быть проинтерпретирована следующим образом.

Агент 1 всегда может назначить такую компенсацию агенту 0, при которой тот согласится выбрать позицию АЭ. Агент 0 не имеет возможности компенсировать агенту 1 отказ от позиции центра. Можно в явном виде записать прибыль каждого из агентов в данной обменной схеме. Агент выступает в роли АЭ:

(84) r 0 1 1 1 0 0 0 0 0 0 12 1 1 f (r,r, ) = max[r ((r - r )r - (r - r )r ), (r + r r + r )] max max min min 0 max max 6r max Агент 1 выступает в роли Ц, его «ожидаемая» прибыль :

0 0 2 r r r 0 0 1 1 max max Ef (,r,r ) = r ( - + r ) 3 4 (85).

r 12 1 1 12 1 0 0 0 0 0 - max[0, (r + r r + r ) - r ((r - r )r - (r - r )r )] max max min min max max 6r max Следует отметить, что у предложенного выше метода анализа агентами выгодности позиций центра и активного агента есть недостаток – агенты не производят анализ предлагаемого оппонентом механизма и не пытаются восстановить истинные тип оппонента. Поэтому данный метод может быть назван методом для «квазиинтеллектуальных». Метод анализа выгодности позиций Ц и АЭ для «интеллектуальных» агентов может основываться на сравнении прибыли агента в роли АЭ с прибылью в роли центра, куда подставляется тип оппонента, восстановленный из предлагаемого им механизма обмена. Проиллюстрируем данное предположение. Агент 0 предлагает агенту 1 некий план обмена:

1 12 1 (86) x (r ) = Ar, r ;

1 13 1 (87) x (r ) = Br - C, r.

Предполагая, что данный план обмена должен являться механизмом ОУ, и зная вид функции прибыли агента 0 от обмена (17), агент 1 может решить следующую систему уравнений, получив тип агента 0 r :

0 r = Ar max 0 (88) = r max B r 6C 0 max r = r r min Причем, если данная система совместна, то агент 0 действительно предлагает механизм обмена ОУ. Полученное значение типа агента позволяет посчитать уже не ожидаемую прибыль агента 1 в роли центра, а фактическую:

0 0 2 (2r - r ) max C 0 1 1 0 0 0 0 0 0 0 (89) f (r,r ) = r (r - (r - r )r - ), r = [r,r ], max max 1 r ;

C 0 1 0 0 0 1 f (r,r ) = 0, r /, r.

Аналогичная ситуация и для агента 0 – для него показателем использования агентом 1 механизма обмена ОУ служит совместность следующей системы M r = r = N (90) r max r = O P r = 0 0 (r - r )r max Константы M,N,O,P определяются из предлагаемым агентом механизма обмена:

0 0 0 0 0 (91) x (r ) = Mr - N, r = [r,r ];

max 0 0 0 x (r ) = 0, r / ;

0 0 0 0 0 (92) x (r ) = Or - P, r = [r,r ];

max 0 0 x (r ) = 0, r /.

Полученное значение типа агента 1 может быть использовано для вычисления фактической прибыли агента 0 в роли центра:

12 13 2 r 4r - r min C 0 1 0 0 0 1 (93) f (r,r ) = r ( - ), r, r ;

r max 6r max 0 0 0 Используя введенную ранее замену переменных - r = r, r = r, max max 1 1 1 r = r, r =r, перепишем фактические прибыли обоих агентов в max min max удобном для анализа виде:

C 2 3 (94) f (I,,,) = I (6 - 4 + );

C (95) f (I,,, ) = I ( - (1 - ) - (1 - ) ).

Для того, что бы «интеллектуальный» агент 0 предпочел роль АЭ роли центра необходимо выполнение следующего неравенства 2 3 (96) L (,,,) = [(1 - ) - (1 - )] - (6 - 4 + ) 0.

Для того, что бы «интеллектуальный» агент 1 предпочел роль АЭ роли центра, необходимо, что бы 3 3 (97) L (,,,) = ( - ) - ( - (1 - ) - (1 - ) ) 0.

6 Утверждение 4. Существует область значений параметров,,,, 0 Iae 0 Iae 0 Iae 0Iae 0Iae = в которой позиция АЭ предпочтительнее для «интеллектуального» агента с нулевым номером. Область 0 Iae 0 Iae 0 Iae 0Iae 0Iae = имеет следующий вид:

0 Iae - (98) = [(3 + 9 - 6(6 - µ)(1 - ) )(6 - µ),1];

1 1 0Iae (99) = [ ;

(1 + 9 - 6µ )];

2 2 0 Iae (100) = [, ( 3 - 1)];

0 Iae 3 2 1/ (101) = (0, (32 - 48 +12 ) ].

2 3 6 - 4 + Здесь используется замена µ =.

Доказательство. Очевидно, что µ > 0.

Решив (96) как квадратичное неравенство относительно, получим, - + ± - что (-, ] [,), где = (3 ± 9 - 6(6 - µ)(1- ) )(6 - µ), при условии, что µ < 6.

Покажем, что - < 1/2. Очевидно, что данное утверждение эквивалентно неравенству µ (102) 9 - 6(6 - µ)(1 - ) >.

Неравенство (102) выполнено для µ (-6(1 - 2 ),6). Учитывая (62) получаем, что данное неравенство выполнено всегда.

- + Если µ > 6, то [, ], где ± - = (3 9 - 6(6 - µ)(1 - ) )(6 - µ).

+ Легко показать, что при µ > 6, >1.

Следовательно, с учетом (62), (102) выполнено для 0Iae - = [(3 + 9 - 6(6 - µ)(1- ) )(6 - µ),1].

0Iae Для того, что бы множество было не пусто, необходимо, что бы (103) 9 - 6(6 - µ)(1 - ) 3 - µ.

Неравенство (103) можно переписать следующим образом (104) µ - 6µ(1+ (1 - ) ) + 36(1- ) 0.

Решив данное неравенство относительно, получаем 1 1 1 1 [ (1 - 9 - 6µ );

(1+ 9 - 6µ )] и µ.

2 6 2 6 1 1 Очевидно, что (1 - 9 - 6µ ). Следовательно, с учетом 2 6 1 1 0 Iae ограничений на и (62), получаем = [ ;

(1 + 9 - 6µ )], 2 2 0 Iae 3 2 1/ 3 0 Iae = (0, (32 - 48 +12 ) ]. Множество не пусто при 0Iae = [, ( 3 -1)].

На качественном уровне - «интеллектуальный» агента 0 добровольно согласится на роль АЭ, если качество его типа будет достаточно высоким, качество типа оппонента достаточно низким, и оба агента будут плохо информированы.

0ae 0 Iae Утверждение 5. =0.

3 2(1+ + ) Доказательство. Очевидно, что для ( 3 -1) <.

4 0ae 0 Iae Следовательно =0.

Т.е. стратегии «интеллектуального» и «квазиинтеллектуального» агентов 0 различны в вопросе выбора роли АЭ.

0 Iae / 0ae Утверждение 6.

/ 0.

0ae Доказательство. Рассмотрим = 0,9. Очевидно, что и 0 Iae. Т.е. для,,, удовлетворяющих (61) и (62) 0ae 0 Iae (,,,)/ и(,,,)/.

Иными словами, возможны ситуации, когда и «интеллектуальный» и «квазиинтеллектуальный» агент 0 выберут роль центра.

Проведем аналогичное исследование для «интеллектуального» агента 1.

Утверждение 7. Существует область значений параметров,,,, 1Iae 1Iae 1Iae 1Iae 1Iae =, в которой роль АЭ предпочтительнее для 1Iae 1Iae 1Iae 1Iae 1Iae «интеллектуального» агента 1. Область = имеет следующий вид:

1Iae - (105) = [,(1 - 1 - ( + (1 - ) )(1+ ))(1 + ) ];

( 1 1 - 1 - 2 ) 1Iae (106) = [ ;

];

2,, удовлетворяющие (61) и (62).

3 Здесь используется замена =.

Доказательство. Очевидно, что > 0 для,, удовлетворяющие (61) и (62). Перепишем (97) с учетом данной замены:

(107) L (,,, ) = ( ( +1) - 2 + + (1- ) )) 0.

Решение (107) как квадратичного неравенства относительно имеет - + вид (-, ] [,), где ± = (1 ± 1 - ( + (1 - ) )(1 + )) /(1+ ).

+ Легко видеть, что >1 при,, для которых выполняются (61) и (62):

1 3 1 1 - ( + (1 - ) )(1+ ) > 1 - (1+ ) > >.

2 4 8 Также, очевидно, что <1 при,, для которых выполняются (61) и (62):

- 1 - ( + (1 - ) )(1 + ) < 1Iae Соответственно, множество не пусто, если :

(108) 1 - 1- ( + (1 - ) )(1+ ) (1 + ).

- + Неравенство (108) выполняется для (-, ] [,), где 1 (1± 1 - 2 ) ± =.

+ Легко видеть, что >1 для 1 - 2 + 1 - 2 > 0.

Также, не трудно показать, что 1 для 1 - 2 1 - 2.

По аналогии, для 1 - 1 - 2.

1Iae Следовательно, множество не пусто для,, удовлетворяющие (61) и (62).

На качественном уровне - «интеллектуальный» агента 1 добровольно согласится на роль АЭ, если качество типа оппонента достаточно низкое и информированность самого агента достаточно плохая.

0 Iae 1Iae Следует отметить некоторую «схожесть» множеств и - оба «интеллектуальных» агента предпочитают позицию АЭ, если их информированность невелика, а тип оппонента достаточно плохой. В тоже время, очевидны и различия данных множеств – агент 1 может предпочесть позицию АЭ для любого значения собственного типа и любой информированности оппонента, в то время как агенту 0 для этого потребуется плохая информированность оппонента и хороший свой тип.

Проанализируем, какие из ситуаций возможны в игре «интеллектуальных» агентов.

Утверждение 8. В игре «интеллектуальных» агентов ситуация, когда оба элемента предпочтут роль АЭ, невозможна.

Доказательство. Очевидно, что оба агента выберут позиции АЭ, если 0 Iae 1Iae множества и пересекаются. Если же данные множества не пересекаются хотя бы по одной из переменных, то данной ситуации не 0Iae 1Iae возникнет. Можно показать, что = 0. Из (98) и (105) видно, что пересечение пусто если следующая функция положительна 1 - 1 - ( + (1 - ) )(1+ ) 3 + 9 - 6(6 - µ)(1- ) (109)T (,µ, ) = 6 - µ 1 + 0Iae 1Iae 0 Iae 1Iae 0 Iae 1Iae для,,. Здесь 3 3 2 3 - 6 - 4 + сохраняются замены =, µ =.

Можно установить связь между и : µ = 6 - 3 - 6.

0 Iae 1Iae 0Iae 1Iae 0 Iae 1Iae Учитывая, что для, T (,µ, ) производная положительна, достаточно будет потребовать выполнения следующего неравенства:

3 + µ - 1 - T (,µ, ) = - > 0.

2 6 - µ 1 + Данное неравенство можно представить иначе:

(110) 1 - 3 + µ -1 > 0.

0 Iae 1Iae 0 Iae 1Iae Неравенство (110) выполнено для,.

Следовательно, функция (109) положительна.

Из доказанного выше утверждения следует, что при взаимодействии «интеллектуальных» агентов возможна конфликтная ситуация, когда оба агента настаивают на позиции центра. Предполагается, что разрешение данной ситуации также основывается на компенсациях за отказ от позиции центра, которые агенты могут предлагать друг другу. Определить, кто из агентов может стать центром, можно, проанализировав разность выражений (96) и (97):

2 (111) L(,,,) = ( - ) - (1 - ).

2 Если функция L(,,,) > 0, то позиция центра доступна «интеллектуальному» агент 1. Если функция L(,,,) < 0, то «интеллектуальному» агент 0. Случай L(,,,) = 0 можно назвать критическим, т.к. возможности обоих агентов равны.

Достаточно очевидно, что функция L(,,,) > 0, если 1 (, ).

2 - С учетом ограничений (61) и (62) получаем следующее утверждение Утверждение 9. В игре «интеллектуальных» агентов распределение ролей зависит только от качества типов агентов.

L L Доказательство. Очевидно, что (,,,) = 0 и (,,,) = 0.

1 Функция L(,,,) > 0, если (, ). С учетом ограничений 2 - (61) и (62) получаем, что центром станет агент 0, если (112) <.

2 - Можно записать данное условие в терминах абсолютных значений типов агентов:

0 r r max max (113) r <.

1 2r - r max Можно записать прибыль агента 0 в роли центра:

12 13 2 r 4r - r min C 0 1 f (r,r ) = r ( - ) r max 6r max (114).

0 0 2 13 2 (2r - r ) 2 r - r min max 1 0 0 0 0 - max[0,r (r - (r - r )r - ) - r ( )] max 6r max Соответственно прибыль агента 1 в роли АЭ:

0 0 2 13 2 (2r - r ) 2 r - r min max ae 0 1 1 0 0 0 0 (115) f (r,r ) = max[r (r - (r - r )r - ),r ( )].

max 6r max 0 1 r r max max Агент 1 станет центром, если >, т.е. r >. Его 1 2 - 2r - r max прибыль:

0 0 2 (2r - r ) max C 0 1 1 0 0 0 f (r,r ) = r (r - (r - r )r - ) max (116).

12 13 2 r 4r - r min 0 1 0 0 0 0 0 - max[0,r ( - ) - r ((r - r )r - (r - r )r )] max max r max 6r max Прибыль агента 0 в роли АЭ:

12 13 2 r 4r - r min ae 0 1 0 1 0 0 0 0 0 (117) f (r,r ) = max[r ( - ),r ((r - r )r - (r - r )r )].

0 max max r max 6r max 0 1 r r max max Ситуация = или r = в данной работе не 1 2 - 2r - r max рассматривается.

На качественном уровне, полученные выше результаты для игры «интеллектуальных» агентов можно трактовать следующим образом: в обменной схеме, состоящей из двух равноправных агентов, роль центра возьмет на себя тот агент, чей тип является достаточно плохим, в то время, как тип оппонента является достаточно хорошим. Соотношение типов определяется выражениями (112) или (113).

Следует отметить, что в игре «интеллектуальных» агентов не рассматривалась возможность искажения предлагаемых планов. Т.е. агент предлагал оппоненту план (механизм обмена ОУ), соответствующий его истинному типу. Возможность искажения собственного плана можно расценивать как следующий уровень интеллектуальности агентов.

Еще одним направлением дальнейших исследований можно считать изучение обменных схем, агенты которых обладают различным уровнем интеллекта.

Результаты раздела 2.3 представлены в таблице 2. Используется обозначение ( ) =.

2 - Таблица 2.

Зависимость распределения ролей между агентами от параметров ОС «Квазиинтеллектуаль «Интеллектуальные» агенты ные» агенты А0 А1 А0 А < ( ) > ( ) центр Никогда Всегда и и > ( ) < ( ) (,,,) ae Никогда (,,,) (,,,) / Iae Iae / / 0 (,,,) (,,,) (,,,) Никогда ae Iae Iae 0 0 Во второй главе были получены следующие результаты. В разделе 2.1 показана эквивалентность задачи обмена и задачи стимулирования в условиях неполной информированности центра.

В разделе 2.2 построены эффективные неманипулируемые механизмы обмена для двухэлементных иерархических обменных схем с неполной ин формированностью центра;

В разделе 2.3 построены эффективные неманипулируемые механизмы обмена для двухэлементной обменной схемы без иерархии в условиях неполной информированности участников ный» АЭ ванный» АЭ «Доброволь- «Компенсиро ГЛАВА III. НЕМАНИПУЛИРУЕМЫЕ МЕХАНИЗМЫ ОБМЕНА В МНОГОЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ Данная глава работы посвящена исследованию механизмов ОУ в ОС с конечным числом элементов.

В раздел 3.1 рассматривается ОС с веерной структурой взаимодействия элементов и одним уровнем иерархии. Т.е ОС состоит из одного центра и конечного числа АЭ. Для многоэлементных ОС, соответствующих многоэлементной задачи стимулирования строится эффективный механизм обмена ОУ.

В разделе 3.2 рассматриваются ОС со структурой взаимодействия элементов типа «цепочка» и одним уровнем иерархии. Предлагаются три метода построения неманипулируемых механизмов обмена для случая, когда общий метод неприменим. Первый метод – метод «консолидации АЭ» – центр рассматривает всех АЭ как единый АЭ и решает задачу нахождения механизма обмена ОУ для полученной двухэлементной ОС.

Второй метод – метод «разбиения схемы» – центр взаимодействует с каждым АЭ по отдельности. Третий метод – метод «доносчика» - центр делегирует права промежуточного центра тому АЭ, который сообщит наилучшую оценку типов всех АЭ. Также приводится ОС со структурой взаимодействия элементов типа «цепочка» и одним уровнем иерархии, для которой возможно применение общего метода построения неманипулируемого механизма обмена.

В последнем разделе третьей главы обсуждается применение полученных автором теоретических результатов при решении прикладных задач.

Полученные автором результаты, содержащиеся в этой главе были опубликованы в работах [32,35,38,42] 3.1. Неманипулируемые механизмы обмена для обменных схем с веерной структурой взаимодействия агентов Рассматриваемая нами обменная схема будет представлять многоэлементный вариант обменной схемы, рассмотренной в разделе 1. (см. рисунок 10).

Рис. 10. Многоэлементная ОС с веерным типом взаимодействия агентов Обменная схема состоит из n + 1агентов – одного Центра и n АЭ. В системе имеется два типа ресурсов. Ограничения на ресурс примем n i стандартными - A = { y = Y ;

j =1,2}. Центр может обмениваться с j j i= каждым из АЭ, АЭ не могут обмениваться между собой. Функции предпочтения имеют следующий вид:

0 0 0 (118) (y, y ) = y + H (y );

0 1 2 1 для центра i i i i i (119) (y, y ) = y - c( y - y,r ), i =1,n.

i 1 2 1 2 2 i Ограничения индивидуальной рациональности достаточно просты – IR(y0)= {i = 0..n, (y ) (y )}.

i i i i Начальное распределение ресурсов задано следующим образом - весь ресурс первого типа сосредоточен у Ц, весь ресурс второго типа – у АЭ:

Y n 0 y 0 i y =, y = Y.

2 … … i= n 0 y Значения Y1 и Y2 выбираются таким образом, что бы рассматриваемая модель могла соответствовать определению обменной.

Запишем функции прибыли от обмена для центра:

Pages:     || 2 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.