WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 || 3 |

«РОССИЙСКАЯ АКАДЕМИЯ НАУК Институт проблем управления им. В.А. Трапезникова Д.А. Новиков, А.В. Цветков МЕХАНИЗМЫ СТИМУЛИРОВАНИЯ В МНОГОЭЛЕМЕНТНЫХ ОРГАНИЗАЦИОННЫХ СИСТЕМАХ Москва – 2000 PDF ...»

-- [ Страница 2 ] --

г) оптимальная УНРСС является прогрессивной. Утверждение пункта г) теоремы обосновывается следующим образом: из (15) следует, что qi+1 ci+1,i+1 + (qi - ci+1,i). В силу моно PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory тонности затрат и (14): ci+1,i+1 - ci+1,i 0, следовательно i = 1, n 1 qi+1 qi, то есть система стимулирования также монотонна (прогрессивна). Отметим, что выше исследовались УНРСС размерности n. Частым случаем УНРСС являются унифицированные системы стимулирования С-типа (УНРСС размерности 1) [55]. Поэтому рассмотрим задачу (первого рода) синтеза унифицированной системы стимулирования, в которой центр назначает общий для всех АЭ план и использует унифицированную систему стимулирования С-типа или QK-типа. Пусть выполнено предположение А.5.1 и центр должен назначить унифицированную систему стимулирования С-типа с одним "скачком": (17) (x, yi) = C, yi x, 0, yi < x где С - некоторая неотрицательная величина, x - общий для всех АЭ план. Введем следующее предположение: А.5.5. Существует упорядочение АЭ, такое, что (18) y A c1(y) c2(y)... cn(y). Отметим, что, если выполнены А.5.1-А.5.4, то, очевидно, выполнено и А.5.5 (см. доказательство леммы 5.1.4). Под совместным выполнением А.5.4. и А.5.5 будем подразумевать, что существует упорядочение элементов, удовлетворяющее одновременно (13) и (18). Обозначим P(x,С) - множество тех АЭ, у которых затраты в точке x не превышают С, то есть таких элементов, которым выгодно выполнение плана x: (19) P(x,С) = {i I | ci(x) С}. Другими словами, из А.5.5 следует, что P(x,С)={k(x,C),...n}, где (20) k(x,C) = min {i I | ci(x) C}. АЭ из множества Q(x,C) = {1, 2,..., k(x,C)-1} выполнение плана x при вознаграждении С невыгодно (естественно, x A, C 0 P(x,С) Q(x,C) =, P(x,С) Q(x,C) = I), и они выберут действия, минимизирующие затраты (в рамках А.5.3 - действия, равные нулю).

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Тогда действия { yi* }, реализуемые системой стимулирования (17), удовлетворяют: (21) yi* (x,С) = Суммарные затраты на стимулирование при использовании центром системы стимулирования (17), в силу (21), равны (22) (x,С) = С (N-k(x,C)+1). Как показано в [18, 36] зависимость yi* (x,С) не является непрерывной. Поэтому для каждого x A существует конечное число минимальных затрат на стимулирование, при которых изменяется число АЭ, выполняющих план x: {c1(x), c2(x),..., cN(x)}. Аналогично, для фиксированного C при непрерывных и строго монотонных функциях затрат АЭ существует конечное число планов { ci1 (C)}, где "-1" обозначает обратную функцию, при которых изменяется число АЭ, которые их выполняют. Общий (для случая, соответствующего А.5) алгоритм решения задачи синтеза оптимальной унифицированной системы стимулирования приведен в [18]. Ниже мы сравним минимальные затраты на стимулирование. Фиксируем произвольный план x A. Для того чтобы все АЭ выбрали действия, совпадающие с планом, необходимо, чтобы k(x,C) = 1, то есть C = c1(x). Тогда из (21)-(22) получаем, что минимальные затраты на стимулирование равны (напомним, что индекс "U" соответствует унифицированным системами стимулирования) UQK(x) = N c1(x). Следовательно, потери в эффективности (по сравнению с системами стимулирования QK-типа) составляют: (23) (x) = UQK(x) - QK(x) = (N-1) c1(x) i= x, i k ( x, C ). 0, i < k ( x, C ) n ci(x).

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory 5.2. СОРЕВНОВАТЕЛЬНЫЕ РАНГОВЫЕ СИСТЕМЫ СТИМУЛИРОВАНИЯ В нормативных РСС центр фиксировал процедуру классификации, определяя множества действий или результатов деятельности, при попадании в которые АЭ получал заданное вознаграждение. В отличие от НРСС, в соревновательных ранговых системах стимулирования (СРСС) центр фиксирует процедуру сравнительной оценки деятельности АЭ, задает число классов и число мест в каждом из классов, а также величины поощрений АЭ, попавших в тот или иной класс. Таким образом, в СРСС индивидуальное поощрение АЭ не зависит непосредственно от абсолютной величины выбранного им действия, а определяется тем местом, которое он занял в упорядочении показателей деятельности всех АЭ. Соревновательные системы стимулирования исследовались как в теории активных систем (см. обзор [34], а также монографии [4, 55]), так и в теории контрактов [59]. Зарубежные исследователи акцентировали внимание в основном на активных системах, функционирующих в условиях внешней интервальной неопределенности и симметричной информированности (см. классификацию в [21, 44]), ограничиваясь в большинстве случаев либо двухэлементными системами [65], либо случаем идентичных АЭ [57, 64]. В работах российских авторов построены оптимальные СРСС для ряда практически важных частных случаев, в том числе - рассматриваемых ниже линейных функциях затрат АЭ и функциях затрат вида ci(yi) = ki c(yi) [4, 55]. Там же показано, что в случае интервальной неопределенности (незнании центром истинных значений параметров {ki}) СРСС могут быть более эффективны, чем системы стимулирования следующего вида: i(y) = yi / y j. Сравниj =1 n тельная эффективность СРСС и других систем стимулирования практически не исследовалась. Следует отметить, что теоретико-игровой анализ СРСС (или соревновательных механизмов стимулирования, как их иногда называют [15]), гораздо более сложен и трудоемок, нежели, чем "обычных" или нормативных систем стимулирования. Основная PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory сложность заключается в том, что при использовании СРСС у АЭ не существует равновесных по Нэшу стратегий, следовательно, возникает необходимость введения гипотез о поведении элементов [47] и искусственного построения множества решений игры. Как отмечалось выше, в настоящей работе нас в основном интересует сравнительная эффективность тех или иных систем стимулирования в многоэлементных активных системах. Поэтому, не вдаваясь в подробности теоретико-игрового анализа, оценим эффективность соревновательных РСС в сравнении с "абсолютно оптимальными" квазикомпенсаторными системами стимулирования. Предположим, что в активной системе, состоящей из n АЭ, выполнены предположения А.5.1-А.5.3 и А.5.5, а центр использует следующую систему стимулирования: действия, выбранные АЭ, упорядочиваются в порядке возрастания, после чего каждый из АЭ получает вознаграждение qi, соответствующее его номеру i в упорядочении действий. Пусть выполнены предположения А.5.1-А.5.3 и А.5.4. Понятно, что первый АЭ (имеющий максимальные затраты при любом допустимом действии) будет всегда выбирать нулевое действие, поэтому положим вознаграждение q1 за первое место в упорядочении действий равным нулю: q1 = 0. Будем рассматривать серию моделей АС, последовательно усложняя их. При этом каждая последующая модель будет включать предыдущую в качестве частного случая. Начнем с рассмотрения активной системы, в которой АЭ имеют линейные функции затрат [4, 55]: ci(yi) = ki yi, ki > 0, причем: (1) k1 k2... kn. Линейные функции затрат при условии (1) удовлетворяют предположениям А.5.2-А.5.5. Предположим, что упорядочение действий, выбираемых АЭ, совпадает с упорядочением значений их функций затрат:

* * * * (2) y 0 = 0 y1 y 2... y n. Отметим, что упорядочение (2) совпадает с оптимальным назначением АЭ в соответствующей задаче о назначении (см. формальные результаты выше в разделе 5.1).

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Рассматривая последовательно АЭ в порядке возрастания их номеров, из условия того, что предыдущий АЭ может угрожать последующему АЭ увеличением действия и занятием более высокого места до тех пор, пока его полезность неотрицательна, получаем, что при заданной соревновательной системе стимулирования {qi} действия, выбираемые АЭ, определяются следующим образом:

* (3) y 0 = 0, yi* = i q j q j 1 k j, i = 2,n.

j = В другую сторону, если задан вектор y* A', то из условия "угроз" получаем, что вознаграждения должны удовлетворять: (4) q1 = 0, qi = qi-1 + ki-1( yi* - yi*1 ) = j =2 i 1 j = i kj-1 ( y * -), i = 2,n. j Выражение (4) для индивидуальных вознаграждений можно записать следующим образом: qi = (kj-1 - kj) y * + ki-1 yi*. Из j (3)-(4) следует, что рассматриваемая соревновательная система стимулирования является прогрессивной, то есть вознаграждение АЭ возрастает с ростом занимаемого места. При этом превышение суммарными затратами на стимулирование минимально необходимых равно: (5) (СРСС, QK) = i= n { j = i kj-1 ( y * - y *1 ) - ki yi* } 0. j j Условия (3)-(4) по своему построению обеспечивают невыгодность для каждого АЭ выбора действия с номером, превышающим его номер в упорядочении затрат. Однако условие реализуемости некоторого действия подразумевает, что выбор этого действия выгоден АЭ по сравнению с выбором любого другого допустимого действия. Невыгодность выбора элементом действий, номер которых строго меньше его номера в упорядочении затрат, обосновывается в доказательстве следующей леммы. Лемма 5.2.1. Соревновательная система стимулирования (4) реализует вектор действий (2). Доказательство. Фиксируем произвольное i I. Предположим, i-му АЭ выгодно занять l-ое место, то есть, что существует дейст PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory вие yl* < yi*, такое, что имеет место: fi( y l* ) > fi( yi* ). Тогда (6) j = l kj-1 ( y* j y *1 ) j ki y l* > j = i kj-1 ( y * - y *1 ) - ki yi*. j j Преобразовывая (6) и пользуясь упорядочением коэффициентов функций затрат АЭ, получаем y l* > y l* - противоречие. • Следствием доказательства результата леммы 5.2.1 является утверждение о том, что в классе соревновательных систем стимулирования реализуемы такие и только такие вектора действий, компоненты которых удовлетворяют упорядочению (2). Сравним эффективности соревновательных и нормативных ранговых систем стимулирования. Из предшествующего анализа свойств УНРСС получаем, что вектор действий y* A' реализуем ~ ~ следующей УНРСС { qi (y*)}: qi (y*) = вательно:

j = i kj ( y * - y *1 ). Следоj j ~ (7) i = 1,n qi(y*) - qi (y*) = j = i (kj-1 - kj) ( y * - y *1 ) 0. j j n i Сравнивая (5) и (7), получаем, что (8) y* A' СРСС(y*) - УНРСС(y*) = i = j = (kj-1 - kj) ( y * - y *1 ) 0. j j Из (8) следует, что минимальные суммарные затраты на стимулирование по реализации произвольного вектора действий выше при использовании соревновательных ранговых систем стимулирования (по сравнению с универсальными нормативными). Следовательно, СРСС менее эффективны, чем УНРСС. Потери в эффективности могут быть количественно оценены из выражений (4), (7) и (8). Усложним модель, предположив, что функции затрат АЭ имеют вид: ci(yi) = ki c(yi), где коэффициенты ki удовлетворяют (1). Относительно функции c() предположим, что она непрерывна, монотонно возрастает и c(0) = 0 (при этом выполнены предположения А.5.2-А.5.5). Отметим, что при c(yi) = yi получаем рассмотренный выше частный случай линейных функций затрат АЭ.

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Предположим, что действия АЭ, реализуемые СРСС, удовлетворяют (2). По аналогии с тем, как это делалось для линейных затрат, принимая соглашение, что, если верхний индекс суммирования меньше нижнего, то вся сумма равна нулю, получаем (ср. с (3) и (4)):

* (9) y 0 = 0, yi* = c-1{ i q j q j 1 k j }, i = 2,n, j = (10) q1 = 0, qi = j= i kj-1 (c( y * ) - c( y *1 )), i = 2,n. j j Имея выражения (9) и (10), можно решать задачи синтеза СРСС, удовлетворяющих тем или иным свойствам. Например, в [55] решалась задача синтеза СРСС, удовлетворяющей ограничению фонда заработной платы R:

i = n qi R.

Из (9)-(10) видно, что рассматриваемая соревновательная система стимулирования является прогрессивной. Результат леммы, характеризующей множество действий, реализуемых СРСС, также остается в силе (доказательство проводится аналогичным образом, изменяются лишь используемые при оценках неравенств преобразования). Превышение суммарными затратами на стимулирование минимально необходимых равно: (12) (СРСС, QK) = i= n { j = i (kj-1 - kj) c( y * ) } 0. j Как и ранее, сравним эффективности соревновательных и нормативных ранговых систем стимулирования. Из предшествующего анализа свойств УНРСС получаем, что вектор действий y* ~ A' реализуем следующей УНРСС { qi }:

~ qi (y*) = j = i kj (с( y * ) - с( y *1 )). j j Тогда имеет место следующее соотношение между индивидуальными вознаграждениями:

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory ~ i = 1,n qi(y*) - qi (y*) = j = i (kj-1 - kj) (с( y * ) - с( y *1 )) 0, j j следовательно, справедливо следующее соотношение между минимальными затратами на стимулирование: (13) y* A' СРСС(y*) - УНРСС(y*) = = i = n i j = (kj-1 - kj) (с( y * ) - с( y *1 )) 0. j j И соотношения (13) следует, что для рассматриваемой модели также имеет место (8), то есть минимальные суммарные затраты на стимулирование по реализации произвольного вектора действий по-прежнему выше при использовании соревновательных ранговых систем стимулирования (по сравнению с универсальными нормативными). Следовательно, и в случае ci(yi) = ki c(yi) СРСС менее эффективны, чем УНРСС. Усложним рассматриваемую модель. Предположим, что АЭ имеют произвольные функции затрат, удовлетворяющие А.5.3А.5.4. Теорема 5.2.1. Если выполнены предположения А.5.3-А.5.4, то необходимым и достаточным условием реализуемости вектора действий АЭ y* A в классе СРСС является выполнение (2), причем данный вектор реализуем следующей системой стимулирования: (14) qi(y*) = j = i {cj-1( y * ) - cj-1( y *1 )}, i = 1,n. j j Доказательство теоремы 5.2.1 проведем по аналогии с доказательствами для частных случаев выше. Последовательно рассматривая АЭ (начиная с первого в упорядочении затрат по убыванию), получаем, что (14) в силу лемм 5.1.1 – 5.1.4 обеспечивает невыгодность угроз со стороны любого АЭ элементам с большим номером. Проверим выполнение "обычных" условий реализуемости. Фиксируем произвольный номер i I и предположим, что i-му АЭ выгодно занять l-ое место, то есть, что существует действие y l* < yi*, такое, что имеет место: fi( y l* ) > fi( yi* ). Тогда PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory (15) j= l {cj-1( y * ) - cj-1( y *1 )} - ci( y l* ) > j j > j= i {cj-1( y * ) - cj-1( y *1 )} - ci( yi* ). j j Преобразовывая (15) к виду:

j = l + i {cj-1( y * ) - cj-1( y *1 )} < ci( yi* ) - ci( y l* ) j j и пользуясь упорядочением и свойствами функций затрат АЭ, отражаемыми предположениями А.5.3-А.5.4, приходим к противоречию. • Гораздо более важную методологическую роль, чем ее доказательство, играют содержательные интерпретации утверждения теоремы 5.2.1. Из лемм 5.1.1-5.1.4 и 5.2.1 следует, что унифицированными РСС реализуемы только такие действия, которые являются решением соответствующей задачи о назначении, кроме того, в рамках предположений А.5.2-А.5.4 оптимально диагональное назначение. Следовательно, условие (2) является необходимым условием реализуемости. Для того чтобы доказать, что СРСС (14) реализует вектор действий (2) необходимо и достаточно показать, что выполнены два условия. Первое условие - условие реализуемости "обычной" системой стимулирование, то есть условие того, что каждому АЭ невыгодно изменять свою стратегию при фиксированной обстановке игры (условия равновесия Нэша). Второе условие характерно для соревновательных систем стимулирования, так как для них условий "обычной" реализуемости недостаточно - следует проверить условия "угроз" (см. выше). Утверждение "некоторый АЭ не может быть спокоен до тех пор, пока другой АЭ может угрожать ему изменением своей стратегии", выражающее условие "угроз", отражает, фактически, предположения АЭ о поведении других АЭ. Следовательно, при использовании СРСС необходимо, но недостаточно накладывать условия реализуемости (в смысле Нэша), а следует использовать доопределение равновесия (в данном случае - аналог равновесия PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Штакельберга) [47, 57, 66]. Используя (14), легко получить оценки сравнительной эффективности СРСС и УНРСС, а также СРСС и компенсаторных систем стимулирования (неравенства выполнены в силу предположений А.3. и А.4): (16) y* A' СРСС(y*) - УНРСС(y*) = = i = n n i j = [cj-1( y * ) - сj( y * ) + cj( y *1 ) - сj-1( y *1 )] 0. j j j j { (17) (СРСС, QK) = i= j = i {cj-1( y * ) - cj-1( y *1 )} - ci( yi* )} 0. j j Рассмотренные выше линейные и другие функции затрат удовлетворяют предположениям А.5.3-А.5.4 - легко видеть, что, соответственно, выражение (14) включает выражения (4) и (10) и т.д. как частные случаи. Разность (16) может также интерпретироваться как доплата за условие "угроз" по сравнению с равновесием Нэша. В заключение настоящего раздела отметим, что выше было получено общее решение задачи синтеза оптимальной унифицированной нормативной ранговой системы стимулирования (см. леммы раздела 5.1 и соответствующий алгоритм). Для соревновательных систем стимулирования решение и оценки сравнительной эффективности получены лишь в рамках дополнительных предположений А.5.3-А.5.4 о свойствах функций затрат АЭ. Поэтому перспективным направлением дальнейших исследований является получение решения задачи синтеза оптимальной соревновательной системы стимулирования в общем случае. Для последнего можно утверждать, что необходимые условия реализуемости, приведенные выше (см. теорему 5.2.1) останутся в силе, изменятся лишь достаточные условия, обеспечивающие невыгодность "угроз".

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory 6. УНИФИЦИРОВАННЫЕ ПРОПОРЦИОНАЛЬНЫЕ СИСТЕМЫ СТИМУЛИРОВАНИЯ Как было показано выше и в [18,36,42], в некоторых АЭ использование унифицированных систем стимулирования может приводить к снижению эффективности управления. В то же время, в некоторых АЭ, в том числе - в рассматриваемых ниже, оптимальными являются именно унифицированные системы стимулирования. Введем следующее предположение относительно функций затрат АЭ (ниже это предположение будет ослаблено): (1) ci(yi,ri) = ri (yi /ri), i I, где () - гладкая монотонно возрастающая выпуклая функция, (0)=0, (например, для функций типа Кобба-Дугласа (t) = 1/ t, 1), ri > 0 - некоторый параметр. Если центр использует пропорциональные (L-типа) индивидуальные системы стимулирования: i(yi) = i yi, то целевая функция АЭ имеет вид: fi(yi) = i yi - ci(yi). Вычислим действие, выбираемое АЭ при использовании центром некоторой фиксированной системы стимулирования: (2) yi* (i) = ri ' -1(i), где ' -1() - функция, обратная производной функции (). Минимальные суммарные затраты на стимулирование равны:

(3) L() = i = n i ri ' -1(i), где = (1, 2,..., n). Суммарные затраты элементов равны:

(4) c() = i = n ri ( ' -1(i)).

В рамках приведенной выше общей формулировки модели пропорционального стимулирования возможны различные постановки частных задач. Рассмотрим некоторые из них. Задача 1. Пусть центр заинтересован в выполнении элементами плана R по суммарному выпуску с минимальными суммарными затратами АЭ (еще раз подчеркнем необходимость различения PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory c( ) min (5) n *, yi ( i ) = R i = суммарных затрат элементов и суммарных затрат (центра) на стимулирование). Тогда его цель заключается в выборе ставок оплаты {i} в результате решения следующей задачи:

решение которой имеет вид:

* (6) i* = '(R/W);

yi* = ri (R/W);

iI, c* = W(R/W);

L = R '(R/W).

где W = ri. Так как оптимальные ставки оплаты одинаковы для i = n всех АЭ, то оптимальна именно унифицированная (!) система стимулирования. Задача 2. Содержательно двойственной к задаче 1 является задача максимизации суммарного выпуска при ограничении на суммарные затраты АЭ:

n * y ( ) max (7) i i. i =1 c( ) R Решение задачи 2 имеет вид: (8) i* = '( -1(R/W));

yi* = ri -1(R/W);

i I, * c* = R;

L = - 1(R/W)W'( -1(R/W)), то есть в двойственной задаче (естественно) оптимальным решением также является использование унифицированных пропорциональных систем стимулирования. Замена в задачах 1 и 2 суммарных затрат элементов на суммарные затраты на стимулирование порождает еще одну пару двойственных задач. Задача 3. Если центр заинтересован в выполнении АЭ плана R по суммарному выпуску с минимальными суммарными затратами на стимулирование, то ставки оплаты определяются в результате решения следующей задачи:

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory L ( ) min (9) N *, yi ( i ) = R i = решение которой совпадает с (6)! Задача 4 заключается в максимизации суммарного выпуска при ограничении на суммарные затраты на стимулирование:

N * y ( ) max (10) i i. i =1 L ( ) R Из метода множителей Лагранжа получаем условие оптимальности ( - множитель Лагранжа): ' -1(i) ''(i) + i = 1, i I, из которого следует, что все ставки оплаты должны быть одинаковы и удовлетворять уравнению ' -1() = R/W. Следует подчеркнуть, что во всех четырех задачах оптимальными оказались именно унифицированные системы стимулирования, причем решения задач 1 и 2 совпали, что представляется достаточно уникальным фактом, так как суммарные затраты АЭ отражают интересы управляемых субъектов, а суммарные затраты на стимулирование - интересы управляющего органа. Кроме того, возможность использования общих для всех АЭ управляющих параметров оказывается важной в механизмах планирования (см. [10, 15, 21]). Таким образом, мы доказали следующий результат. Теорема 6.1. В организационных системах со слабо связанными АЭ, функции затрат которых имеют вид (1), унифицированные системы стимулирования оптимальны на множестве пропорциональных систем стимулирования. Возникает закономерный вопрос - насколько жесткими являются требования к функциям затрат АЭ. Оказывается, эти требования можно ослабить - в задачах типа задачи 1 и задачи 2 оптимальность унифицированных систем стимулирования является следствием свойств задач условной оптимизации и практически не зависит от конкретного вида функций затрат. Рассмотрим организационную систему со слабо связанными элементами, в которой функции затрат АЭ ci(yi) - гладкие, возрастающие и выпуклые (содержательно, выпуклость "нужна" для PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory единственности точки максимума разности между линейным стимулированием и затратами). Вектор действий, реализуемый пропорциональной системой стимулирования со ставками {i}, суммарные затраты АЭ и суммарные затраты на стимулирование определяются, соответственно: (11) yi* (i)=ci' -1(i), iI;

c()= ci(ci ' -1(i));

L()= i ci ' -1(i).

i =1 i =1 n n Для задач типа 1 и 2, применяя метод множителей Лагранжа, получаем, что при ослаблении требований к функциям затрат оптимальными остаются унифицированные системы стимулирования (например, в задаче 1 оптимальное значение удовлетворяет уравнению:

i = n ci ' -1() = R). Для задач типа 3 и 4, к сожалению, в общем случае унифицированные системы стимулирования не оптимальны. Применяя к ним, опять же, метод множителей Лагранжа, легко показать, что достаточным условием для оптимальности систем стимулирования UL-типа является существование функции (), такой, что i I ci ' -1(i) ci''(i) = (i). Отметим, что в приведенной выше теореме утверждается, что системы стимулирования UL-типа оптимальны на множестве пропорциональных систем стимулирования в АЭ со слабо связанными АЭ, имеющими функции затрат вида (1). Поэтому в заключение настоящего раздела исследуем их сравнительную эффективность на множестве всевозможных (не только пропорциональных) систем стимулирования. Как было показано выше для этого достаточно сравнить минимальные затраты на стимулирование, например, в задаче 2, с затратами на стимулирование в случае использования центром оптимальных квазикомпенсаторных систем стимулирования (которые равны QK(y*) = i = n ri (yi/ri)).

Решая задачу выбора вектора y* A', минимизирующего QK(y*) при условии yi* i = n * = R, получаем, что QK = W (R/W).

* Подставляя из выражения (6) UL = R '(R/W), вычислим отноше PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory ние минимальных затрат на стимулирование:

* * (12) UL / QK = R/W '(R/W)/(R/W). * * Из выпуклости функции (.) следует, что UL / QK 1. Так как суммарные затраты на стимулирование при использовании систем стимулирования UL-типа выше, чем при использовании "абсолютно оптимальных" систем стимулирования QK-типа, следовательно, первые не оптимальны в классе всевозможных систем стимулирования. Более того, можно показать, что при R/W > 0 и строго выпуклых функциях затрат отношение (12) строго больше единицы. Полученный для многоэлементных организационных систем результат вполне согласован с выводом [36, 42] о том, что в одноэлементных системах эффективность пропорционального стимулирования не выше, чем квазикомпенсаторного.

7. СТИМУЛИРОВАНИЕ В МНОГОЭЛЕМЕНТНЫХ АКТИВНЫХ СИСТЕМАХ С НЕОПРЕДЕЛЕННОСТЬЮ В предыдущих разделах настоящей работы построены оптимальные системы стимулирования в детерминированных многоэлементных АС, то есть в АС, в которых центр и активные элементы обладают полной (и, следовательно, симметричной) информацией обо всех существенных внешних и внутренних параметрах. Напомним, что при этом оптимальна та или иная модификация компенсаторной системы стимулирования, причем ключевыми (на этапе согласования) являются две идеи: идея декомпозиции игры активных элементов (специфичная для многоэлементных АС) и идея компенсации затрат (которая оказалась эффективной как в одноэлементных, так и в многоэлементных АС). Имея результаты исследования задач стимулирования в детерминированных многоэлементных АС, можно переходить к исследованию этих задач в АС с неопределенностью.

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Задачи стимулирования в одноэлементных АС с неопределенностью подробно описаны в монографии [44]. Перечислим кратко основные используемые в упомянутой работе подходы и полученные результаты. Одним из оснований классификации АС с неопределенностью является информированность участников. Можно выделить АС с симметричной (одинаковой) и асимметричной информированностью участников (в первую очередь важно определить различия в информированностях АЭ и центра), а также на детерминированные АС и АС с неопределенностью. В свою очередь АС с неопределенностью могут классифицироваться по следующим основаниям. 1. Тип неопределенности: внутренняя неопределенность (относительно параметров самой АС), для внутренней неопределенности - относительно целевых функций, допустимых множеств или и того и другого;

внешняя неопределенность (относительно параметров окружающей среды, то есть внешних по отношению к АС) и смешанная неопределенность (для части участников АС - внутренняя, для других - внешняя;

или обоих типов);

2. Вид неопределенности: интервальная (когда участнику АС известно множество возможных значений неопределенного параметра), вероятностная (известно вероятностное распределение вероятностные АС) и нечеткая (известна функция принадлежности - нечеткие АС) неопределенность, а также смешанная неопределенность (все возможные комбинации перечисленных видов неопределенности для различных участников). Таким образом, АС, функционирующие в условиях неопределенности, могут быть классифицированы по: информированности участников (симметричная - С, асимметричная - А), типу неопределенности (внутренняя и внешняя) и виду неопределенности (интервальная, вероятностная и нечеткая). Перечисляя все возможные комбинации значений признаков классификации по этим основаниям, получаем двенадцать1 базовых моделей АС с неопре Если попытаться перенести описанную систему классификаций на многоэлементные АС с неопределенностью, то следует помнить, что в общем случае каждый их участников АС может обладать различной информированностью, то есть в многоэлементных АС в общем случае PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory деленностью, которые, совместно с базовой детерминированной моделью в [44] условно обозначены М1 - М13. Приведенные в [44] результаты систематического исследования базовых задач стимулирования в одноэлементных АС с неопределенностью свидетельствуют, что в рамках базовых моделей (одноэлементных, статических) стимулирования возможен единый методологический подход к решению задач анализа и синтеза систем стимулирования. Несмотря на многообразие изучаемых моделей, используемый подход заключается в единообразии их описания, общности технологии и техники исследования, причем последняя основывается, как и детерминированная теория активных систем, на изучении множеств реализуемых действий и минимальных затрат на стимулирование. Поясним последнее утверждение, приведя описание, технологию и технику построения и исследования моделей механизмов стимулирования как в детерминированных одноэлементных и многоэлементных активных системах, так и в одноэлементных АС с различными типами и видами неопределенности. После описания модели, то есть задания в соответствии с введенными параметрами модели и системой классификаций задач управления в АС [42, 44] класса исследуемых активных систем, определяется рациональное поведение АЭ: на основании известных предпочтений АЭ на множестве результатов деятельности и/или действий (эти предпочтения зависят от используемого центром механизма управления) и имеющейся информации о неопределенных факторах (взаимосвязи между действиями АЭ и результатами его деятельности) определяются предпочтения АЭ на множестве его стратегий (действий и/или сообщаемых оценок). В случае интервальной неопределенности этот переход осуществляется с использованием принципа максимального гарантированного результата (МГР), в случае вероятностной (нечеткой) неопределенности целевая функция АЭ на множестве результатов его деятельности совместно с распределением вероятностей (нечеткой информационной функцией) индуцирует на множестве допустимых стратегий целевую функцию - ожидаемую полезность имеет место смешанная неопределенность. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory (индуцированное нечеткое отношение предпочтения (НОП) и т.д.). Множество выбора (решений игры) при заданном множестве стратегий и предпочтениях АЭ, выражаемых, например, его целевой функцией, НОП и т.д., определяется следующим стандартным образом. В одноэлементных АС считается, что АЭ выбирает одно из действий, максимизирующих его целевую функцию (ожидаемую полезность), или максимально недоминируемое по индуцированному нечеткому отношению предпочтения допустимое действие. В многоэлементных АС считается, что вектор стратегий, выбираемых АЭ, принадлежит множеству равновесий (равновесий Нэша, равновесий в доминантных, гарантирующих или других стратегиях – в зависимости от используемых гипотез и принятой в рассматриваемой модели концепции равновесия). В случае если множество выбора состоит более чем из одного элемента, необходимо доопределить однозначно (используя гипотезу благожелательности (ГБ) или МГР) выбор АЭ. Этот выбор будет зависеть от механизма управления, эффективность которого задается значением целевой функции центра на множестве выбора АЭ (если предпочтения центра зависят от неопределенных параметров, то необходимо найти его детерминированную систему предпочтений). Имея критерий сравнения эффективностей различных систем стимулирования на их допустимом множестве, задача синтеза в АС с неопределенностью (и в детерминированных АС – см. выше) формулируется следующим образом: найти допустимую систему стимулирования, имеющую максимальную эффективность. Техника доказательства большинства формальных результатов использует анализ множества реализуемых действий - тех действий АЭ, которые он выбирает (гарантированно или по ГБ) при заданной функции стимулирования. Критерий сравнения различных систем стимулирования по эффективности может быть сформулирован в терминах множеств реализуемых действий: чем "шире" множество действий, реализуемых системой стимулирования, тем в рамках ГБ выше ее эффективность (двойственным подходом является сравнение минимальных затрат на стимулирование по реализации фиксированного действия) [44]. Поэтому оптимальная PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory система стимулирования (точнее - их класс) имеет максимальное множество реализуемых действий. Следовательно, для того, чтобы доказать оптимальность некоторого класса систем стимулирования достаточно показать, что не существует другой допустимой системы стимулирования, имеющей большее множество реализуемых действий. Этот подход оказывается плодотворным не только при доказательстве оптимальности тех или иных систем стимулирования, но и при исследовании свойств решения, влияния неопределенности и т.д. Помимо метода анализа множеств реализуемых действий существует альтернативный подход – метод анализа минимальных затрат центра на стимулирование [42, 44], заключающийся в определении для каждого допустимого вектора действий АЭ системы стимулирования, реализующей этот вектор как решение (желательно, единственное!) игры АЭ и требующей от центра минимальных затрат по вознаграждению АЭ. Оптимальной при этом является класс систем стимулирования, реализующих любой вектор действий с минимальными затратами центра. Метод анализа минимальных затрат на стимулирование «проще» метода анализа множеств реализуемых действий в том смысле, что при его использовании на втором этапе решения задачи стимулирования центр определяет оптимальное с его точки зрения реализуемое действие, то есть производит выбор элемента множества A’, на котором достигается максимум его скалярной функции (разности между функцией дохода и суммарными затратами на стимулирование), а не выбирает из множества M (являющегося подмножеством пространства кусочно-непрерывных функций) функцию, доставляющую максимум критерию эффективности стимулирования. В многоэлементных АС для «сведения» задачи стимулирования к набору хорошо известных одноэлементных задач используется описанная в четвертом разделе настоящей работы идея декомпозиции игры активных элементов. В качестве иллюстрации использования единства предложенного подхода сформулируем, следуя идеологии, развиваемой в [44], общую для всех моделей АС с неопределенностью (одноэлементных и многоэлементных) последовательность их исследования, включающую следующие этапы:

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory 1. Описание модели: определение целевых функций и допустимых множеств, их свойств, а также порядка функционирования и информированности участников АС;

2. Определение рационального поведения АЭ в рамках рассматриваемой модели: задание процедуры (метода) устранения неопределенности и рационального выбора АЭ (определение множества решений игры - множества реализуемых действий);

3. Определение эффективности механизма стимулирования и формулировка, собственно, задачи синтеза оптимального механизма стимулирования;

4. Решение задачи синтеза: поиск аналитического решения и/или разработка алгоритмов численного решения задачи и исследование их свойств: сходимости, сложности и т.д.;

5. Нахождение необходимых и достаточных условий оптимальности;

6. Анализ оптимального решения: а) свойства оптимального решения, множеств реализуемых действий и минимальных затрат на стимулирование, содержательные интерпретации;

б) влияние неопределенности на эффективность и свойства оптимального механизма стимулирования;

в) влияние параметров модели и определения рационального поведения на эффективность и свойства оптимального механизма стимулирования, в том числе - анализ устойчивости оптимального решения;

7. Исследование частных случаев (при усилении предположений и допущений о параметрах и свойствах модели АС) и возможностей обобщения (соответственно, при ослаблении);

8. Исследование устойчивости решений и адекватности модели моделируемой системе. 9. Внедрение результатов моделирования: идентификация АС, корректировка модели, разработка рекомендаций по практическому использованию, создание вычислительных средств, автоматизированных систем поддержки принятия решений и имитационных моделей.

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Сводка результатов теоретического исследования задач стимулирования в одноэлементных АС с неопределенностью, а также конкретные вводимые при этом предположения приведены в [44]. Отдельного обсуждения заслуживает влияние неопределенности на эффективность управления АС, так как возможность использования единого подхода к анализу базовых моделей механизмов управления (стимулирования) в АС с различными типами и видами неопределенности позволяет сделать ряд общих выводов о роли неопределенности в управлении АС. Все задачи стимулирования в одноэлементных АС с неопределенностью, рассматриваемые в ТАС, удовлетворяют принципу соответствия1: при предельном переходе ("стремлении" неопределенности к "нулю") они переходят в детерминированные АС, а их оптимальные решения - в оптимальные решения соответствующих детерминированных задач стимулирования. Принципу соответствия удовлетворяют также большинство выводов о влиянии неопределенности на эффективность стимулирования в одноэлементных АС, причем, что представляется крайне важным, опять же, общей является следующая технология анализа роли неопределенности в АС с неопределенностью. Для двух АС, отличающихся либо множеством значений неопределенного фактора, либо той информацией, которую имеют о нем участники АС, вводится критерий сравнения "величин" неопределенности, с одной стороны учитывающий специфику задачи, а с другой - согласованный с известными мерами неопределенности (например энтропией и т.д.) [44]. Далее показывается, что в АС с большей неопределенностью множество действий АЭ, реализуемых любой допустимой системой стимулирования, не шире (шире), чем в АС с Принцип соответствия может быть сформулирован и для задач стимулирования в многоэлементных АС. Например, если в модели S4 предположить, что затраты сепарабельны, то все результаты должны перейти в соответствующие результаты, полученные для модели S3. Далее, если в модели S3 предположить, что стимулирование каждого АЭ зависит только от его собственных действий, то все результаты должны перейти в соответствующие результаты, полученные для модели S1. Отметим, что для моделей S1-S8, описанных в четвертом разделе настоящей работы, принцип соответствия имеет место. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory меньшей неопределенностью, что позволяет сделать вывод о сравнительной эффективности оптимальных систем стимулирования в этих АС. Альтернативный способ – сравнение минимальных затрат центра на стимулирование: если для любого вектора действий АЭ в АС с большей неопределенностью затраты центра по его реализации выше, чем в АС с меньшей неопределенностью то эффективность стимулирования в первом случае не ниже, чем во втором. Для всех одноэлементных моделей, независимо от типа и вида неопределенности, справедливы следующие выводы: гарантированная эффективность стимулирования в АС с неопределенностью не выше, чем в детерминированной АС, причем с ростом неопределенности эффективность стимулирования уменьшается, а с уменьшением неопределенности – возрастает и стремится к аналогичному показателю для соответствующей детерминированной активной системы. В одноэлементных моделях величина неопределенности связана с информированностью участников: чем большей информацией обладает центр и/или АЭ, тем меньше неопределенность. В большинстве известных моделей считается, что участники АС, обладая на момент принятия решения некоторой информацией, могут использовать эту информацию и только ее. Возможность получения дополнительной информации отсутствует (использование механизмов с сообщением информации от АЭ центру не является исключением: несмотря на то, что центр получает новую информацию, он получает ее после выбора процедуры планирования, причем сам факт обмена информацией изначально заложен в механизме функционирования). Такой порядок функционирования достаточно распространен на практике. Однако встречаются ситуации, в которых участники АС имеют возможность до принятия решения целенаправленно получать информацию от «окружающей среды» или от других участников системы, причем, в большинстве случаев, для получения этой информации необходимы некоторые финансовые или какие-либо другие затраты. Механизмы управления, в которых участники АС имеют возможность за плату приобрести информацию, получили название механизмов с платой за информацию [44]. При использовании механизмов с платой за информацию имеют место две противопо PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory ложные тенденции. С одной стороны, получение дополнительной информации может повысить эффективность управления. С другой стороны, часть средств, потраченная на приобретение информации, уменьшает доход участника АС или его возможности по управлению, что может привести к снижению эффективности управления. Если точность и количество поступающей информации монотонно связаны с затратами по ее получению, то, очевидно, существует некоторый оптимум - компромисс между снижением эффективности, вызванным уменьшением управляющих возможностей, и ее ростом, обусловленным большей информированностью. При этом не исключается, что возможны ситуации, в которых приобретать дополнительную информацию вообще не имеет смысла (плата слишком высока), или наоборот, оказывается целесообразным полное устранение неопределенности. Существенной чертой механизмов с платой за информацию является добровольность ее приобретения: каждый из участников АС вправе самостоятельно решать приобретать ли ему дополнительную информацию и в каком объеме. Понятно, что, в принципе, приобретать информацию могут как центр, так и активные элементы. Важно также различать, у кого приобретается информация - у третьих лиц, не входящих в состав АС, или у участников самой активной системы. Так, например, возможны механизмы с сообщением информации в АС, в которых центр может, заплатив АЭ определенную сумму, например, уменьшить диапазон возможных (неизвестных для него) значений неопределенного параметра, а затем использовать механизм планирования уже в условиях меньшей неопределенности. Задача манипулирования [42] при этом все равно возникает, однако, следует учитывать, что плата за информацию может изменить значение целевой функции АЭ. Для получения ответа на вопрос целесообразно ли использование механизмов с платой за информацию и определения оптимальной величины этой платы, необходимо в каждом конкретном случае: определить зависимость информированности участников АС от величины платы за информацию;

найти соотношение между эффективностью управления и информированностью участников (величина платы за информацию выступает при этом как пара PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory метр);

вычислить величину платы за информацию, максимизирующую эффективность управления. Аналогичные рассуждения справедливы, видимо, и для многоэлементных АС с неопределенностью и могут рассматриваться как «программа» их исследования. Ниже описывается ряд моделей многоэлементных АС с неопределенностью, которые исследуются в соответствии с приведенной выше методикой. Таким образом, на сегодняшний день имеются единые методологические подходы (и полученные в рамках этих подходов конструктивные результаты) к исследованию как многоэлементных детерминированных АС, так и одноэлементных АС с неопределенностью. Полное и систематическое исследование всех моделей многоэлементных АС с неопределенностью представляется задачей, не актуальной на сегодняшний день по следующим причинам. Во-первых, многообразие этих моделей слишком велико (см. сноску выше). Во-вторых, отличаются эти модели не столь сильно: из предшествующего изложения материала настоящей работы видно, что все восемь базовых моделей многоэлементных детерминированных АС имеют много общего, если не в описании, то в методах их исследования;

кроме того сформулирован единый подход к анализу задач стимулирования в условиях неопределенности. Следовательно, можно предположить, что в первом приближении при исследовании той или иной конкретной модели многоэлементной АС с неопределенностью можно ограничиться адаптированным применением упомянутых подходов (некоторые примеры приведены ниже). Поэтому в настоящей главе основной акцент делается на выявление специфики многоэлементных АС с неопределенностью как по сравнению с детерминированными многоэлементными АС, так и по сравнению с одноэлементными АС с неопределенностью. Кроме того, как следует из материала предыдущих шести разделов, одни базовые модели стимулирования в многоэлементных АС являются частными случаями других, поэтому ниже мы ограничимся изучением факторов неопределенности в двух наиболее сложных моделях с несепарабельными затратами: S4 (стимулирование каждого АЭ зависит от действий всех АЭ) и S6 (стимулирование каждого АЭ зависит от результата деятельности АС в целом).

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory 7.1. ВНУТРЕННЯЯ НЕОПРЕДЕЛЕННОСТЬ Под внутренней неопределенностью понимают неполную информированность части участников АС о параметрах самой АС. Рассмотрим случай асимметричной информированности без сообщения информации1. Так как исследователь операций стоит на позициях оперирующей стороны – центра, то обычно предполагается, что он менее информирован, чем активные элементы. Пусть внутренними параметрами, неизвестными центру, являются параметры {ri} функций затрат АЭ: ci(y, ri), i I. То есть будем считать, что на момент принятия решений (выбора действия при известной функции стимулирования) i-ый АЭ знает истинное значение параметра ri, а центр как на момент принятия решений (то есть на момент выбора функции стимулирования), так и в дальнейшем2, не знает его, а имеет некоторую информацию. В зависимости от той информации, которой обладает центр, различают интервальную неопределенность (когда центру известно множество [di;

Di] возможных значений параметра ri, i I), вероятностную неопределенность (когда центру дополнительно известно вероятностное распределение pi(ri), i I) и нечеткую неопределенность (когда центр имеет нечеткую информацию – знает функцию ~ принадлежности параметра: Pi : [di;

Di] [0;

1], i I). Рассмотрим последовательно три случая: интервальной, вероятностной и нечеткой внутренней неопределенности участников при асимметричной информированности.

Как отмечается в [16], в АС с асимметричной информированностью одним из эффективных способов снижения неопределенности является сообщение информации от более информированных участников менее информированным (то есть от АЭ – центру). При этом возникают задачи построения неманипулируемых механизмов (в которых АЭ выгодно сообщать достоверную информацию) и др., заслуживающие отдельного исследования и выходящие за рамки настоящей работы. 2 Если после выбора АЭ действия центру становится известным истинное значение параметра функции затрат АЭ, то возможно использование механизмов гибкого планирования [4, 33], в которых вознаграждение АЭ параметрически зависит от r. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory 7.1.1. ИНТЕРВАЛЬНАЯ НЕОПРЕДЕЛЕННОСТЬ Пусть в n-элементной АС типа S4 функции затрат АЭ имеют вид: ci(y, ri), i I, а относительно параметров ri центру известны множества i = [di;

Di] их допустимых значений. Равновесие Нэша EN(, r), где r = (r1, r2, …, rn), естественно, зависит от истинных значений параметров функций затрат и используемой центром системы стимулирования: (1) EN(, r) = {yN A’ | i I, yi Ai N N i(yN) – ci(yN, ri) i( y i, yi) – ci( y i, yi, ri)}. Обозначим = i.

iI Определим эффективность системы стимулирования M. Если при использовании центром системы стимулирования и при векторе r параметров функций затрат АЭ множество равновесий Нэша есть EN(, r), то в рамках гипотезы благожелательности эффективность стимулирования K() равна максимальному (по множеству равновесий Нэша) значению целевой функции центра. Это значение зависит от неопределенного параметра r. Используя для устранения этой неопределенности МГР, получаем: (2) K() = min max {H(y) - ci ( y, ri ) }.

r yE N (,r ) iI Решение задачи K() max, где K() определяется выраже M нием (2), является достаточно сложной задачей. Поэтому воспользуемся методом анализа минимальных затрат на стимулирование совместно с идеей декомпозиции игры АЭ. Фиксируем некоторый вектор действий y* A’. Из результата теоремы 4.4.1 следует, что, если бы вектор r был известен, то минимальные затраты на стимулирование по реализации вектора действий y* A’ равнялись бы следующей величине: (3) (y*, r) = ci ( y *, ri ).

iI Оптимальное решение задачи синтеза оптимальной системы стимулирования в условиях интервальной неопределенности дается следующей теоремой.

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Теорема 7.1.1. Система стимулирования (с параметром y*):

max ci ( yi*, y i, ri ) + i, yi = yi*, i I, (4) i (y, y) = rii 0, yi yi* где оптимальное значение y * параметра y* является решением Г * задачи: (5) y * = arg max {H(y) - Г(y)}, где Г yA (6) Г(y) = iI rii max ci ( y, ri ), -оптимальна. Доказательство. Из доказательства теоремы 4.4.1 следует, что для того, чтобы действие yi* было доминантной стратегией i-го АЭ, следует использовать компенсаторную систему стимулирования (см. выражение (1б) в разделе 4.4 выше). Кроме этого, для того, чтобы побудить i-го АЭ выбрать действие yi* необходимо, как минимум, компенсировать ему затраты (условие индивидуальной рациональности). Максимально возможные (в рамках существующей информированности центра) затраты АЭ при выборе этого действия (и при обстановке игры y-i) равны max ci ( yi*, y i, ri ), rii i I. Следовательно система стимулирования (4) гарантированно реализует вектор действий y* A’ с минимальными затратами центра на стимулирование, определяемыми выражением (6). Имея минимальные затраты по гарантированной реализации произвольного вектора действий АЭ, можно решить задачу оптимального согласованного планирования, то есть найти допустимый вектор действий y *, который доставляет максимум разности Г между функцией дохода центра и его затратами на стимулирование по гарантированной реализации этого вектора действий (см. выражение (5)). • Отметим, что сравнение выражений (3) и (6) позволяет предложить следующий «качественный» метод решения задач стиму PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory лирования в многоэлементных АС с внутренней интервальной неопределенностью и асимметричной информированностью: следует в качестве затрат АЭ рассматривать максимально возможные его (в рамках имеющейся информированности центра) затраты, после чего задача сводится к детерминированной задаче стимулирования в модели S4, методы решения которой подробно описаны в разделе 4.4. Исследуем роль неопределенности, то есть ее влияние на гарантированную эффективность стимулирования. Понятно, что, если неопределенность отсутствует, то есть i = ri, i I, то результат теоремы 7.1.1 переходит в результат теоремы 4.4.1. Напомним, что в случае интервальной неопределенности критерием сравнения информированностей центра служит вложенность множеств возможных значений неопределенных параметров [44]. Следствие 7.1.2. С ростом неопределенности гарантированная эффективность стимулирования (в многоэлементной АС с внутренней интервальной неопределенностью и асимметричной информированностью) не возрастает. С уменьшением неопределенности гарантированная эффективность стимулирования возрастает и стремится к гарантированной эффективности стимулирования в соответствующей детерминированной модели. Справедливость утверждения следствия следует из сравнения выражений (3) и (6) и теоремы о минимальных затратах на стимулирование [42]. Пример 10. Пусть в АС имеются два АЭ со следующими функциями затрат: ci(y) = ( y i + y i ) 2, i = 1, 2, где < 1 - неко2ri торый параметр (см. также для сравнения примеры 4 и 8). Пусть функция дохода центра H(y) = y1 + y2. Предполагая существование внутреннего решения, получим следующую зависимость оптимальных с точки зрения центра действий АЭ от параметров их функций затрат: (7) yi* = ri ri 1, i=1, 2.

Максимальное значение целевой функции центра * зависит PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory от вектора r неопределенных параметров следующим образом: (8) *(r) = ( r1 + r2 ) 1. 1 + Из выражения (8) следует, что максимальное значение целевой функции центра монотонно по r. В то же время, функции затрат АЭ убывают с ростом r, поэтому при вычислении МГР целевая функция центра минимизируется на множестве возможных значений r. Снижение неопределенности соответствует уменьшению множества. С уменьшением множества, по которому вычисляется минимум, значение самого минимума не уменьшается. Следовательно, с увеличением информированности центра гарантированная эффективность стимулирования не убывает. • 7.1.2. ВЕРОЯТНОСТНАЯ НЕОПРЕДЕЛЕННОСТЬ Пусть в n-элементной АС типа S4 функции затрат АЭ имеют вид: ci(y, ri), i I, а относительно параметров ri центру известны множества i = [di;

Di] их допустимых значений и распределения вероятностей pi(ri), с носителем i. Обозначим p(r), r, – распределение вектора параметров функций затрат АЭ, и для определенности предположим, что y A’ функции ci(y, ri) непрерывны и убывают по ri, i I. Рассмотрим возможные подходы к определению эффективности системы стимулирования M. Так как, помимо диапазона возможных значений параметра функции затрат АЭ, центру известно его вероятностное распределение, то в соответствии с принципами устранения неопределенности, приведенными в [44], рациональность поведения центра будет заключаться в вычислении и максимизации математического ожидания своей целевой функции, то есть в использовании оценки ожидаемой полезности. Вся проблема заключается в согласовании определения ожидаемой полезности с определением решения игры АЭ (в одноэлементных АС такая проблема, естественно, не возникала). Предположим, что центр использует в рамках ГБ следующую оценку эффективности системы стимулирования M:

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory (1) K() = yE N (,r ) max {H(y) - (y)} p(r) dr.

Однако, использование усреднения по множеству равновесий Нэша (максимум max в выражении (1) стоит под интегралом) yE N (,r ) неправомочно по следующей причине. Пусть мы определили систему стимулирования, максимизирующую (1). При ее использовании центром в общем случае может оказаться, что параметры функций затрат АЭ таковы, что действие, на котором достигается максимум подынтегрального выражения не будет являться равновесием Нэша1 при данных функциях затрат и данной функции стимулирования. Примером может служить случай, когда центр компенсирует АЭ затраты, то есть использует систему стимулирования с параметром r, оптимальную при каждом фиксированном значении этого параметра (см. выражение (1б) в разделе 4.4.1 и выражения (3)-(6) в разделе 7.1.1). Следовательно, необходимо другое (отличное от (1)) определение эффективности системы стимулирования. Можно рассмотреть случай, когда центр определяет эффективность системы стимулирования следующим образом. Обозначим Fi(ri) – соответствующую плотности pi(ri) интегральную функцию распределения, i I. Пусть центр использует следующую «компенсаторную» систему стимулирования: (2) i (y*, y, t) = ci ( yi*, y i, ti ) + i, yi = yi*, i I. yi yi* 0, Тогда, в рамках введенного выше предположения о монотонном убывании функций затрат с ростом значения неопределенного параметра и предположений А.1 - А.3, введенных в разделе 2, i-ый АЭ с вероятностью (1 – Fi(ti)) выбирает действие, совпадающее с Отметим, что при определении равновесия Нэша в случае внутренней интервальной неопределенности (см. выражение (1) в разделе 7.1.1) знание каждым АЭ истинных значений параметров функций затрат других АЭ было «не очень» существенно, так как использованием системы стимулирования (4) центр декомпозировал игру АЭ. В случае вероятностной неопределенности предположения о знании или незнании i-ым АЭ вектора r-i становится существенным. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory yi* (так как в этом случае его затраты не больше, чем ci(y*, ti)), и с вероятностью Fi(ti) – нулевое действие. Следовательно, для фиксированного вектора действий y* A’ можно определить оптимальное (с точки зрения эффективности и риска) значение ti*, i I, а затем уже решать задачу выбора оптимального вектора действий АЭ. Описанная схема принятия решений (центром) в условиях неопределенности кажется несколько неестественной, поэтому можно рекомендовать использовать для устранения неопределенности принцип МГР (фактически, отказываясь от части информации1, то есть заменять вероятностную неопределенность интервальной) или использовать механизмы с сообщением информации (см. замечание выше). 7.1.3. НЕЧЕТКАЯ НЕОПРЕДЕЛЕННОСТЬ Пусть в n-элементной АС типа S4 функции затрат АЭ имеют вид: ci(y, ri), i I, а относительно параметров ri центру известны множества i = [di;

Di] их допустимых значений и функции принадлежности ~i ( ri ), с носителем i, ~i : i [0;

1], i I. p p Если определять эффективность стимулирования непосредственно с использованием нечетких информационных функций, то возникнут проблемы, аналогичные описанным выше для случая вероятностной неопределенности в разделе 7.1.2, что приведет к необходимости использования пессимистичных оценок, то есть принципа МГР. Поэтому рассмотрим альтернативный подход. Имея информацию о четкой функции затрат АЭ ci(y, ri) (с точностью до значения параметра ri), можно, в соответствии с принципом обобщения [35, 44], определить нечеткую функцию затрат ~ ~ АЭ: ci ( y, u ), ci : A’ 1 [0;

1], i I.

Качественное этот эффект можно объяснить следующим образом: имеющаяся у центра информация о вероятностном распределении не позволяет «разумно» согласовать его информированность с информированностью АЭ (равновесием Нэша). PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Введем следующее определение (по аналогии с тем как это делалось в [34] для нечеткой функции дохода): нечеткая функция ~ затрат ci ( y, u ) согласована1 с четкой функцией затрат ci(y), если y A’, i I выполнено: ~ 1) ci ( y, c( y )) = 1;

~ ~ 2) u1, u2: u1 u2 c(y) ci ( y, u1 ) ci ( y, u2 ) ;

~ ~ 3) u1, u2: c(y) u1 u2 ci ( y, u1 ) ci ( y, u2 ). Предположим, что всем АЭ известны четкие функции дохода {ci(y)}, удовлетворяющие предположениям А.1-А.3 (см. раздел 2), а ~ центру известны нечеткие функции затрат АЭ { ci ( y, u ) }, согласованные с соответствующими четкими функциями затрат. ~ Если нечеткие функции затрат ci ( y, u ), i I, таковы, что ~ y A’ равенство ci ( y, u ) = 1 выполнено тогда и только тогда, ~ когда u = c(y) и функции { ci ( y, u ) } согласованы с соответствующими четкими функциями затрат, то, очевидно, получается четкая (детерминированная) задача, для которой может быть использован результат теоремы 4.4.1. Введем рассмотрение следующие четкие «функции затрат»2: ~ (1) cimax ( y ) = max {u 1 | ci ( y, u ) = 1}, i I. Обозначим (2) Г(y) = cimax ( y ).

iI Введенное определение согласованности представляется вполне естественным и легко интерпретируемым: имеющаяся у центра нечеткая информация не должна противоречить реальным значениям параметров функций затрат АЭ. 2 Несколько забегая вперед, сделаем следующее качественное замечание: к «функциям затрат» (1) ниже будет применена теорема 4.4.1, что совместно с условиями согласованности соответствующих четких и нечетких функций затрат АЭ позволит доказать -оптимальность системы стимулирования, компенсирующей затраты (1) (см. для сравнения выражения (4)-(6) в разделе 7.1.1). Другими словами, конструкция, типа выражения (1), является результатом совместного применения определения согласованности и принципа МГР. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Теорема 7.1.3. Система стимулирования (с параметром y*): (3) i (y*, y) = cimax ( yi*, y i ) + i, yi = yi*, i I, yi yi* 0, где оптимальное значение y * параметра y* является решением Г задачи: (4) y * = arg max {H(y) - Г(y)}, Г yA -оптимальна. Доказательство. Из доказательства теоремы 4.4.1 (см. также доказательство теоремы 7.1.1) следует, что для того, чтобы действие yi* было доминантной стратегией i-го АЭ, следует использовать компенсаторную систему стимулирования (см. выражения (1б) в разделе 4.4 и выражение (4) в разделе 7.1). Кроме этого, для того, чтобы побудить i-ый АЭ выбрать действие yi* необходимо, как минимум, компенсировать ему затраты (условие индивидуальной рациональности). Из предположения о том, что нечеткие функции затрат АЭ, известные центру, согласованы с их четкими функциями затрат, и выражения (1) следует, что оценка сверху возможных (в рамках существующей информированности центра) затрат АЭ при выборе этого действия (и при обстановке игры y-i) равны cimax ( yi*, y i ), i I. Следовательно система стимулирования (3) гарантированно реализует вектор действий y* A’ с минимальными затратами центра на стимулирование, определяемыми выражением (2). Имея минимальные затраты по гарантированной реализации произвольного вектора действий АЭ, можно решить задачу оптимального согласованного планирования, то есть найти допустимый вектор действий y *, который доставляет максимум разности Г между функцией дохода центра и его затратами на стимулирование по гарантированной реализации этого вектора действий (см. выражение (4)). • Исследуем роль неопределенности. Понятно, что, если неоп PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory 1, ti = ri, i I, (при ределенность отсутствует, то есть ~i (ti ) = p 0, ti ri 1, u = ci ( y ) этом ~i ( y, u ) = c, i I), то результат теоремы 7.1.3 0, u ci ( y ) переходит в результат теоремы 4.4.1. Напомним, что в случае нечеткой неопределенности критерием сравнения информированностей центра служит вложенность нечетких множеств неопределенных параметров [44]. Другими ~ словами, при нечеткой функции затрат АЭ c 1i ( y, u ) информированность центра меньше, чем при нечеткой функции затрат АЭ ~ c 2 i ( y, u ), если выполнено:

~ ~ (5) y A’, u 1 c 1i ( y, u ) c 2 i ( y, u ). Следствие 7.1.4. С ростом неопределенности гарантированная эффективность стимулирования (в многоэлементной АС с внутренней нечеткой неопределенностью и асимметричной информированностью) не возрастает. С уменьшением неопределенности гарантированная эффективность стимулирования возрастает и стремится к гарантированной эффективности стимулирования в соответствующей детерминированной модели. Справедливость утверждения следствия следует из теоремы о минимальных затратах на стимулирование [42] с учетом того, что, если выполнено (5), то, очевидно, имеет место следующее соотношение: ci1max ( y ) ci2 max ( y ), i I. Пример 11. Пусть в АС имеются два АЭ со следующими ( y i + y i ) 2 функциями затрат: ci(y, ri) =, i = 1, 2, где < 1 2ri некоторый параметр (см. также для сравнения примеры 4, 8 и 10). Пусть функция дохода центра H(y) = y1 + y2, а нечеткая функция затрат имеет вид:

1, u [ci ( y, Di );

ci ( y, d i )] (6) ~i ( y, u ) = c, i I, 0, u [ci ( y, Di );

ci ( y, d i )] где di Di, i I, - некоторые константы.

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory В соответствии с выражением (1) вычисляем:

cimax ( y ) = ci(y, di), i I.

Замечая, что мы оказались в условиях примера 10, воспользуемся выражением (8) из раздела 7.1.1 и вычислим: * = ( d1 + d 2 ) 1 1+.

Таким образом, результаты, полученные для интервальной и для нечеткой внутренней неопределенности, согласованы. • 7.2. ВНЕШНЯЯ НЕОПРЕДЕЛЕННОСТЬ Под внешней неопределенностью понимают неполную информированность части участников АС о параметрах окружающей среды (состоянии природы), то есть параметрах, внешних по отношению к рассматриваемой АС. Рассмотрим случай симметричной информированности участников АС относительно неопределенных факторов, при которой и центр, и АЭ имеют одинаковую информацию о состоянии природы, но, быть может, асимметрично информированы относительно других показателей функционирования АС. Пусть затраты АЭ ci(y), i I, несепарабельны, зависят от действий АЭ и достоверно известны центру1. Неопределенность (неполная информированность) участников АС относительно состояния природы учитывается в модели следующим образом. Будем считать, что действия АЭ y = (y1, y2, …, yn) A’ совместно с состоянием природы = (1, 2, …, n) приводят к тому, что реализуется некоторый результат деятельности АС z = (z1, z2,…, zn) A0, причем каждая компонента результата деятельности zi A0i, i I, A0 = A0i, зависит от действий всех АЭ iI То есть будем считать, что на момент принятия решений (выбора действия при известной функции стимулирования) i-ый АЭ знает истинное значение параметра ri, и центр также на момент принятия решений (то есть на момент выбора функции стимулирования) знает его, то есть имеет достоверную информацию. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory и соответствующей компоненты состояния природы, то есть имеет место: (1) zi = zi(y, i), i I, где функции («технологические» зависимости [9, 59]) {zi(,)}, наряду с допустимыми множествами i i, = i, известны iI центру и всем АЭ. Относительно целевых функций и допустимых множеств, дополнительно к предположениям А.1-А.4, примем следующее предположение: А.7.1. i I A0i = Ai;

зависимости zi(y, i) непрерывны по всем переменным и однозначны. Содержательно, предполагается, что множества возможных действий и результатов деятельности каждого АЭ совпадают. Наиболее распространенной (см. [44]) интерпретацией такого предположения является представление состояния природы как, например, аддитивной «помехи», накладываемой на действие АЭ. Порядок функционирования и информированность участников АС следующие: центр сообщает АЭ систему стимулирования {i(z)}, то есть совокупность зависимостей индивидуальных вознаграждений АЭ от результата деятельности АС, после чего АЭ выбирают свои действия, ненаблюдаемые для центра1. Принципиально важно, что в рассматриваемой модели ни центр, ни АЭ, на момент выбора стратегий не знают значения состояния природы, которое реализуется после выбора ими стратегий и приведет к некоторому (единственному в силу предположения А.7.1) результату деятельности. Наблюдаемый и центром, и АЭ результат деятельности определяет вознаграждение АЭ и доход центра. Ненаблюдаемость для центра действий АЭ объясняет то, что их вознаграждение зависит от наблюдаемого результат деятельности. Если бы действия АЭ были наблюдаемы, то центр мог бы основывать стимулирование на выбираемых АЭ действиях и «забыть» о неопределенности», то есть задача свелась бы к детерминированной задаче стимулирования, которая подробно описана выше. 2 Следует отметить, что рассматриваемая модель является обобщением известной одноэлементной модели стимулирования в условиях неопределенности, подробно описанной в работах [8,20, 35-44, 54] (см. также PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Опишем целевые функции участников АС. Целевая функция центра представляет собой разность между доходом, зависящим от действий АЭ1, и суммарными затратами на стимулирование: (2) (z, y) = H(y) - i ( z).

iI Целевая функция АЭ есть разность между его вознаграждением и затратами, зависящими в силу несепарабельности от действий всех АЭ: (3) fi(z, y) = i(z) – ci(y), i I. Отметим, что целевые функции участников АС зависят как от выбираемых ими стратегий (функций стимулирования и действий), так и от неопределенных факторов (результатов деятельности, которые действительно являются неопределенными, так как зависят от состояния природы). Поэтому необходимо конкретизировать принципы рационального поведения участников АС, то есть принципы выбора ими стратегий в условиях имеющейся неопределенности. Для этого необходимо четко определить, какой информацией о состоянии природы они обладают. В зависимости от той информации, которой обладает участник АС (центр и АЭ), различают интервальную неопределенность (когда известно множество i возможных значений параметра i, i I), вероятностную неопределенность (когда дополнительно известно вероятностное распределение pi(i), i I) и нечеткую неопределенность (когда имеется нечеткая информация – функция ~ принадлежности состояния природы параметра: Pi : i [0;

1], i I) (ниже последовательно рассматриваются три случая: интервальной, вероятностной и нечеткой внешней неопределенности обзоры [9, 10, 34]). 1 Если функция дохода центра (и/или функции затрат АЭ) зависит от результатов деятельности, то, устраняя неопределенность, можно перейти к соответствующим функциям, зависящим от действий АЭ (см. подробности в [9, 42, 44]). При этом если функции затрат АЭ зависят от результатов деятельности других АЭ, которые в свою очередь зависят от действий всех АЭ, то при определении равновесия Нэша (см. выражение (4) ниже) существенным становится наблюдаемость каждым активным элементом действий всех АЭ. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory участников АС при симметричной их информированности). Вернемся к обсуждению рационального поведения. В соответствии с общей методологией принятия решений в условиях неопределенности [42, 44, 66] игроки устраняют неопределенность с использованием всей имеющейся у них информации, сводя тем самым задачу принятия решений к детерминированной. Интервальная неопределенность устраняется, как правило, применением принципа МГР, вероятностная неопределенность – переходом к ожидаемой полезности (вычислением математического ожидания полезности (целевой функции) по известному распределению вероятности), нечеткая неопределенность – переходом к НОП, индуцированному на множестве допустимых действий целевой ~ функцией АЭ (3) и нечеткой информационной функцией Pi [44]. Прежде чем переходить к изучению многоэлементных АС с внешней неопределенностью, рассмотрим детерминированный аналог предложенной модели, который в дальнейшем будет являться той «точкой отсчета», для которой будет проверяться выполнение принципа соответствия, относительно которой будет изучаться роль неопределенности и т.д. (см. введение к настоящему разделу). Итак, предположим, что участники АС на момент принятия решений имеют достоверную информацию о состоянии природы. Запишем определение равновесия Нэша (решения игры АЭ), которое зависит от используемой центром системы стимулирования и состояния природы: (4) EN(, ) = {yN A’ | i I, yi Ai i(z1(yN, 1), z2(yN, 2), …, zn(yN, n)) – ci(yN) N N N N i(z1( y i, yi, 1), z2( y i, yi, 2), …, zn( y i, yi, n)) – ci( y i, yi)}.

В условиях полной информированности представляют интерес следующие варианты: Вариант 1. Функция дохода центра и функции затрат АЭ зависят от действий АЭ, которые наблюдаются всеми участниками АС;

Вариант 2. Функция дохода центра зависит от наблюдаемого им результата деятельности АС, а функции затрат АЭ – от их действий, которые ненаблюдаемы для центра;

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Вариант 3. Функция дохода центра и функции затрат АЭ зависят от действий АЭ, которые ненаблюдаемы для центра. Первый вариант, как отмечалось выше, тривиален – центр может основывать стимулирование на наблюдаемых действиях, то есть получаем в точности детерминированную модель S4. Рассмотрим второй вариант. Фиксируем произвольный вектор y* A’ действий АЭ. Тогда рассматриваемая модель (при фиксированном r ) принадлежит классу S6 моделей многоэлементных детерминированных АС, в которых стимулирование каждого АЭ зависит от результата деятельности АС, определяемого (в условиях отсутствия неопределенности) действиями АЭ при несепарабельных затратах. Специфика рассматриваемой модели заключается в том, что оператор Q() в ней имеет следующий «векторный» вид: Q: A’ A0, или в «поэлементном» представлении: Qi: A’ i A0i, i I, причем значение (в каждом конкретном случае) состояния природы является параметром. Определим Y(z, ) = {y A’ | z(y, ) = z} A’, z A0 – множество тех действий АЭ, выбор которых при данном состоянии природы приводит к реализации заданного результата их деятельности z A0. При компенсации центром затрат активных элементов минимальные затраты на стимулирование по реализации результата деятельности z A0 равны: (z, ) = yY ( z, ) i = min n ci(yi), а целевая функция центра равна: (z, ) = H(z) - (z, ). В соответствии с результатами раздела 4.6 на первом шаге решения задачи стимулирования определим множество векторов действий АЭ, приводящих к заданному результату деятельности и требующих минимальных затрат на стимулирование по своей реализации: Y*(z, ) = Arg yY ( z, ) i = min n ci(y). Фиксируем произволь ный вектор y*(z, ) Y*(z, ) Y(z, ). Тогда при использовании центром системы стимулирования (5) i* (x(), z) = ci ( y * ( x ( )), z = x ( ), i I, z x ( ) 0, PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory где x() A0 – параметр (план), результат деятельности x() A0 реализуется с минимальными затратами центра на стимулирование (см. теорему 4.6.1). Возможно использование более простых, чем (5) конструкций, учитывающих специфику рассматриваемой модели. Например, система стимулирования (6) i* (x(), z) = yY ( z, ) max ci ( y ) + i, z = z ( y, ) 0, z z( y, ), i I, где x() A0 – параметр (план), реализует результат деятельности x() A0 как равновесие Нэша1 (естественно, система стимулирования (6) имеет не более высокую эффективность, чем оптимальная система стимулирования (5)). Очевидно, что эффективности совпадают в случае, когда по наблюдаемому результату деятельности и состоянию природы центр в состоянии восстановить действия АЭ, то есть, например, когда выполнено: i I y1, y2 A’, y1 y2, zi(y1, ) zi(y2, ) и i I y A’, 1, 2, 1 2, zi(y, 1) zi(y, 2). Наиболее выгодный для центра результат деятельности АС * x () A0, который может рассматриваться как гибкий (зависящий от состояния природы – см. выше) план, определяется как решение задачи оптимального согласованного планирования: x*() = arg max [H(z) - (z, )].

z A Таким образом, второй вариант может рассматриваться как частный случай модели S6. Аналогичным образом можно показать, что третий вариант совпадает с моделью, описанной в разделе 4.7. Итак, для рассматриваемой модели в условиях полной информированности решение задачи стимулирование дается теоремами 4.2.1, 4.3.1, 4.4.1, 4.5.1, 4.6.1. Отметим, что системы стимулирования (5) и (6) реализуют соответствующие вектора действий АЭ как равновесия Нэша. Гораздо сложнее обстоит дело с реализацией По аналогии с результатами, полученными для модели S2, можно потребовать строгой положительности констант i, тем самым обеспечить единственность равновесия Нэша, перейти к индивидуальному стимулированию и т.д. (см. разделы 4.2 и 4.4). PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory определенных действий АЭ как равновесий в доминантных стратегиях. Для этого (опять же в соответствии с теоремами, приведенными в четвертом разделе) необходимо, чтобы центр мог компенсировать каждому АЭ затраты независимо от обстановки игры при условии, что данный АЭ выбрал требуемое действие. Для этого, как минимум, необходимо, чтобы центр был в состоянии наблюдать или однозначно восстанавливать действие каждого АЭ. В рассматриваемой (детерминированной!) модели это возможно далеко не всегда (в общем случае – невозможно). Тем более затруднительна идентификация индивидуальных действий в условиях, когда присутствует неопределенность относительно состояния природы1. Поясним последнее утверждение. Единственным достаточно подробно исследованным классом задач стимулирования в многоэлементных АС с неопределенностью являются задачи теории контрактов [63, 65], то есть задачи с внешней вероятностной неопределенностью и симметричной информированностью (см. классификацию в [44] и обзоры [9, 34]). Для этого класса задач в рамках обобщения двушагового метода [58-60] для конечных допустимых множеств задача стимулирования сводится к набору задач выпуклого программирования, обладающих чрезвычайно высокой вычислительной сложностью. Таким образом, общих подходов к аналитическому2 решению многоэлементной задачи стимулирования в условиях неопределенности, описанной выше, на сегодняшний день, к сожалению, не существует. Следовательно, необходимо упрощать модель, стреРешение широкого класса задач теории контрактов, использующее идею определения множеств действий АЭ, которые в условиях вероятностной неопределенности могут приводить к наблюдаемым результатам деятельности, приведено в находящейся в печати статье А.Д. Халезова "Общее решение дискретной задачи центр-агент с симметричной информацией в условиях риска". 2 Для теории активных систем характерно стремление к поиску именно аналитических решений, позволяющих исследовать зависимость оптимального решения от параметров модели АС (общие результаты о структуре оптимального решения, конечно, также представляют теоретический интерес, однако их использование на практике затруднительно хотя бы в силу высокой вычислительной сложности соответствующих алгоритмов) [21, 44]. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory мясь получать конструктивные и содержательно интерпретируемые теоретические результаты, которые могли бы в дальнейшем найти применение на практике. Поэтому упростим модель, введя предположение о том, что результат деятельности каждого АЭ зависит только от его собственного действия и соответствующей компоненты состояния природы, то есть будем считать1, что zi = zi(yi, i), i I. В этом случае возможно комбинированное применение идеи декомпозиции игры АЭ и результатов исследования моделей стимулирования в одноэлементных АС, функционирующих в условиях неопределенности. Проиллюстрирует это утверждение, рассмотрев ряд моделей многоэлементных АС с интервальной, вероятностной и нечеткой внешней неопределенностью при симметричной информированности участников. 7.2.1. ИНТЕРВАЛЬНАЯ НЕОПРЕДЕЛЕННОСТЬ Предположим, что всем участникам АС на момент принятия решений известны множества {i} возможных значений неопределенного параметра, а также «технологические» зависимости {zi(,)}. Пусть: затраты АЭ несепарабельны и зависят от действий АЭ, а центр использует стимулирование каждого АЭ, зависящее от результатов деятельности всех АЭ. Тогда целевые функции центра и АЭ имеют, соответственно, вид: (1) (z, y) = H(y) - i ( z), iI (2) f(z, y) = i(z) – ci(y). Фиксируем некоторое значение параметра и запишем определение равновесия Нэша: (3) EN(, ) = {yN A’ | i I, yi Ai Данное предположение частично декомпозирует игру АЭ – результат деятельности каждого из них зависит уже только от его собственных действий и состояния природы (но не зависит от действий других АЭ), в то время как другие переменные – стимулирование и затраты – попрежнему зависят, соответственно, от результатов деятельности и действий всех АЭ. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory N N N i(zi( yiN, i), z-i( y i, -i))–ci(yN) i(zi(yi, i), z-i( y i, -i))–ci(yi, y i )}. Предположим, что и центр, и АЭ при устранении неопределенности используют принцип МГР. Однако одного этого предположения оказывается недостаточно для корректного определения равновесия Нэша в рамках рассматриваемой модели. Действительно, в выражении (3) можно брать min fi(y, ) или решать систему ii неравенств (для i I) и т.д. Другими словами, поиск решения игры в условиях неопределенности сталкивается с множеством как методологических, так и «технических», трудностей, происхождение которых качественно можно объяснить тем, что, фиксируя M и записывая определение множества решений игры при данной системе стимулирования, мы обрекаем себя на поиск системы стимулирования, оптимальной в соответствующем подмножестве M функционального пространства, что само по себе является нетривиальной задачей. Вспомним, что помимо метода анализа множеств реализуемых действий для решения задачи стимулирования может использоваться не менее эффективный метод анализа минимальных затрат на стимулирование [44], который заключается в том, что для каждого вектора действий АЭ ищется минимальная система стимулирования, его реализующая, а затем на этапе согласованного планирования определяется оптимальный вектор реализуемых действий. То есть при использовании метода анализа минимальных затрат на стимулирование оптимизация производится в более простом пространстве ( n), чем пространство кусочно-непрерывных положительнозначных функций, которое приходится использовать при применении метода множеств реализуемых действий. Введем следующее предположение. А.7.2. zi(,) – непрерывные однозначные строго монотонные функции своих переменных, i I. Обозначим Zi(yi, i) = {zi A0i | zi = zi(yi, i), i i} – множество тех результатов деятельности i-го АЭ, которые могут реализоваться при выборе им действия yi Ai и всевозможных состояниях природы.

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Теорема 7.2.1. Если выполнено предположение А.7.2, то система стимулирования (4) i(y*, zi) = * ci ( yi*, y i ), zi Z i ( yi*, i ) 0, zi Z i ( yi*, i ), i I, реализует (как равновесие Нэша) вектор действий y* A’, который оптимален при условии (5) y* Arg max {H(y) - ci ( y ) }.

yA' iI Доказательство. Фиксируем произвольный вектор y* A’ действий АЭ и запишем условия его гарантированной реализуемости как равновесия Нэша системой стимулирования {i}:

* (6), i I, yi Ai i(y*, zi( yi*, i), z-i( y i, -i)) – ci(y*) * * i(y*, zi(yi, i), z-i( y i, -i)) – ci(yi, y i )}. Из условий индивидуальной рациональности АЭ (напомним, что условие индивидуальной рациональности АЭ гласит, что в равновесии значение его целевой функции должно быть неотрицательно) следует, что должно быть выполнено: * (7), i I i(y*, zi( yi*, i), z-i( y i, -i)) ci(y*), то есть левая часть неравенств (6) неотрицательна. Так как системы неравенств (6) и (7) должны иметь место при любом значении неопределенного параметра, то, если использовать систему стимулирования {i(z)} (в которой вознаграждение каждого АЭ зависит от результатов деятельности всех АЭ), то придется брать минимум в левых частях выражений (6) и (7) по всему множеству. Поэтому лучше (с точки зрения гарантированной эффективности стимулирования) использовать систему индивидуального стимулирования {i(zi)}. При ее использовании условие (7) примет вид:

(8) i I, i i i(y*, zi( yi*, i)) ci(y*). Система стимулирования (4) удовлетворяет ограничениям (8) как равенствам. Докажем, что при ее использовании y* - точка Нэша. Из предположения А.7.2 следует, что i I y1 y2 Ai симметрическая разность множеств Zi(y1, i) и Zi(y2, i) непуста:

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Zi(y1, i) Zi(y2, i), то есть при использовании центром системы стимулирования (4) и выборе i-ым АЭ действия yi yi* всегда найдется такое состояние природы i i, при котором вознаграждение АЭ будет равно нулю. Следовательно, система стимулирования (4) гарантированно реализует вектор y* A’ как равновесие Нэша1. Выражение (5) означает, что центр побуждает АЭ выбрать наиболее выгодное для себя (то есть максимизирующее разность между доходом и затратами на стимулирование) гарантированно реализуемое действие. • Исследуем роль неопределенности. Сравнивая выражения (4) и (1) (из раздела 4.2), замечаем, что затраты центра на стимулирование одинаковы в детерминированной модели и в рассматриваемой модели АС с внешней интервальной неопределенностью. Содержательно это можно объяснить симметричной информированностью центра и АЭ и «осторожностью» АЭ (использованием ими МГР)2. Например, если бы сепарабельные затраты i-го АЭ зависели от результата его деятельности, то центр был бы вынужден компенсировать ему max ci ( zi ).

* ziZi ( yi,i ) В предельном случае (при переходе к соответствующей детерминированной АС) теорема 7.2.1 переходит в теорему 4.2.1. 7.2.2. ВЕРОЯТНОСТНАЯ НЕОПРЕДЕЛЕННОСТЬ Пусть затраты всех АЭ несепарабельны и зависят от результатов деятельности, то есть ci = ci(z), i I. Предположим, что на По аналогии с тем, как это делалось в теореме 4.2.1, можно в выражение (4) добавить константы {i}, обеспечивающие единственность равновесия Нэша, или наложить дополнительные ограничения (см. пункты а)-в) в теореме 4.2.1), обеспечивающие существование РДС (при условии, что АЭ использует МГР) и т.д. 2 Если предположение центра, что АЭ используют МГР не оправдывается, то результат теоремы 7.2.1 не имеет места (см. для сравнения анализ влияния неопределенности в разделе 7.1.1). PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory момент принятия решений участники АС обладают одинаковой информацией о распределениях вероятностей {pi(zi, yi)} результатов деятельности АЭ в зависимости от его действия, и «технологических» зависимостях {zi(,)}. К сожалению, на сегодняшний день даже для одноэлементных АС, функционирующих в условиях внешней вероятностной неопределенности, не получены общие аналитические решения задач стимулирования второго рода. Поэтому в настоящем разделе мы рассмотрим модель, для которой решения одноэлементных задач известны, проиллюстрировав эффективность использования идеи декомпозиции игры АЭ в многоэлементной вероятностной АС. Предположим, что распределения вероятностей (интегральные функции распределения) имеют следующий вид (так называемая модель простого АЭ): (1) Fi ( zi, yi ) = Fi ( zi ), zi < yi, i I. zi yi 1, Для одноэлементной модели простого АЭ доказана оптимальность компенсаторных систем стимулирования [16, 44]. Теорема 7.2.2. В рамках ГБ система стимулирования * ci ( zi, z i ), zi yi* (2) i(y, zi) =, i I, zi > yi* 0, * реализует (как равновесие Нэша) вектор действий y* A’, который оптимален при условии1 (3) y* Arg max {H(y) - E ci ( z ) }.

yA' iI Доказательство. В работах [16, 44] доказано, что в модели простого АЭ стационарные точки полезности АЭ и его ожидаемой полезности совпадают. По аналогии можно показать, что в многоэлементной АС при фиксированной обстановке игры совпадают стационарные (по стратегии данного АЭ) точки полезности АЭ и его ожидаемой полезности. В соответствии с результатом теоремы 4.2.1 при использова Напомним, что “E” обозначает оператор вычисления математического ожидания. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory нии центром системы стимулирования (2) вектор z* A0, z* = y*, является «равновесием Нэша», то есть доставляет максимум целевой функции АЭ при фиксированных результатах деятельности остальных АЭ. Следовательно, при фиксированной обстановке игры он доставляет максимум и ожидаемой полезности АЭ, то есть y* - равновесие Нэша. При этом компенсаторная система стимулирования (2) является минимальной, то есть характеризуется минимальными затратами центра на стимулирование. Ожидаемые затраты центра на стимулирование равны: (4) E ci ( z ) = iI iI A0 i { ci ( zi, z i ) pi ( zi ) dzi + * yi * [1 - Fi( yi* )] ci( yi* )} p-i(z-i, y i ) dz-i. Подставляя (4) в целевую функцию центра, получаем условие оптимальности (3). • В предельном случае (при переходе к соответствующей детерминированной АС) теорема 7.2.1 переходит в теорему 4.2.1, а выражение (4) в ci ( y * ). iI 7.2.3. НЕЧЕТКАЯ НЕОПРЕДЕЛЕННОСТЬ Рассмотрим следующую модель многоэлементной АС с нечеткой внешней неопределенностью и симметричной информированностью участников. Пусть: вектор результатов деятельности АЭ z принадлежит компакту A0 в n;

затраты АЭ зависят от результатов деятельности и несепарабельны, а функция дохода центра зависит от действий АЭ. Информированность участников АС следующая: на момент принятия решений и центр, и АЭ имеют нечеткую информацию о состоянии природы и «технологических» зависимостях {zi(,)}. В соответствии с принципом обобщения [35] этого достаточно, что~ бы определить нечеткую информационную функцию P (z, y), ~ P : A0 A’ [0;

1], ставящей в соответствие вектору действий АЭ нечеткое подмножество множества результатов деятельности.

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Обозначим ~ (1) Q(z) = {y A’ | P (z, y) = 1}. ~ (2) Z(y) = {z A0 | P (z, y) = 1}. Введем следующие предположения. ~ А.7.3. Нечеткие функции P (z, y) 1-нормальны [35, 41, 44], то ~ ~ есть y A’ z A0: P (z, y) = 1 и z A0 y A’: P (z, y) = 1. Если выполнено предположение А.7.3, то y A’ z A0 Q(z), Z(y). Более сильным, чем А.7.3 является следующее предположение: А.7.4. А.7.3 и U Q ( z ) = A’, U Z ( y ) = A0.

zA0 y A' А.7.5. Целевые функции АЭ и нечеткая информационная ~ функция P (z, y) полунепрерывны сверху1.

z Обозначим E N ( ) - множество равновесных по Нэшу результатов деятельности АЭ: z (3) E N ( ) = {zN A0 | i I, zi A0i N N i(zN) – ci(zN) i(zi, z i ) – ci(zi, z i )}.

Обозначим EN() – множество равновесных по Нэшу при использовании центром системы стимулирования векторов действий АЭ. Лемма 7.2.1. Если выполнены предположения А.7.3–А.7.5, то (4) EN() = U Q ( z ).

z zE N ( ) Доказательство. Фиксируем i I. Целевая функция i-го АЭ и ~ нечеткая информационная функция P (z, y) индуцируют на множестве A’ нечеткое отношение предпочтения (НОП) i-го АЭ. В теории принятия решений при нечеткой исходной информации рациональным считается выбор АЭ максимально недоминируемых по его НОП альтернатив (действий).

Очевидно, что, если затраты АЭ непрерывны, и центр использует компенсаторную систему стимулирования, то целевая функция АЭ полунепрерывна сверху. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Определение индуцированного НОП и максимально недоминируемых альтернатив для задач стимулирования приведено в работах [35, 41, 44]. Однако, непосредственное использование максимально недоминируемых альтернатив в задачах стимулирования затруднительно в силу громоздкости их определения. В одноэлементных АС с нечеткой внешней неопределенностью на основании подхода, предложенного С.А. Орловским, использовался следующий метод решения задач стимулирования: формулировалась задача четкого математического программирования (ЧМП) и доказывалось, что максимально недоминируемыми альтернативами являются решения этой задачи и только они. Поступим аналогичным образом и в рассматриваемой многоэлементной модели. Для фиксированной обстановки игры можно, по аналогии с результатами, приведенными в [42, 44], доказать, что в рамках предположений А.7.4 и А.7.5 четко недоминируемыми альтернативами являются те и только те действия АЭ, функция принадлежности нечеткого результат деятельности от которых равна единице в точке максимума целевой функции АЭ. Следовательно, если некоторый результат деятельности zi i-го АЭ принадлежит при обстаz новке z-i множеству E N ( ) (см. выражение (3)), то множество четко недоминируемых действий этого АЭ есть Q(z). Вычисляя объединение по всем точкам Нэша, в силу предположения А.7.4, получаем выражение (4). • Теорема 7.2.3. Если выполнены предположения А.7.4–А.7.5, то система стимулирования (5) i(z*, zi) = ci ( zi*, z i ) + i, zi = zi*, i I, zi zi* 0, yQ ( z ) iI где (6) z* = arg max { min H(y) z A ci ( z ) }, гарантированно -оптимальна. Доказательство. В силу теоремы 4.4.1 система стимулирования (5) при i > 0, i I, обеспечивает максимизацию целевой функции каждого АЭ при (единственном!) результате деятельности zi* при любой обстановке игры (и минимальных затратах центра на стиму PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory лирование). Из леммы 7.2.1 следует, что множество равновесий Нэша при этом есть Q(z*). Предположение А.7.5 гарантирует, что изменением z* A0 любой допустимый вектор действий АЭ может быть сделан точкой Нэша. При определении гарантированной эффективности системы стимулирования (5) следует вычислить гарантированный доход центра: min H(y), то есть взять минимум функции дохода центра yQ ( z ) по множеству равновесий Нэша. Оптимальной окажется (результат решения задачи оптимального согласованного планирования) система стимулирования, максимизирующая целевую функцию центра – см. выражение (6). • Исследуем влияние неопределенности. Сравнивая выражение (6) с эффективностью max {H(y) - ci ( y ) } стимулирования в y A' iI детерминированном случае (см. раздел 4.4), можно сделать вывод, что гарантированная эффективность стимулирования в АС с нечеткой внешней неопределенностью не выше, чем соответствующих детерминированных АС (например, за счет вычисления min H(y) yQ ( z ) – см. выражение (6)). Очевидно, что с ростом нечеткой неопределенности (в смысле, определенном в [44]) множество Q(z), по которому вычисляется минимум, не сужается, следовательно, не возрастает и гарантированная эффективность стимулирования. В предельном случае (при переходе к соответствующей детерминированной АС) теорема 7.2.3 переходит в теорему 4.4.1. В том числе, например, когда в рамках предположений А.7.3–А.7.5 нечеткие информационные функции сепарабельны и однопиковые с точками максимума в действиях АЭ, множества равновесий Нэша и эффективности в четком и нечетком случаях, очевидно, совпадают. В заключение настоящей главы отметим, что перспективными представляются следующие направления исследований многоэлементных АС с неопределенностью. Во-первых, это класс АС, в которых результат деятельности каждого АЭ зависит от действий всех АЭ. Во-вторых, исследование условий на информированность игроков (например, свойства плотности совместного распределе PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory ния состояний природы), при которых можно без потери эффективности использовать индивидуальные системы стимулирования и т.д. В третьих, представляет интерес рассмотрение механизмов с платой за информацию в многоэлементных АС с неопределенностью и асимметричной информированностью. В целом, из проведенного в настоящей главе анализа многоэлементных АС с неопределенностью можно сделать вывод, что в тех случаях, когда соответствующие одноэлементные модели исследованы достаточно полно, и для них получены аналитические решения, то идея декомпозиции игры АЭ в многоэлементной АС позволяет достаточно просто получить оптимальное решение задачи стимулирования. В случае, когда соответствующие одноэлементные модели исследованы недостаточно подробно (когда, например, для них не получены даже достаточные условия оптимальности простых систем стимулирования), существенно продвинуться в изучении их многоэлементных расширений не удается. 8. МОДЕЛИ СТИМУЛИРОВАНИЯ С ГЛОБАЛЬНЫМИ ОГРАНИЧЕНИЯМИ НА МНОЖЕСТВА ДОПУСТИМЫХ ДЕЙСТВИЙ АЭ Рассмотрим АС, состоящую из n АЭ с целевыми функциями fi(y), i I, y = (y1, y2, …, yn). Предположим, что, помимо индивидуальных ограничений на множества допустимых стратегий: yi Ai, iI, существуют глобальные ограничения Aгл на выбор состояний АЭ, то есть y A’ Aгл, где A’ = Ai.

i = n Можно выделить несколько методов учета глобальных ограничений, то есть методов сведения теоретико-игровых моделей с глобальными ограничениями на множества допустимых стратегий игроков к моделям, для которых имеет место гипотеза независимого поведения. «Метод штрафов». Данный метод заключается в том, что в случае, когда вектор действий АЭ оказывается вне множества Aгл (то есть y Aгл), целевые функции игроков считаются равными PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory минус бесконечности – игроки штрафуются за нарушение ограничений [15, 24, 66]. Далее можно рассматривать игру с «новыми» целевыми функциями, в которой отсутствуют глобальные ограничения. В зависимости от информированности игроков и того, кто из игроков нарушает глобальные ограничения, строятся гарантирующие стратегии [24]. «Метод расширения стратегий». В исходной игре все АЭ выбирают свои стратегии одновременно и независимо, не обмениваясь информацией с другими игроками1. Можно рассмотреть игру, в которой каждый из игроков делает предположения о выборе других игроков или реакции других игроков на выбор им той или иной стратегии. В подобных играх используют концепцию П-решения [15] (см. также Байесовское равновесие, равновесие Штакельберга и др. [56, 66]), которая включает в себя максиминные равновесия, равновесия Нэша и ряд других как частные случаи, и заключается в следующем. Пусть все активные элементы, за исключением i-го, выбрали свои стратегии y-i A-i. Введем множества: Ai(y-i) = {yi Ai | y A’ Aгл}, i I, Ai(y-i) – множество стратегий i-го АЭ, при которых вектор действий удовлетворяет глобальным ограничениям2. Предположим, что i-ый АЭ делает предположение i(yi) A-i о множестве возможных «реакций» остальных АЭ на выбор им стратегии yiAi, i I. Тогда, например, рациональным можно считать поведение игроков, заключающееся в стремлении к максимизации выбором собственной стратегии из множества I Ai(y-i) y ii ( yi ) гарантированного по множеству i(yi) значения своей целевой функции, то есть yiп = arg yi max I y i i ( yi ) Ai ( y i ) y i i ( yi ) min fi(y), i I.

Возможны и другие определения рациональности поведения Возможность и целесообразность обмена информацией (информационное расширение игры) в играх с запрещенными ситуациями рассматривалась в работе [24]. 2 В общем случае нельзя исключать из рассмотрения следующие ситуации: i I, y-i A-i: Ai(y-i)=. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory игроков, например: введем множества Yгi (yi) = Arg ~ Ai = п y i y ii ( yi ) min fi(y), г y iYi ( yi ) I Ai(y-i), yiп = arg max ~ yiAi y i i ( yi ) min fi(y), i I, и т.д.

Если предположения всех АЭ оправдываются, то есть i I i( yiп ), то ситуацию игры y A’ Aгл называют Правновесием. Существует несколько частных случаев, в которых учет глобальных ограничений производится «автоматически». Если у каждого из игроков имеется доминантная стратегия (или в игре существует единственное равновесие Нэша) и игра характеризуется полной информированностью, то каждый из игроков может вычислить доминантные стратегии всех остальных игроков (соответственно – точку Нэша). Если при этом вектор доминантных стратегий (или точка Нэша) удовлетворяют глобальным ограничениям, то проблем их учета не возникает. Отметим, что метод расширения стратегий, во-первых, требует от исследователя операций введения трудно обосновываемых предположений о принципах поведения игроков, а, во-вторых, не всегда П-решение оказывается П-равновесием, или, вообще, существует. Если в методе штрафов и в методе расширения стратегий никак не оговаривалось наличие управления со стороны центра, то следующие два метода учета глобальных ограничений существенно используют управляющие возможности центра. «Метод согласования». Основная идея метода согласования заключается в следующем (см. также двухшаговый метод решения вероятностных [58] и др. задач стимулирования и метод согласованного планирования [15]). На первом шаге решения задачи управления (стимулирования) центр для каждого вектора действий, принадлежащего множеству A’ (без учета глобальных ограничений) ищет допустимое управление, при котором данный вектор действий принадлежит множеству решений игры активных элементов. Результатом первого шага, например, в задаче стимулирования, является множество AM действий АЭ, реализуемых при данных ограничениях M на систему стимулирования, AM A’.

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Затем на втором шаге центр ищет множество A* действий АЭ, которые, во-первых, реализуемы, во-вторых, удовлетворяют заданным глобальным ограничениям Aгл, и на которых достигается максимум его целевой функции. Итак, на втором шаге центр решает следующую задачу: (1) A* = Arg max (y).

y AM Aгл Максимальная эффективность управления при этом равна (y ), где y* - произвольный элемент множества A*. «Метод изменения порядка функционирования». Выше предполагалось, что АЭ выбирают, при известной стратегии центра, свои действия одновременно и независимо. Если центр как метаигрок может изменить порядок функционирования, то есть последовательность получения информации и выбора стратегий активными элементами, то, варьируя последовательность выбора стратегий АЭ, можно существенно упростить задачу учета глобальных ограничений. Если существует нумерация АЭ, такая что Ai = Ai(y1, y2, …, yi-1), то каждый АЭ должен при выборе своей стратегии учитывать ограничения, наложенные совместно глобальным ограничением и уже выбранными к настоящему моменту стратегиями АЭ с меньшими номерами. Например, допустимой с рассматриваемой точки зрения является последовательность функционирования АС, имеющая вид сетевого графика (без контуров). Частным случаем является последовательный выбор стратегий активными элементами – так называемые производственные цепочки (см. также раздел 9) [15, 26]. Еще раз подчеркнем, что возможность использования метода изменения порядка функционирования должна быть предусмотрена «правилами игры», то есть, учтена в модели активной системы. Закончив перечисление методов учета глобальных ограничений, перейдем к систематическому описанию различных вариантов взаимозависимости и взаимосвязи игроков в многоэлементных АС. В работе [15] активными системами с зависимыми АЭ были названы системы, в которых либо существуют глобальные ограничения на множество возможных действий, либо/и целевая функция каждого АЭ зависит от, помимо его собственных действий, действий других АЭ. Для того чтобы различать эти два случая, мы будем * PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory придерживаться следующей терминологии: если АЭ производят свой выбор независимо (отсутствуют глобальные ограничения на вектор действий АЭ), и целевая функция каждого АЭ зависит только от его собственной стратегии, и отсутствуют общие ограничения на управляющие переменные (допустимые функции стимулирования и т.д.), то такую АС будем называть АС с независимыми и несвязанными АЭ1. Если добавляются общие ограничения на управления, то такие АС будем называть АС со слабо связанными АЭ (АЭ оказываются связаны косвенно – через ограничения на стратегии центра) [16, 20, 42, 44]. Если добавляется зависимость целевой функции АЭ от обстановки игры, то такую АС будем называть АС с сильно связанными (но независимыми!) АЭ. Если добавляются только общие ограничения на множество стратегий АЭ системы, то такую АС будем называть АС с зависимыми АЭ (см. таблицу 2 ниже). Выше в настоящей работе исследовались задачи стимулирования в АС с сильно связанными и независимыми АЭ. Таким образом, остается открытым вопрос о методах решения задачи стимулировании в АС с зависимыми АЭ (несвязанными, сильно и слабо связанными). Так как АС с сильно связанными АЭ включают в себя АС с несвязанными и слабо связанными АЭ как частный случай, перейдем к рассмотрению задач стимулирования в АС с сильно связанными и зависимыми АЭ. Метод штрафов в задачах стимулирования в многоэлементных АС имеет следующий вид. В общем случае считаем, что затраты АЭ несепарабельны и приравниваем их минус бесконечности при недопустимых (с точки зрения глобальных ограничений) действиях АЭ, после чего применяем технику анализа, описанную в четвертом разделе настоящей работы. Метод согласования может использоваться в приведенном выше виде без каких-либо изменений. Напомним, что при решении задач стимулирования в многоэлементных АС выше (в четвертом разделе) реализуемый оптиТаким образом, «независимость» АЭ отражает свойства множеств их допустимых стратегий, а «связанность» – зависимость целевой функции АЭ от действий других игроков или наличие общих ограничений на управление. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory мальной квазикомпенсаторной системой стимулирования вектор действий АЭ входил в эту систему стимулирования как параметр. Поэтому, в более общем случае, охватывающем и метод штрафов, и метод согласования, можно считать, что на АЭ (или центр, что то же самое в силу оптимальности компенсаторных систем стимулирования) наложены штрафы следующего вида: i(y) = ~ где i ( y ) - некоторые неотрицательные функции, i I. Тогда, если AM – множество реализуемых действий, определяемых без учета глобальных ограничений на действия АЭ, то целевая функция центра в задаче стимулирования второго рода (с учетом глобальных ограничений) имеет вид:

(2) (y) = H(y) ~ i ( y ), y A' Aгл, y A' Aгл 0, {ci ( y ) + i ( y )}.

i = n Задача планирования запишется в виде: (3) x* = arg max [H(y) x AM {ci ( y ) + i ( y )} ], i = n а максимальная эффективность стимулирования (эффективность оптимальной системы стимулирования) равна K* = (x*)1. В таблице 2 представлены возможные комбинации глобальных ограничений («+» – наличие глобальных ограничений, «-» отсутствие глобальных ограничений) на множества допустимых стратегий АЭ, их целевые функции и управления.

Мы не будем останавливаться подробно на таких простых утверждениях, следующих из анализа выражений (1)-(3), как то, что с расширением множеств AM (то есть с ростом возможностей центра по управлению) и Aгл (ослаблением внешних – глобальных – ограничений) эффективность стимулирования не уменьшается и т.д. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory № Множества допустимых стратегий АЭ Целевые функции АЭ Управления (допустимые стратегии центра) Тип АС 1. 2. 3. 4. 5. 6. 7. 8.

+ + + + + + + + + + + + АС с независимыми и несвязанными АЭ АС с зависимыми и несвязанными АЭ АС с зависимыми и сильно связанными АЭ АС с зависимыми и слабо связанными АЭ АС с независимыми и сильно связанными АЭ АС с независимыми и слабо связанными АЭ АС с независимыми и сильно связанными АЭ АС с зависимыми и сильно связанными АЭ Таблица 2. Классификация взаимосвязанности и взаимозависимости АЭ. Рассмотрим кратко все восемь случаев (см. таблицу 2) и покажем для них, что при решении задач стимулирования в многоэлементных АС с зависимыми АЭ учет глобальных ограничений на множества допустимых действий АЭ возможно осуществлять, применяя как метод штрафов, так и метод согласования, причем их использование не изменяет результатов, описанных в четвертом разделе настоящей работы. Качественное обоснование справедливости последнего утверждения таково – взаимосвязь АЭ (в смысле целевых функций) была учтена при решении задач стимулирования в четвертом разделе настоящей работы, а, используя выражения (2) и (3), удается декомпозировать и учесть «независимо» факторы, связанные с ограничениями на множества допустимых стратегий АЭ и центра.

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Другими словами, в общем случае алгоритм действий при учете глобальных ограничений таков: для каждой из моделей S1-S8 на втором этапе решения задачи стимулирования (этапе поиска оптимального для центра реализуемого действия) максимизация целевой функции центра ведется не по всему множеству A’ допустимых действий АЭ, а по множеству: A’ Aгл AM. При этом «автоматически» обеспечивается учет глобальных ограничений как на действия АЭ, так и на стимулирование. Случай 1. АС с независимыми и несвязанными АЭ. Очевидно, что многоэлементная АС с независимыми и несвязанными АЭ может быть представлена в виде набора невзаимодействующих одноэлементных активных систем (ни согласование с глобальными ограничениями, ни штрафы в данном случае не требуются). На втором этапе решения задачи стимулирования максимизация целевой функции центра ведется независимо по множествам Ai, i I. Случай 2. АС с зависимыми1 и несвязанными АЭ. В данном случае центр имеет возможность использовать индивидуальное стимулирование для каждого АЭ, рассматривая в качестве реализуемых только вектора действий, принадлежащие множеству допустимых с точки зрения глобальных ограничений (метод согласования), то есть на втором этапе решения задачи стимулирования максимизация целевой функции центра ведется по множеству A’Aгл. Случай 3. АС с зависимыми и сильно связанными АЭ (глобальные ограничения на управление отсутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра также ведется по множеству A’Aгл.

Отметим, что в работе [24] при описании игр с запрещенными ситуациями взаимозависимость АЭ отражалась следующим образом: целевая функция i-го АЭ определялась как: fi(y) = wi ( y ), y Aiгл гл, где Ai гл, y Ai A’, i I. Если i I Aiгл = Aгл, то имеет место случай одинаковых ограничений. В дальнейшем мы по умолчанию ограничимся случаем одинаковых ограничений. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Случай 4. АС с зависимыми и слабо связанными АЭ (глобальные ограничения на управление присутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра ведется по множеству A’ Aгл AM. Случай 5. АС с независимыми и сильно связанными АЭ (глобальные ограничения на управление отсутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра ведется по множеству A’. Случай 6. АС с независимыми и слабо связанными АЭ (глобальные ограничения на управление присутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра ведется по множеству A’ AM. Как отмечалось выше, задача управления АС с независимыми и слабо связанными АЭ может быть сведена к параметрической задаче управления набором одноэлементных АС и задаче выбора оптимального значения параметра. Случай 7. АС с независимыми и сильно связанными АЭ (глобальные ограничения на управление присутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра также ведется по множеству A’ AM. Случай 8. АС с зависимыми и сильно связанными АЭ (глобальные ограничения на управление присутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра ведется по множеству A’ AM Aгл. Таким образом, учет глобальных ограничений на стратегии участников АС (активных элементов и центра) производится методами штрафов или согласования в рамках предложенной в четвертом разделе методики решения задач стимулирования в многоэлементных АС. До сих пор при рассмотрении задач стимулирования мы предполагали, что единственным управляющим воздействием на АЭ со стороны центра является изменение системы стимулирования. В то же время, одним из параметров модели АС (и, как показал проведенный выше анализ - параметров, существенно влияющих на эффективность стимулирования) являются множества допустимых действий АЭ. Поэтому исследуем задачу управления АС, в которой PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory центр, помимо выбора системы стимулирования, имеет возможность влиять и на множества допустимых действий АЭ1. Рассмотрим многоэлементную АС, отличающуюся от исследуемой в четвертом разделе настоящей работы следующим. Пусть центр имеет возможность выбирать, помимо функций стимулирования, управляющие параметры ui Ui, i I, определяющие множества допустимых действий АЭ, то есть Ai = Ai(ui). Тогда вектор действий активных элементов y принадлежит допустимому множеству A(u) = Ai (ui ), u = (u1, u2, …, un) U’ = i = n Ui.

i = n Предположим, что y A’ u U’: y A(u). Содержательно данное предположение означает, что множество допустимых управлений центра достаточно «велико» для того, чтобы сделать допустимым любой вектор действий АЭ. Назначая определенные значения управляющих параметров uU’, центр несет издержки (u), : U’ 1, измеряемые в денежном выражении. Тогда целевая функция центра имеет вид (в общем случае будем считать, что затраты АЭ несепарабельны, а индивидуальное стимулирование каждого АЭ зависит от действий всех АЭ): (4) (y,, u) = H(y) i ( y) i = n - (u).

Действия y*, выбираемые АЭ, являются равновесием Нэша при данных управлениях, то есть y* EN(, u). Задача управления в рамках гипотезы благожелательности заключается выборе управляющих параметров, максимизирующих целевую функцию центра на множестве решений игры: (5) max (y,, u) max.

yE N (, u ) M, uU Для решения задачи (5) воспользуемся комбинацией результатов, полученных в четвертом разделе, и выражениями (1)-(3), Задачи управления АС с переменными множествами допустимых действий рассматривались как в теории активных систем [4, 15, 55], так и в теории иерархических игр [24, 25, 30], причем, в основном, для динамических моделей. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory позволяющими учитывать глобальные ограничения. Фиксируем произвольный вектор действий АЭ x A’. Для того чтобы этот вектор действий был реализуем, необходимо и достаточно, чтобы он был равновесием Нэша (для этого достаточно использовать соответствующую компенсаторную систему стимулирования – см. раздел 4), и был допустимым действием (с точки зрения ограничений на множества действий АЭ). Для удовлетворения последнему условию центр должен выбрать такие значения управляющего параметра u U’, чтобы i I xi Ai(ui). Обозначим Ui(xi) = {ui Ui | xi Ai(ui)}, i I – множество таких управлений, при которых действие xi является допустимым для i-го АЭ;

U(x) = U i ( xi ). Минимальные затраты центра на обесi = n печение допустимости вектора действий x A’ равны: ~ (6) (x) = min (u).

uU ( x ) Из результатов четвертого раздела настоящей работы следует, что в рассматриваемой модели суммарные затраты центра по реализации действия x A’ равны (x) = ci ( x ) i = n ~ + (x). Опти мальным для центра действием АЭ является действие y*, максимизирующее разность между доходом центра и его затратами на стимулирование: (7) y* = arg max {H(x) - (x)} = arg max {H(x) x A x A ~ ci ( x ) - (x)}.

i = n Итак, выражение (7) дает оптимальное решение задачи управления в многоэлементной АС в условиях, когда центр имеет возможность управлять множествами допустимых действий АЭ. Исследуем теперь задачу синтеза унифицированных управлений, то есть предположим, что центр имеет возможность назначать персонифицированное стимулирование каждому из АЭ, но должен выбрать одно значение управляющего параметра, единое для всех АЭ, то есть ui = u, Ui = UU, i I. Обозначим UU(x) = {u UU | i I xi A(u)} – множество таких управлений, при которых действие xi является допустимым PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory для i-го АЭ, i I. Минимальные затраты центра на обеспечение ~ допустимости вектора действий xA’ равны: U (x) = uUU ( x ) min U(u), где U: UU 1 – функция затрат центра.

Оптимальным для центра действием АЭ является следующее действие:

* (8) yU = arg max {H(x) x A ~ ci ( x ) - U (x)}.

i = n Выражение (8) дает оптимальное решение задачи синтеза унифицированного управления в многоэлементной АС в условиях, когда центр имеет возможность управлять множествами допустимых действий АЭ. Обозначим эффективности оптимальных управлений (соответственно, «обычного» и унифицированного): (9) K* = H(y*) n ~ ci ( y * ) - (y*), i =1 * * ~ ci ( yU ) - U ( yU ), i =1 n * * (10) KU = H( yU ) * и сравним величины K* и KU, то есть оценим качественно потери в эффективности управления, вызванные необходимостью использовать единые для всех АЭ значения управляющего параметра, определяющего множества допустимых действий. Введем следующее предположение о монотонности множеств допустимых действий АЭ по управляющему параметру:

А.8.1. iI, ui1, ui2 Ui = 1: ui1 ui2 Ai( ui1 ) Ai( ui2 );

u1, u2 UU = 1: u1 u2 i I Ai(u1) Ai(u2). Введем также предположение об аддитивности и монотонности функций затрат центра: А.8.2. (u) = i (ui ), U(u) = i (u ).

i =1 i = n n PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Теорема 8.1. Если выполнены предположения А.8.1 и А.8.2, то * K KU. Если при этом i() – монотонно возрастающие функции, * * iI, то yU y*. Справедливость утверждения теоремы 8.1 следует из выражений (6)-(10), а также того, что в рамках предположений А.8.1 и ~ ~ А.8.2 выполнено следующее соотношение: yA’ (y) U (y). • Пример 12. Пусть n = 2, H(y) = 1 y1 + 2 y2, ci(yi) = yi2 /2ri, i(ui) = i ui, Ai(ui) = [0;

ui], i I. Обозначим = min i, = max i и предположим, что.

i = 1, n i =1,n Тогда оптимальны действия АЭ: yi* = (i-i)ri, yi* = (i-)ri, i I, U а эффективности равны: K* = ( i i ) 2 *, KU = 2ri i = n ( i ) 2. 2 ri i = n * Видно, что yi* yi*, i I, K* KU. • U Итак, выше в настоящем разделе мы рассмотрели общие вопросы учета глобальных ограничений на множества допустимых действий АЭ при решении задач стимулирования в многоэлементных АС, а также задачи управления многоэлементными АС, в которых центр, помимо выбора системы стимулирования, имеет возможность управлять множествами допустимых стратегий активных элементов. Перейдем к рассмотрению нескольких практически важных частных случаев, в которых используются полученные теоретические результаты.

9. ПРОИЗВОДСТВЕННЫЕ ЦЕПОЧКИ Производственной цепочкой называется АС, в которой АЭ упорядочены таким образом, что ограничения деятельности (ограничения на выбор стратегией) каждого АЭ определяются действием, выбранным АЭ с меньшим номером, а действие, выбранное данным АЭ, определяет ограничения деятельности АЭ с большим PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory номером, причем АЭ выбирают действия последовательно в порядке, соответствующем их упорядочению. Производственные цепочки1 адекватно отражают широко распространенные на практике условия взаимодействия экономических объектов, для которых результат деятельности (в детерминированных моделях совпадающий с действием – см. седьмой раздел настоящей работы) одного объекта (продукция) является, например, сырьем, используемым другим объектом и т.д. В рассматриваемой ниже модели считается, что действие, выбранное определенным АЭ, задает множество возможных действий следующего АЭ и т.д. Содержательные интерпретации такой зависимости очевидны. Пусть в многоэлементной АС активные элементы упорядочены так, что множество возможных действий i-го АЭ определяется действием i-1-го АЭ: Ai = Ai(yi-1), i = 2, n. Примем, что множество допустимых действий первого АЭ зависит от выбранного центром значения управляющего параметра u U, то есть A1 = A1(u). Порядок функционирования следующий: центр выбирает систему стимулирования {i()} M и управление u U. Затем АЭ последовательно выбирают свои действия, причем на момент выбора действия каждый АЭ знает: целевые функции и допустимые множества (с точностью до конкретного значения параметра) всех участников АС, выбор центра и действия, выбранные АЭ с меньшими номерами. Целевая функция АЭ имеет вид: (1) fi(yi, i) = i(yi) – ci(yi), то есть будем считать, что затраты АЭ сепарабельны. Для обоснования этого предположения можно привести следующее рассуждение. Если затраты i-го АЭ зависят от действий АЭ с меньшими номерами, то эту зависимость можно исключить из рассмотрения, так как на момент выбора им своей стратегии действия АЭ с меньшими номерами будут ему известны. Будем считать, что зависеть от действий АЭ с большими номерами затраты i-го АЭ также не могут, так как их действия выбираются позже и зависят (иногда В теории активных систем производственные цепочки с линейными технологическими связями АЭ рассматривались в работах [15, 17,26, 48]. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory однозначно – в рамках принятой гипотезы рационального поведения) от действия i-го АЭ. Структура взаимодействия участников производственной цепочки изображена на рисунке 6.

u ЦЕНТР yn 1(y1) 2(y2) … i(yi) … n(yn) АЭ1 c1(y1), A1(u) y АЭ y … yi- АЭi ci(yi), Ai(yi-1) yi yn- … АЭn cn(yn), An(yn-1) c2(y2), A2(y1) Рис.6. Производственная цепочка Введем следующее предположение:

+ + + А.9.1. Ai(yi-1) = [0;

Ai+ (yi-1)] 1, где Ai+ : 1 1 - непрерывная строго монотонно возрастающая функция, такая, что Ai+ (0) = 0, i I, y0 = u U = [0;

umax].

Если выполнено предположение А.9.1, то существуют n непрерывных строго монотонно возрастающих функций i(yi), обратных к функциям Ai+, которые позволяют «перевернуть» производственную цепочку, то есть по заданному значению действия n-го АЭ восстановить минимальные действия всех предшествующих АЭ и управление центра, делающих это действие допустимым. Пусть xn 0 – фиксированное действие n-го АЭ. Для того чтобы оно было допустимым должно выполняться xn + An (xn-1), то есть xn-1 n(xn). Выберем xn-1 = n(xn). Для допустимости действия xn-1 должно выполняться следующее соотношение: xn-2 n-1(xn-1).

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Выберем xn-2 = n-1(xn-1) = n-1(n(xn)) и т.д. Таким образом, допустимые планы (действия АЭ) определяются следующим образом: (2) xi(xn) = i+1(i+2(…n-1(n(xn)))), i = 1, n 1. Управление со стороны центра должно удовлетворять: (3) u(xn) = 1(2(…n(xn))). С другой стороны, по известным зависимостям Ai+ (), i I, и значению u umax можно восстановить ограничения Aimax (u) на максимальные допустимые действия каждого АЭ:

+ (4) Aimax (u) = Ai+ ( Ai+ (… A1 (u))), i I. Обозначим (u) – затраты центра на управление и сформулируем полученный (очевидный, но необходимый для решения задачи управления) результат в виде леммы. Лемма 9.1. Если выполнено предположение А.9.1, то в производственной цепочке реализуемы такие и только такие действия yA’, которые удовлетворяют: y A* = {y A’ | yi i+1(yi+1), i = 1, n 1, umax 1(y1)}, или, что то же самое:

+ y A* = {y A’ | y1 A1 (umax), yi Ai+ (yi-1), i = 2, n }. Минимальные затраты центра на реализацию вектора действий yA’, удовлетворяющего приведенной системе неравенств, равны (5) (y) = (1(y1)) + ci ( y i ).

i = n Докажем справедливость выражения (5). Минимальное значение управления u umax, делающее допустимым действие y1 первого АЭ равно 1(y1). Значит, для этого центр должен потратить (1(y1)). Кроме того, действия АЭ yi, i I, должны быть реализуемы, то есть на них должны достигаться максимумы целевых функций АЭ. Для этого достаточно использовать квазикомпенсаторную систему стимулирования, требующую (как известно из результатов четвертого раздела настоящей работы) минимальных затрат на PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory стимулирование ci ( y i ). • i = n Воспользуемся результатом леммы 9.1 для решения задачи синтеза оптимальных управлений. Если H(y) – функция дохода центра, то оптимальным реализуемым вектором действий будет вектор (6) y* = arg max {H(y) - (1(y1)) y A* ci ( yi ) }.

i = n При решении оптимизационной задачи (6) могут возникнуть как вычислительные трудности, обусловленные сложной структурой задания множества A*, так и трудности с анализом зависимости оптимального решения от параметров модели. Напомним, что задача (6) формулировалась следующим образом: фиксировалось действие последнего АЭ, после чего по выражению (2) определялось множество допустимых действий предшествующего АЭ и так далее, вплоть до определения по множеству действий первого АЭ множества управлений центра. Построенное таким образом множество A* допустимых (для всех допустимых управлений) действий как раз и является тем множеством, на котором максимизируется целевая функция центра (см. (6)). В частном случае (см. конкретизацию ниже) возможен альтернативный подход. Для фиксированного управления uU определим множество действий АЭ, допустимых при данных управлениях: Ai(u) = [0;

Aimax (u)], где Aimax (u) вычисляется в соответствии с (4). Найдем вектор действий y*(u), максимизирующий разность между доходом центра и его затратами на стимулирование на множестве A(u) = Ai (u ) :

i =1 yA( u ) n y*(u) = arg max {H(y) ci ( yi ) }.

i = n Если производственные возможности АЭ ограничены (см., например, модель производственной цепочки в [48]), то эти ограничения могут быть учтены соответствующей модификацией функций затрат АЭ. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Обозначим (u) = H(y*(u)) ci ( yi* (u )). Если i I u U i = n yi* (u ) * = Aimax (u ) uU, то оптимально следующее значение управле ния: u = arg max {(u) - (u)}. При использовании предложенного подхода наибольшую трудность (в первую очередь – вычислительную) представляет задача определения зависимости y*(u), второй же этап – этап поиска оптимального значения управления является скалярной задачей оптимизации. Рассмотрим задачу стимулирования первого рода1, в которой целевая функция центра не убывает по действиям всех АЭ. Если воспользоваться монотонностью и непрерывностью функций Ai+ (), обеспечиваемой предположением А.9.1, то можно предложить более простой (нежели чем использовался для задачи второго рода) метод решения задачи стимулирования, в котором по сравнению с выражением (6) существенно упрощается вид допустимого множества. Теорема 9.1. Если выполнено предположение А.9.1, то оптимальное решение задачи стимулирования первого рода, в которой целевая функция центра не убывает по действиям всех АЭ, для рассматриваемой производственной цепочки имеет вид: (7) u = u*, i(yi) = ci ( yi ), yi = yi* (u * ), yi yi* (u * ) 0, * * * * + где y*(u) = ( y1 (u ), y 2 (u ), …, y n (u ) ), y1 (u ) = A1 (u ), yi* (u ) = * Ai+ ( yi (u ) ), i = 2, n, u* = arg max {H(y*(u)) - (u)}.

uU Применим полученные результаты для частного, но чрезвы Напомним, что в задаче стимулирования первого рода целевая функция центра не зависит явным образом от стимулирования (затраты центра на стимулирование не вычитаются из дохода центра) и совпадает с его функцией дохода. PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory чайно часто встречающегося на практике, случая, когда доход центра H = H(xn) зависит только от действия последнего АЭ в производственной цепочке. Содержательно, при этом последний АЭ производит конечную продукцию, а центр поставляет на вход производственной цепочки исходное сырье в объеме u [0;

umax]. Ограничение на максимальный объем исходного сырья порождает ограничение на множество X возможных действий последнего АЭ:

+ + + (8) xn X = [0;

xmax], xmax = An ( An 1 (… A1 (umax))). Для реализации действия xn n-го АЭ центр должен поставить исходное сырье в объеме u(xn) = 1(2(…n(xn))) (см. выражение (3)). Суммарные затраты на управление при этом равны (см. выражение (2)): (9) (xn) = (1(2(…n(xn)))) + n + ci(i+1(i+2(…n-1(n(xn)))))+cn(xn).

i = Оптимальное решение задачи управления (оптимальное реализуемое действие n-го АЭ) является решением следующей скалярной задачи оптимизации:

* (10) xn = arg max {H(xn) - (xn)}, xn X где множество X определяется выражением (8), а суммарные затраты на управление – выражением (9). Выражения (8)-(10) свидетельствуют о том, что в рассматриваемой модели производственная цепочка может быть заменена одним активным элементом, имеющим зависимость правой границы множества допустимых действий от управления, отражаемую выражением (8), и функцию затрат:

n c(x) = ci(i+1(i+2(…n-1(n(x)))))+cn(x).

i = Затраты центра на управление (без учета затрат на стимулиро~ вание) при этом определяются: (x) = (1(2(…n(x)))). Решение задачи стимулирования в АС с таким (одним!) АЭ (см. также выше теорему 8.1 и модель, для которой она была сформулирована) совпадает с решением (10) задачи управления производственной цепочкой из n АЭ.

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Двойственным подходом является рассмотрение в рамках предположения А.9.1 явной зависимости реализуемого действия nго АЭ от управления u U центра. При этом максимальное реализуемое действие n-го АЭ связано с управлением следующим образом:

+ + + xn xmax(u) = An ( An 1 (… A1 (u))). Затраты центра на управление (с учетом затрат на стимулирование), зависящие только от управления, равны:

(u) = (u) + ci ( Ai+ ( Ai+1 (... A1+ (u )))).

i = n Реализуемым оказывается следующий вектор действий АЭ:

yi* (u ) = Ai+ ( Ai+ 1 (... A1+ (u ))), i I, следовательно, решение задачи управления имеет вид:

* u* = arg max {H( y n (u)) - (u)}. uU + Ai (yi-1) Пример 13. Пусть = i yi-1, i > 0, ci(yi) = yi2 /2ri, A1+ = 1 u, (u) = u, H(yn) = yn. Обозначим i = n i2 x 2. 2 i =1 ri 2n j j = i и допус тим, что n, тогда xmax = n umax, а целевая функция центра имеет вид: (x) = ( - / n) x - Если ограничения на максимальный объем исходного сырья отсутствуют, то оптимальным оказывается следующее реализуемое действие n-го АЭ:

Pages:     | 1 || 3 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.