WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 15 | 16 || 18 | 19 |   ...   | 23 |

В работе [15] активными системами с зависимыми АЭ были названы системы, в которых либо существуют глобальные ограничения на множество возможных действий, либо/и целевая функция каждого АЭ зависит от, помимо его собственных действий, действий других АЭ. Для того чтобы различать эти два случая, мы будем PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory придерживаться следующей терминологии: если АЭ производят свой выбор независимо (отсутствуют глобальные ограничения на вектор действий АЭ), и целевая функция каждого АЭ зависит только от его собственной стратегии, и отсутствуют общие ограничения на управляющие переменные (допустимые функции стимулирования и т.д.), то такую АС будем называть АС с независимыми и несвязанными АЭ1. Если добавляются общие ограничения на управления, то такие АС будем называть АС со слабо связанными АЭ (АЭ оказываются связаны косвенно – через ограничения на стратегии центра) [16, 20, 42, 44]. Если добавляется зависимость целевой функции АЭ от обстановки игры, то такую АС будем называть АС с сильно связанными (но независимыми!) АЭ. Если добавляются только общие ограничения на множество стратегий АЭ системы, то такую АС будем называть АС с зависимыми АЭ (см. таблицу 2 ниже).

Выше в настоящей работе исследовались задачи стимулирования в АС с сильно связанными и независимыми АЭ. Таким образом, остается открытым вопрос о методах решения задачи стимулировании в АС с зависимыми АЭ (несвязанными, сильно и слабо связанными). Так как АС с сильно связанными АЭ включают в себя АС с несвязанными и слабо связанными АЭ как частный случай, перейдем к рассмотрению задач стимулирования в АС с сильно связанными и зависимыми АЭ.

Метод штрафов в задачах стимулирования в многоэлементных АС имеет следующий вид. В общем случае считаем, что затраты АЭ несепарабельны и приравниваем их минус бесконечности при недопустимых (с точки зрения глобальных ограничений) действиях АЭ, после чего применяем технику анализа, описанную в четвертом разделе настоящей работы.

Метод согласования может использоваться в приведенном выше виде без каких-либо изменений.

Напомним, что при решении задач стимулирования в многоэлементных АС выше (в четвертом разделе) реализуемый опти Таким образом, «независимость» АЭ отражает свойства множеств их допустимых стратегий, а «связанность» – зависимость целевой функции АЭ от действий других игроков или наличие общих ограничений на управление.

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory мальной квазикомпенсаторной системой стимулирования вектор действий АЭ входил в эту систему стимулирования как параметр.

Поэтому, в более общем случае, охватывающем и метод штрафов, и метод согласования, можно считать, что на АЭ (или центр, что то же самое в силу оптимальности компенсаторных систем стимулирования) наложены штрафы следующего вида:

~ ( y), y A'Aгл i (y) = i 0, y A'Aгл, где ~i ( y) - некоторые неотрицательные функции, i I. Тогда, если AM – множество реализуемых действий, определяемых без учета глобальных ограничений на действия АЭ, то целевая функция центра в задаче стимулирования второго рода (с учетом глобальных ограничений) имеет вид:

n (y) = H(y) - ( y) + ( y)}.

{c i i i=Задача планирования запишется в виде:

n (3) x* = arg max [H(y) - ( y) + ( y)}], {c i i xAM i=а максимальная эффективность стимулирования (эффективность оптимальной системы стимулирования) равна K* = (x*)1.

В таблице 2 представлены возможные комбинации глобальных ограничений («+» – наличие глобальных ограничений, «-» отсутствие глобальных ограничений) на множества допустимых стратегий АЭ, их целевые функции и управления.

Мы не будем останавливаться подробно на таких простых утверждениях, следующих из анализа выражений (1)-(3), как то, что с расширением множеств AM (то есть с ростом возможностей центра по управлению) и Aгл (ослаблением внешних – глобальных – ограничений) эффективность стимулирования не уменьшается и т.д.

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory № Множества Целевые Управления Тип АС допустимых функции (допустистратегий АЭ мые стратеАЭ гии центра) 1. АС с независимыми и --несвязанными АЭ 2. АС с зависимыми и +-несвязанными АЭ 3. АС с зависимыми и ++сильно связанными АЭ 4. АС с зависимыми и +-+ слабо связанными АЭ 5. АС с независимыми и -+сильно связанными АЭ 6. АС с независимыми и --+ слабо связанными АЭ 7. АС с независимыми и -++ сильно связанными АЭ 8. АС с зависимыми и +++ сильно связанными АЭ Таблица 2. Классификация взаимосвязанности и взаимозависимости АЭ.

Рассмотрим кратко все восемь случаев (см. таблицу 2) и покажем для них, что при решении задач стимулирования в многоэлементных АС с зависимыми АЭ учет глобальных ограничений на множества допустимых действий АЭ возможно осуществлять, применяя как метод штрафов, так и метод согласования, причем их использование не изменяет результатов, описанных в четвертом разделе настоящей работы.

Качественное обоснование справедливости последнего утверждения таково – взаимосвязь АЭ (в смысле целевых функций) была учтена при решении задач стимулирования в четвертом разделе настоящей работы, а, используя выражения (2) и (3), удается декомпозировать и учесть «независимо» факторы, связанные с ограничениями на множества допустимых стратегий АЭ и центра.

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Другими словами, в общем случае алгоритм действий при учете глобальных ограничений таков: для каждой из моделей S1-S8 на втором этапе решения задачи стимулирования (этапе поиска оптимального для центра реализуемого действия) максимизация целевой функции центра ведется не по всему множеству A’ допустимых действий АЭ, а по множеству: A’ Aгл AM. При этом «автоматически» обеспечивается учет глобальных ограничений как на действия АЭ, так и на стимулирование.

Случай 1. АС с независимыми и несвязанными АЭ. Очевидно, что многоэлементная АС с независимыми и несвязанными АЭ может быть представлена в виде набора невзаимодействующих одноэлементных активных систем (ни согласование с глобальными ограничениями, ни штрафы в данном случае не требуются). На втором этапе решения задачи стимулирования максимизация целевой функции центра ведется независимо по множествам Ai, i I.

Случай 2. АС с зависимыми1 и несвязанными АЭ. В данном случае центр имеет возможность использовать индивидуальное стимулирование для каждого АЭ, рассматривая в качестве реализуемых только вектора действий, принадлежащие множеству допустимых с точки зрения глобальных ограничений (метод согласования), то есть на втором этапе решения задачи стимулирования максимизация целевой функции центра ведется по множеству A’ Aгл.

Случай 3. АС с зависимыми и сильно связанными АЭ (глобальные ограничения на управление отсутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра также ведется по множеству A’ Aгл.

Отметим, что в работе [24] при описании игр с запрещенными ситуациями взаимозависимость АЭ отражалась следующим образом: целевая wi ( y), y Aiгл функция i-го АЭ определялась как: fi(y) =, где Aiгл -, y Aiгл A’, i I. Если i I Aiгл = Aгл, то имеет место случай одинаковых ограничений. В дальнейшем мы по умолчанию ограничимся случаем одинаковых ограничений.

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Случай 4. АС с зависимыми и слабо связанными АЭ (глобальные ограничения на управление присутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра ведется по множеству A’ Aгл AM.

Случай 5. АС с независимыми и сильно связанными АЭ (глобальные ограничения на управление отсутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра ведется по множеству A’.

Случай 6. АС с независимыми и слабо связанными АЭ (глобальные ограничения на управление присутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра ведется по множеству A’ AM. Как отмечалось выше, задача управления АС с независимыми и слабо связанными АЭ может быть сведена к параметрической задаче управления набором одноэлементных АС и задаче выбора оптимального значения параметра.

Случай 7. АС с независимыми и сильно связанными АЭ (глобальные ограничения на управление присутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра также ведется по множеству A’ AM.

Случай 8. АС с зависимыми и сильно связанными АЭ (глобальные ограничения на управление присутствуют). На втором этапе решения задачи стимулирования максимизация целевой функции центра ведется по множеству A’ AM Aгл.

Таким образом, учет глобальных ограничений на стратегии участников АС (активных элементов и центра) производится методами штрафов или согласования в рамках предложенной в четвертом разделе методики решения задач стимулирования в многоэлементных АС.

До сих пор при рассмотрении задач стимулирования мы предполагали, что единственным управляющим воздействием на АЭ со стороны центра является изменение системы стимулирования. В то же время, одним из параметров модели АС (и, как показал проведенный выше анализ - параметров, существенно влияющих на эффективность стимулирования) являются множества допустимых действий АЭ. Поэтому исследуем задачу управления АС, в которой PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory центр, помимо выбора системы стимулирования, имеет возможность влиять и на множества допустимых действий АЭ1.

Рассмотрим многоэлементную АС, отличающуюся от исследуемой в четвертом разделе настоящей работы следующим. Пусть центр имеет возможность выбирать, помимо функций стимулирования, управляющие параметры ui Ui, i I, определяющие множества допустимых действий АЭ, то есть Ai = Ai(ui). Тогда вектор действий активных элементов y принадлежит допустимому множеn n ству A(u) = Ai (ui ), u = (u1, u2, …, un) U’ =.

U i i=1 i=Предположим, что y A’ u U’: y A(u). Содержательно данное предположение означает, что множество допустимых управлений центра достаточно «велико» для того, чтобы сделать допустимым любой вектор действий АЭ.

Назначая определенные значения управляющих параметров u U’, центр несет издержки (u), : U’, измеряемые в денежном выражении. Тогда целевая функция центра имеет вид (в общем случае будем считать, что затраты АЭ несепарабельны, а индивидуальное стимулирование каждого АЭ зависит от действий всех АЭ):

n (4) (y,, u) = H(y) - ( y) - (u).

i i=Действия y*, выбираемые АЭ, являются равновесием Нэша при данных управлениях, то есть y* EN(, u). Задача управления в рамках гипотезы благожелательности заключается выборе управляющих параметров, максимизирующих целевую функцию центра на множестве решений игры:

(5) max (y,, u) max.

yEN (,u) M, uU Для решения задачи (5) воспользуемся комбинацией результатов, полученных в четвертом разделе, и выражениями (1)-(3), Задачи управления АС с переменными множествами допустимых действий рассматривались как в теории активных систем [4, 15, 55], так и в теории иерархических игр [24, 25, 30], причем, в основном, для динамических моделей.

PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory позволяющими учитывать глобальные ограничения.

Фиксируем произвольный вектор действий АЭ x A’. Для того чтобы этот вектор действий был реализуем, необходимо и достаточно, чтобы он был равновесием Нэша (для этого достаточно использовать соответствующую компенсаторную систему стимулирования – см. раздел 4), и был допустимым действием (с точки зрения ограничений на множества действий АЭ). Для удовлетворения последнему условию центр должен выбрать такие значения управляющего параметра u U’, чтобы i I xi Ai(ui).

Обозначим Ui(xi) = {ui Ui | xi Ai(ui)}, i I – множество таких управлений, при которых действие xi является допустимым для n i-го АЭ; U(x) = (xi ). Минимальные затраты центра на обесU i i=печение допустимости вектора действий x A’ равны:

(6) ~ (x) = min (u).

uU ( x) Из результатов четвертого раздела настоящей работы следует, что в рассматриваемой модели суммарные затраты центра по n реализации действия x A’ равны (x) = (x) + ~ (x). Оптиc i i=мальным для центра действием АЭ является действие y*, максимизирующее разность между доходом центра и его затратами на стимулирование:

n (7) y* = arg max {H(x) - (x)} = arg max {H(x) - (x) - ~ (x)}.

c i xA xA i=Итак, выражение (7) дает оптимальное решение задачи управления в многоэлементной АС в условиях, когда центр имеет возможность управлять множествами допустимых действий АЭ.

Исследуем теперь задачу синтеза унифицированных управлений, то есть предположим, что центр имеет возможность назначать персонифицированное стимулирование каждому из АЭ, но должен выбрать одно значение управляющего параметра, единое для всех АЭ, то есть ui = u, Ui = UU, i I.

Обозначим UU(x) = {u UU | i I xi A(u)} – множество таких управлений, при которых действие xi является допустимым PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory для i-го АЭ, i I. Минимальные затраты центра на обеспечение допустимости вектора действий x A’ равны: ~U (x) = min (u), где : UU – функция затрат центра.

U U uUU ( x) Оптимальным для центра действием АЭ является следующее действие:

n * (8) yU = arg max {H(x) - (x) - ~U (x)}.

c i xA i=Выражение (8) дает оптимальное решение задачи синтеза унифицированного управления в многоэлементной АС в условиях, когда центр имеет возможность управлять множествами допустимых действий АЭ.

Обозначим эффективности оптимальных управлений (соответственно, «обычного» и унифицированного):

n (9) K* = H(y*) - ( y*) - ~ (y*), c i i=n * * * (10) KU = H( yU ) - ( yU ) - ~U ( yU ), c * i i=* и сравним величины K* и KU, то есть оценим качественно потери в эффективности управления, вызванные необходимостью использовать единые для всех АЭ значения управляющего параметра, определяющего множества допустимых действий. Введем следующее предположение о монотонности множеств допустимых действий АЭ по управляющему параметру:

1 1 1 А.8.1. i I, ui, ui2 Ui = : ui ui2 Ai( ui ) Ai( ui2 );

u1, u2 UU = : u1 u2 i I Ai(u1) Ai(u2).

Введем также предположение об аддитивности и монотонности функций затрат центра:

n n А.8.2. (u) = (ui ), (u) = (u).

U i i i=1 i=PDF created with FinePrint pdfFactory Pro trial version http://www.pdffactory Теорема 8.1. Если выполнены предположения А.8.1 и А.8.2, то * K* KU. Если при этом ( ) – монотонно возрастающие функции, i * i I, то yU y*.

Pages:     | 1 |   ...   | 15 | 16 || 18 | 19 |   ...   | 23 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.