WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 7 | 8 || 10 | 11 |   ...   | 19 |

Будем считать, что действия АЭ y = (y, y, …, y ) A’ совместно с со1 2 n стоянием природы = (,, …, ) приводят к тому, что реализуется 1 2 n некоторый результат деятельности АС z = (z, z,…, z ) A, причем 1 2 n каждая компонента результата деятельности z A0i, i I, A = A0i, i iI зависит от действий всех АЭ и соответствующей компоненты состояния природы, то есть имеет место: z = z(y, ), i I, где функции {z(, )}, наряду i i i i с допустимыми множествами, =, известны центру и всем i i i iI АЭ.

Относительно целевых функций и допустимых множеств, дополнительно к уже введенным предположениям, примем следующее предположение, которое будем считать выполненным на протяжении настоящего раздела:

А.1. i I A0i = A ; зависимости z(y, ) непрерывны по всем переi i i менным, строго монотонны и однозначны.

Порядок функционирования и информированность участников АС следующие: центр сообщает АЭ систему стимулирования { (z)}, то есть совокупность зависимостей индивидуальных вознаi граждений АЭ от результата деятельности АС, после чего АЭ выбирают свои действия, ненаблюдаемые для центра1.

Опишем целевые функции участников АС. Целевая функция центра представляет собой разность между доходом, зависящим от действий АЭ, и суммарными затратами на стимулирование:

(z, y) = H(y) - (z). Целевая функция АЭ есть разность между i iI его вознаграждением и затратами, зависящими в силу несепарабельности от действий всех АЭ: fi(z, y) = (z) – ci(y), i I.

i Общих подходов к аналитическому решению многоэлементной задачи стимулирования в условиях неопределенности, описанной выше, на сегодняшний день, к сожалению, не существует. Поэтому введем предположение о том, что результат деятельности каждого АЭ зависит только от его собственного действия и соответствующей компоненты состояния природы, то есть будем считать2, что zi = zi(yi, ), i I.

i В этом случае возможно комбинированное применение идеи декомпозиции игры АЭ и результатов исследования моделей стимулирования в одноэлементных АС, функционирующих в условиях неопределенности. Проиллюстрирует это утверждение, рассмотрев ряд моделей многоэлементных АС с интервальной, вероятностной Модели, в которых и центр, и агенты наблюдают на момент принятия решений состояние природы рассмотрены в [100, 185].

Данное предположение частично декомпозирует игру АЭ – результат деятельности каждого из них зависит уже только от его собственных действий и состояния природы (но не зависит от действий других АЭ), в то время как другие переменные – стимулирование и затраты – попрежнему зависят, соответственно, от результатов деятельности и действий всех АЭ.

и нечеткой внешней неопределенностью при симметричной информированности участников.

Предположим, что всем участникам АС на момент принятия решений известны множества { } возможных значений неопредеi ленного параметра, а также «технологические» зависимости {zi(, )}. Пусть: затраты АЭ несепарабельны и зависят от действий АЭ, а центр использует стимулирование каждого АЭ, зависящее от результатов деятельности всех АЭ. Тогда целевые функции центра и АЭ имеют, соответственно, вид: (z, y) = H(y) - (z), i iI f(z, y) = (z) – ci(y).

i Обозначим Zi(yi, ) = {zi A0i | zi = zi(yi, ), } – множеi i i i ство тех результатов деятельности i-го АЭ, которые могут реализоваться при выборе им действия yi Ai и всевозможных состояниях природы, и предположим, что и центр, и АЭ используют принцип МГР.

Теорема 2.4.3. [103]. Система стимулирования * * * ci ( yi, y-i ), zi Zi ( yi,i ) (y*, zi) =, i I, i * zi Zi ( yi, i ) 0, реализует (как равновесие Нэша) вектор действий y* A’, который оптимален при условии y* Arg max {H(y) - ( y) }.

c i yA' iI Последнее выражение означает, что центр побуждает АЭ выбрать наиболее выгодное для себя (то есть максимизирующее разность между доходом и затратами на стимулирование) гарантированно реализуемое действие.

Пусть затраты всех АЭ несепарабельны и зависят от результатов деятельности, то есть ci = ci(z), i I. Предположим, что на момент принятия решений участники АС обладают одинаковой информацией о распределениях вероятностей {pi(zi, yi)} результатов деятельности АЭ в зависимости от его действия, и «технологических» зависимостях {zi(, )}.

К сожалению, на сегодняшний день даже для одноэлементных АС, функционирующих в условиях внешней вероятностной неопределенности, не получены общие аналитические решения задач стимулирования второго рода. Поэтому в настоящем разделе мы рассмотрим модель простого АЭ [17, 100], для которой решения одноэлементных задач известны, проиллюстрировав эффективность использования идеи декомпозиции игры АЭ в многоэлементной вероятностной АС.

Теорема 2.4.4. [103]. В рамках ГБ система стимулирования * * ci (zi, z-i ), zi yi (y*, zi) =, i I, i * zi > yi 0, реализует (как равновесие Нэша) вектор действий y* A’, который оптимален при условии1 y* Arg max {H(y) - E (z) }.

c i yA' iI Приведенная теорема является результатом применения принципа декомпозиции игры агентов к модели АС с внешней вероятностной неопределенностью и качественно означает, что оптимальной в рассматриваемом случае является компенсация центром индивидуальных затрат каждого из агентов в предположении, что все остальные агенты выбрали рекомендуемые центром действия.

Рассмотрим следующую модель многоэлементной АС с нечеткой внешней неопределенностью и симметричной информированностью участников, в которой и центр, и АЭ имеют нечеткую информацию о состоянии природы и «технологических» зависимостях {zi(, )}. В соответствии с принципом обобщения [15, 108] этого достаточно, чтобы определить нечеткую информационную ~ ~ функцию P (z, y), P : A0 A’ [0; 1], ставящей в соответствие вектору действий АЭ нечеткое подмножество множества результатов деятельности.

~ ~ Обозначим Q(z) = {y A’| P (z,y)=1}, Z(y) = {z A | P (z,y)=1}.

Введем следующие предположения, которые будем считать выполненными в настоящем разделе.

~ А.2. Нечеткие функции P (z, y) 1-нормальны [99, 100, 103], то есть ~ ~ y A’ z A : P (z, y) = 1 и z A y A’: P (z, y) = 1.

0 Если выполнено предположение А.2, то y A’ z A Q(z), Z(y).

Более сильным, чем А.2 является следующее предположение:

Напомним, что “E” обозначает оператор вычисления математического ожидания.

А.3. А.2 и Q(z) = A’, Z( y) = A0.

zA0 yA' А.4. Целевые функции АЭ и нечеткая информационная функция ~ P (z, y) полунепрерывны сверху1.

z Обозначим: EN ( ) - множество равновесных по Нэшу результатов деятельности АЭ, E ( ) – множество равновесных по Нэшу при использоN вании центром системы стимулирования векторов действий АЭ.

Лемма 2.4.5. [100, 103]. Если выполнены предположения А.2–А.4, то E ( ) = Q(z).

N z zEN ( ) Теорема 2.4.6. [100, 103]. Если выполнены предположения А.2–А.4, то * * ci (zi, z-i ) + i, zi = zi система стимулирования (z*, z) =, i I, где i i * zi zi 0, z* = arg max { min H(y) - (z) }, гарантированно -оптимальна.

c i zA0 yQ( z) iI Качественно, результат теоремы 2.4.6 означает, что оптимальна независимая (в соответствии с принципом декомпозиции игры агентов) компенсация затрат агентов, нацеленная на побуждение последних к выбору действий, гарантированно максимизирующих целевую функцию центра по результатам деятельности, достижимым при соответствующих действиях в рамках имеющейся нечеткой информации. При этом гарантированная эффективность стимулирования в АС с нечеткой внешней неопределенностью не выше, чем соответствующих детерминированных АС.

В заключение настоящего раздела отметим, что перспективными представляются следующие направления исследований многоэлементных АС с неопределенностью. Во-первых, это класс АС, в которых результат деятельности каждого АЭ зависит от действий всех АЭ. Во-вторых, исследование условий на информированность игроков (например, свойства плотности совместного распределения состояний природы), при которых можно без потери эффективности использовать индивидуальные системы стимулирования и т.д.

Очевидно, что, если затраты АЭ непрерывны, и центр использует компенсаторную систему стимулирования, то целевая функция АЭ полунепрерывна сверху.

В третьих, представляет интерес рассмотрение механизмов с платой за информацию в многоэлементных АС с неопределенностью и асимметричной информированностью.

В целом, из проведенного в настоящем разделе анализа многоэлементных АС с неопределенностью можно сделать вывод, что в тех случаях, когда соответствующие одноэлементные модели исследованы достаточно полно, и для них получены аналитические решения, то идея декомпозиции игры АЭ в многоэлементной АС позволяет достаточно просто получить оптимальное решение задачи стимулирования. В случае, когда соответствующие одноэлементные модели исследованы недостаточно подробно (когда, например, для них не получены даже достаточные условия оптимальности простых систем стимулирования), существенно продвинуться в изучении их многоэлементных расширений на сегодняшний день не удается.

2.5. Согласованное планирование Одна из основных задач, решаемых в управлении проектами – планирование, понимаемое как процесс определения желаемых с точки зрения управляющего органа состояний управляемых субъектов и результатов их деятельности. Специфика планирования в сложных социально-экономических системах (и, в том числе, в проектно-ориентированной деятельности) заключается в том, что, помимо согласования требований к результатам деятельности отдельных агентов, необходимо обеспечить согласование интересов управляющих органов, отражающих в моделях исследования операций интересы системы в целом, с целями и интересами управляемых субъектов.

Одним из методов такого согласования является стимулирование. Взаимосвязь планирования и стимулирования подробно обсуждалась в [27, 13, 32]. Обширный и достаточно глубоко и подробно исследованный подкласс задач стимулирования составляют задачи синтеза согласованных механизмов стимулирования (см. обзор [32]).

Пусть система стимулирования зависит от параметра - плана x X и действия АЭ y A, где X - множество допустимых планов (для простоты положим X = A): = (x, y). Тогда целевая функция АЭ зависит от стимулирования, плана и действия АЭ: f = f(, x, y).

Множество реализуемых действий также параметрически зависит от плана: P(, x) = Arg max f(, x, y). Изменяя планы, центр может yA системой стимулирования (., y) реализовать следующее множество действий: P( ) = P(, x).

xX Обозначим B( ) = {x X | y A (x, x) - c(x) (x, y) - c(y)} множество согласованных планов, то есть таких планов, выполнять которые при заданной системе стимулирования для АЭ выгодно.

Задавая систему стимулирования (x, y), центр имеет возможность оперативно изменять значения планов, не меняя функцию стимулирования, что достаточно привлекательно, так как особенно в динамике частые изменения механизма управления целиком не всегда возможны с точки зрения адаптивных свойств АЭ.

Согласованной называется система стимулирования M, для которой выполнено B( ) = P( ). Поиску необходимых и достаточных условий согласованности систем стимулирования, а также изучению соотношения таких свойств как согласованность и эффективность систем стимулирования уделялось значительное внимание исследователей. Проведем краткое обсуждение результатов, полученных для согласованных механизмов управления АС (достаточно полное и систематическое их изложение приведено в монографиях [13, 27, 29, 139] и статьях [24-26, 140-146]).

В литературе рассматривался целый ряд требований согласования интересов центра и АЭ, формулируемых как необходимость обеспечения требуемых соотношений между планами активных элементов и их реализациями (выбором - действиями АЭ). Среди них: механизмы, согласованные по выполнению плана (см. определение выше) в системах с полным, частичным и агрегированным планированием, x-согласованные механизмы, (x)-согласованные механизмы, L-согласованные механизмы и др. [13, 32] В упомянутых работах развиваются как методы решения задачи синтеза оптимальных механизмов функционирования, так и задачи синтеза оптимальных механизмов функционирования, согласованных по выполнению плана.

Наиболее известным и изящным достаточным условием согласованности системы штрафов (x, y) (для задачи стимулирования, в которой целевая функция АЭ представляет собой разность между доходом и штрафами - эта постановка является "двойственной" к описанной выше модели, в которой целевая функция АЭ определяется разностью между стимулированием и затратами) является так называемое "неравенство треугольника":

x, y, z (x,y) (x,z) + (z,y).

Подробное описание достаточных условий согласованности можно найти в [13, 27].

Важным шагом в развитии методологии и понимании проблем оптимальности в АС явилось построение основ теории необходимых и достаточных условий оптимальности механизмов, согласованных по выполнению планов, разработка техники получения конструктивно проверяемых условий их выполнения.

Понятие степени централизации, отражающее "жесткость" штрафов, позволило получить ряд результатов по сохранению свойства выполнения плана при увеличении степени централизации. Дальнейшее развитие этого направления (для согласованных механизмов, оптимальных по критерию гарантированного относительно неизвестных параметров результата) было произведено в [13].

В первой главе настоящей работы отмечалась в частности такая специфическая черта проектно-ориентированной деятельности как нестационарность условий реализации проекта, то есть неопределенность, понимаемая как недостаточная информированность лица, принимающего решения. Например, осуществляя планирование, руководитель проекта может в силу объективных и/или субъективных причин не иметь достоверной и точной информации о будущих внешних условиях его реализации. Поэтому при планировании необходимо синтезировать механизмы управления, которые обеспечат выполнение требуемых свойств, среди которых, в первую очередь, следует назвать согласование (понимаемое широко во всех отмеченных выше аспектах) во всем диапазоне возможных значений неопределенных параметров1.

См. также условия гарантированной -оптимальности и свойства обобщенных решений задач управления в работах [48, 91, 98].

Обсудим постановку задачи согласованного планирования в условиях неопределенности.

Пусть целевая функция АЭ f( ) и множество его допустимых действий A зависят от неопределенного параметра – состояния природы, принимающего значения из множества, которое известно всем участникам системы на момент принятия ими решений, то есть f = f(, x, y, ), A = A( ). В частности, от состояния природы могут зависеть затраты агента, то есть c = c(y, ).

Множество реализуемых действий P, помимо плана, также параметрически зависит от состояния природы:

Pages:     | 1 |   ...   | 7 | 8 || 10 | 11 |   ...   | 19 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.