WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 5 | 6 || 8 | 9 |   ...   | 12 |

Отметим, что в соответствии с принципом достаточной рефлексии (см. раздел 4) i-й агент рассматривает множества {Qij} лишь в том случае, если у него есть для этого основания. Таким основанием является, например, сообщение центром набора множеств {Qij}. Однако возможны ситуации, когда и в случае сообщения множества Qi агент может заключить, что необходимо перейти к рассмотрению набора множеств { }. Пусть, например, i-й агент ij считает, что возможным множеством значений неопределенного неизвестного параметра является ’. Пусть, далее, Aq = A0 и не существует такого ’, которому в равновесном состоянии y*( ) EN( ) соответствовало бы какое-либо значение F(y*( ), ) Qi. Если справедлив принцип доверия (см. раздел 4) и, следовательно, агент не подвергает сомнению истинность сообщения центра, то у него остаются два выхода: подвергнуть сомнению свою информированность (множество ’) либо информированность других агентов (то есть ввести в рассмотрение множества ). Этот вопрос заслуживает отдельного исследования и в наij стоящей работе не рассматривается.

Итак, в настоящем разделе мы сформулировали задачу активного прогнозирования. Обсудим, что следует понимать под точностью активного прогноза и его эффективностью как средства управления.

7. ТОЧНОСТЬ И ЭФФЕКТИВНОСТЬ АКТИВНОГО ПРОГНОЗА Рассмотрим сначала, что понимается под точностью пассивного прогноза. Предположим, что имеется некоторая система, относительно будущих состояний которой делается прогноз. Этот прогноз производится на основе той или иной модели системы (модели прогнозируемого объекта), и вычисляемая апостериори разность ||прогноз – факт||, где |||| отражает используемое «расстояние» между состояниями системы, может трактоваться и как точность пассивного прогноза, и как критерий адекватности используемой при прогнозе модели моделируемой системе.

Если система является пассивной (не содержит активных элементов, которые могут изменять свое поведение при получении новой информации), или если прогноз не становится известным участникам активной системы, то любой прогноз будет пассивным.

В случае, когда имеет место активный прогноз, использовать для определения его точности приведенную выше разность невозможно, так как невозможно оценить «фактическое» («чистое» – каким оно было бы без информационного воздействия) состояние системы и сравнить его с прогнозным.

Далее в этом разделе мы рассмотрим на качественном уровне характерные для АП величины и их комбинации. Для большей наглядности будем считать, что центр сообщает в качестве прогноза результат деятельности.

Введем следующие обозначения: z1 – фактическое состояние системы в случае, если прогнозирование не осуществляется (вообще говоря, представления о z1 у центра и агента могут различаться – мы будем обозначать представления центра z1’, а представления агента z1’’)22; z2 – прогнозируемое состояние системы (становящееся достоянием гласности, то есть доводящееся до участников системы); z3 – состояние системы в тот момент времеОтметим, что разность ||z1 – z1’|| характеризует точность пассивного прогноза, осуществляемого центром.

ни, относительно которого делался прогноз (то есть состояние, в котором она фактически окажется с учетом АП); z0 – наиболее благоприятное с точки зрения центра состояние системы.

Для четырех введенных характеристик возможны шесть различных их попарных разностей, перечисленных в таблице 1. Каждая из этих разностей может оцениваться тремя субъектами – субъектом, осуществляющим прогноз (центром), участниками системы (активными элементами (АЭ)), и сторонним наблюдателем (СН) – в два различных момента времени – до и после осуществления АП, то есть до сообщения АЭ прогноза и после реализации конечного состояния системы.

Таким образом, имеем 36 возможных комбинаций, рассмотренных в таблице 1. Не все эти комбинации имеют смысл (соответствующие ситуации обозначены прочерком: «–»). Кроме того, ячейки таблицы 1 содержат ссылки на приводимый ниже список предположений, в соответствии с которыми тот или иной критерий не имеет смысла с точки зрения определенного субъекта.

Перечислим основные свойства АП и введенные при заполнении таблицы 1 предположения:

1. АП является управлением;

2. Конечное состояние системы z3 априори неизвестно;

3. Сторонний наблюдатель не обладает собственными интересами и моделью системы23 (то есть не имеет возможность определить z1);

4. Цели центра неизвестны АЭ.

Оценки критериев, соответствующие ячейкам таблицы 1, не содержащим прочерков, имеют следующие содержательные интерпретации (отметим, что в силу различного их восприятия субъектами одни и те же величины могут иметь различные интерпретации).

Разность ||z1’’ – z2||, оцениваемая центром до сообщения АП, характеризует возможность сообщения АЭ прогноза z2 с учетом того, что АЭ может не поверить сообщению.

Другими словами, центр наблюдает или знает (в соответствующие моменты времени) z0, z1’, z1’’, z2, z3, АЭ наблюдает или знает (в соответствующие моменты времени) z1’’, z2, z3, сторонний наблюдатель наблюдает (в соответствующие моменты времени) z2 и z3.

Табл. 1. Критерии оценки АП № Крите- Центр СН АЭ рий до АП после АП до после до АП после АП АП АП 1. «раз«можно личие ли делать модетакое лей, иссообще- поль||z1 – z2|| – – – – 1 3 3 ние, зуемых поверит ценли ему тром и АЭ» АЭ» 2. «вмешатель«возможноство ||z1 – z3|| – сти управ- – – – 2 3 3 ценления» тра» 3. «правдивость точ- и/или ||z2 – z3|| – – – ность – компе2 1 2 АП тентность центра» 4. «повод для управления – что ||z1 – z0|| – – – – – 1 3 3 4 будет, если не управлять» 5. ||z2 – z0|| – – – – – – 1 1 3 3 4 6. эффектив||z3 – z0|| – – – – – 2 3 3 4 ность АП Разность ||z1’’ – z2||, оцениваемая АЭ в момент получения АП, но до реализации z3, с его точки зрения характеризует степень различия моделей, используемых им и центром для прогноза конечного состояния системы.

Разность ||z1’ – z3||, оцениваемая центром после реализации z3, с его точки зрения характеризует возможности активного прогноза как средства информационного управления, то есть возможности влияния на конечное состояние системы за счет целенаправленного сообщения прогнозной информации.

Разность ||z1’’ – z3||, оцениваемая АЭ после реализации z3, с его точки зрения характеризует вмешательство (влияние) центра, то есть отражает разность между состояниями в отсутствии и в присутствии АП.

Разность ||z2 – z3||, оцениваемая СН после реализации z3, с его точки зрения характеризует разность между спрогнозированным центром и фактически реализовавшимся состояниями системы, то есть характеризует точность АП. Таким образом, точности активного и пассивного прогноза с точки зрения стороннего наблюдателя определяются одинаково.

Разность ||z2 – z3||, оцениваемая АЭ после реализации z3, с его точки зрения характеризует правдивость центра, то есть степень различия между тем состоянием системы, которое спрогнозировал центр, и тем состоянием, которое фактически реализовалось.

Разность ||z1’ – z0||, оцениваемая центром до реализации z3, с его точки зрения характеризует степень соответствия состояния системы в отсутствии управления целям центра, то есть позволяет ответить на вопрос «что произойдет в отсутствии управления».

Разность ||z3 – z0||, оцениваемая центром после реализации z3, с его точки зрения характеризует степень соответствия состояния системы в присутствии управления целям центра, то есть эффективность АП как управления (например, эффективность АП может характеризоваться разностью |f0(z3) – f0(z0)|, где f0(z) – целевая функция центра).

Остальные комбинации не имеют смысла в силу указанных выше причин (см. таблицу 1).

В заключение данного раздела отметим следующее. Для активного прогноза фактическое состояние системы z3 зависит неким образом от самого прогноза z2. Обозначим эту зависимость (), то есть z3 = (z2). Тогда точность активного прогноза z характеризуется разностью ||z – (z)||.

Точность активного прогноза тесно связана с таким обсуждаемым в следующем разделе свойством информационного управления как его стабильность.

8. ПРОБЛЕМА СТАБИЛЬНОСТИ ИНФОРМАЦИОННОГО УПРАВЛЕНИЯ При осуществлении информационного управления, естественно, возникает следующая проблема. Если центр сообщает агенту некоторую информацию, на основании которой последний принимает решение, то это решение является для агента в какомлибо смысле наилучшим, то есть приводящим к наиболее желательному результату. Если, далее, после реализации решения результат оказывается достаточно далек от ожидаемого агентом, то доверие к сообщениям центра окажется сильно поколебленным, или даже потерянным, что весьма затруднит центру осуществление информационного управления в дальнейшем. Таким образом, в этом случае управление оказывается нестабильным – возможность его применения на протяжении длительного времени весьма проблематична.

Исходя из этого соображения, представляется целесообразным выделить в особый класс управляющих воздействий стабильное информационное управление, при осуществлении которого агент получает именно тот результат, которого ожидает. Требование стабильности, вообще говоря, сужает возможности центра, побуждает его «более внимательно» относиться к своим сообщениям.

Одним из примеров стабильного информационного управления является рассмотренный выше точный активный прогноз (см.

предыдущий раздел), при котором реально получившееся состояние системы совпадает с прогнозируемым. В более общем случае агент может на основании наблюдения результата своей деятельности уточнить информацию о неизвестных параметрах и сопоставить ее с сообщением центра. Управление, следовательно, является стабильным, если уточненная информация не противоречит сообщению центра.

Рассмотрим ситуацию, в которой участвуют центр с целевой функцией f0(y, ) и агент с целевой функцией f(y, ), y –действие агента, – значение неизвестного параметра. Введем следующие ~ обозначения: ’ – представление агента до сообщения центра; – сообщение центра; y*( ) – действие агента, максимизирующее его целевую функцию при известном (будем для простоты считать, что для каждого такое действие существует и единственно):

(1) y*( ) = arg max f(y, ).

yA Запишем, далее, следующие величины:

= f(y*( ’), ’) – выигрыш, на который агент рассчитывал до сообщения центра;

~ ~ = f(y*( ), ) – выигрыш, на который агент рассчитывал после сообщения центра;

~ = f(y*( ’), ) – выигрыш, который агент получил бы, с его точки зрения (после сообщения центра но до получения выигрыша), в отсутствие сообщения центра;

~ = f(y*( ), ) – выигрыш, который агент фактически получил;

= f(y*( ’), ) – выигрыш, который агент объективно получил бы в отсутствие сообщения центра;

= f(y*( ), ) – выигрыш, который агент получил бы в случае сообщения центром истинного значения неизвестного параметра.

По аналогии с неманипулируемым и согласованным мотивационным управлением [13, 15, 68] будем называть информационное управление стабильным, если =, то есть агент получил 2 такой выигрыш, на какой и рассчитывал (в этом случае у агента ~ нет повода сомневаться в том, что = ). Будем называть информационное управление согласованным, если, то есть выиг4 рыш агента в присутствии информационного управления не меньше, чем выигрыш в его отсутствие.

В силу определения функции y*( ), для величин – выпол1 няются следующие соотношения24:

(2) ; ; ; ; ;.

1 3 1 5 2 3 2 4 6 4 6 Отметим, что истинные значения и могут остаться неиз5 вестными для агента. В случае стабильного информационного ~ управления с точки зрения агента имеют место равенства =, =, = =. Из этих равенств следует, с учетом соотноше5 3 6 4 ний (2), что = =. Поэтому стабильное информацион4 2 3 ное управление всегда является субъективно (то есть с точки зрения агента) согласованным.

Приведенные выше рассуждения допускают обобщение на случай многоэлементной системы. В этом случае под y* следует понимать вектор действий агентов, соответствующий информационному равновесию (см. раздел 5). При этом для каждого агента будут «свои» значения величин –.

1 В случае многоэлементной системы соотношения, аналогичные (2), вообще говоря, не выполняются. Например, выигрыш агента в случае сообщения центром истинного значения неизвестного параметра может быть меньше, чем в случае сообщения ~ некоторого другого значения. Более того, возможны ситуации, ~ когда сообщение некоторого может для всех агентов привести к лучшему результату, чем при сообщении (см. девятый раздел).

Вернемся к обсуждению ситуации с одним агентом. Нетрудно видеть, что условие стабильности = всегда выполняется при 2 ~ =, то есть при сообщении центром истинного значения.

~ Выполнение условия стабильности при является, повидимому, редким исключением. Поэтому введем для центра возможность влиять на информацию о результате деятельности, получаемую агентом.

На рисунке 7 приведена структура управления агентом в несколько видоизмененном по сравнению с разделом 2 виде (ср. с Отметим, что в соответствии с [108], выполнение = может 2 интерпретироваться как "порядочность", – как "проявление 2 заботы", – как "результативность".

4 рисунком 1). Как было отмечено выше, наблюдение результата деятельности z позволяет уточнить представления о неопределенном параметре, что обозначено на рисунке 7 через I(z).

IЦЕНТР = {UA, Uv, UI, A0,, w( ), v0( ), I0} u us АГЕНТ I {A, A0,, w(), v(), I} I(z) y A z AУПРАВЛЯЕМЫЙ ОБЪЕКТ w(): A AРис. 7. Стабилизация информационного управления Предположим, что центр имеет возможность влиять на апостериорную информацию I(z), получаемую агентом (на рисунке это влияние обозначено символом us и пунктирной стрелкой).

Тогда центр может реализовать это влияние, например, перераспределив выигрыши таким образом, чтобы агент получил тот выигрыш, на который рассчитывает. Такое воздействие центра назовем стабилизацией информационного управления.

Стабилизация информационного управления предполагает изменение целевых функций. Рассмотрим это изменение подробнее, по-прежнему оставаясь в рамках модели с центром и одним агентом.

Пусть центр с целевой функцией f0(y, ) сообщает агенту с це~ левой функцией f(y, ) значение неизвестного параметра, после чего агент выбирает соответствующее действие (см. (1)). Тогда целевые функции центра и агента после перераспределения выигрышей имеют следующий вид:

~ ~ ~ ~ ~ ~ ~ ~ ~ ~ f0( ) = f0(y*( ), ) -(f (y*( ), ) - f (y*( ), )), f ( ) = f (y*( ), ).

Мы считаем, что целевые функции зависят только от сообще~ ~ ния центра, поскольку является параметром, а y*( ) определяется выражением (1).

Pages:     | 1 |   ...   | 5 | 6 || 8 | 9 |   ...   | 12 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.