WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 41 | 42 || 44 | 45 |   ...   | 52 |

Всем программистам, участвовавшим во второмтурнире, были представлены результаты первого турнира, а также проведенныйАксельродом анализ того, почему Око за око и другие добропорядочные и способныек прощению стратегии получили такие хорошие результаты. Разумеется, участникитурнира тем или иным образом должны были учесть эту информацию. На самом делеони разбились на две группы. Одни считали, что добропорядочность и способностьк прощению, очевидно, давали шансы на выигрыш, и соответственно предложилидобропорядочные способные к прощению стратегии. Джон Мейнард Смит зашел такдалеко, что представил всепрощающую стратегию Око за два ока. Другая группаисходила из того, что многие участники, прочитав анализ Аксельрода, предложаттеперь добропорядочные способные к прощению стратегии. Они поэтому представилинедобропорядочные стратегии, пытаясь использовать в своих интересах этихпредполагаемых придурков!

Однако недобропорядочность опять оказаласьневыгодной. Снова стратегия Око за око, представленная Анатолем Рапопортом,вышла победителем, и результат составил целых 960/0 от 600. И еще раздобропорядочные стратегии в общем оказались более эффективными, чемнепорядочные. Все 15 более эффективных стратегий, за исключением одной, былидобропорядочными, а из 15, набравших меньше очков, все, за исключением одной,были непорядочными. Но хотя праведная стратегия Око за два ока выиграла бы впервом турнире, если бы в нем участвовала, она не вышла победителем из второго.Это объясняется тем, что во втором турнире участвовали более коварныестратегии, способные безжалостно наброситься на столь откровенногопридурка.

Такой результат выявил одно важноеобстоятельство, характерное для этих турниров: успех той или иной стратегиизависит от того, какие другие стратегии участвуют в турнире. Это единственныйспособ объяснить различие между вторым турниром, в котором Око за два оказаняла гораздо более далекое место в турнирной таблице, и первым турниром, вкотором эта стратегия выиграла бы. Однако, как я уже говорил, эта книга не отом, сколь изобретательны программисты. Существует ли способ, позволяющийрешить, какую стратегию можно действительно считать наилучшей в более общем именее произвольном смысле Те, кто прочитали предыдущие главы, уже готовыискать ответ на этот вопрос в теории эволюционно стабильныхстратегий.

Я был одним из тех, кому Аксельрод сообщило своих ранних результатах с просьбой прислать стратегию для второго турнира. Яэтого не сделал, но высказал другое предложение. Аксельрод уже начинал мыслитьв терминах ЭСС, но я счел это столь важным, что написал ему, предложивсвязаться с У. Гамильтоном. Аксельрод не знал, что Гамильтон в это времяработал в одном с ним университете, только в другом отделении. Он немедленновстретился с ним, и результатом последовавшего за этим сотрудничества оказаласьблестящая статья, опубликованная в журнале Science в 1981 г. и завоевавшаяпремию Ньюкомба Кливленда Американской ассоциации содействия развитию науки.Помимо обсуждения некоторых восхитительно оторванных от жизни биологическихпримеров Итерированных Парадоксов заключенных, Аксельрод и Гамильтон дали, смоей точки зрения, должную оценку подходу в свете теории ЭСС.

Сопоставьте этот подход с «соревнованием покруговой системе», в соответствии с которым проводились два турнира Аксельрода.Каждая стратегия выставлялась против каждой из других стратегий одинаковоечисло раз. Конечная оценка стратегии определялась общей суммой очков,«заработанных» ею в играх со всеми остальными стратегиями. Таким образом, чтобыдобиться успеха в соревновании по круговой системе, данная стратегия должнавыстоять против всех других стратегий, которые людям вздумается предложить.Аксельрод назвал стратегию, способную победить широкий круг других стратегий,«сильной» стратегией. Око за око оказалась сильной стратегией. Однако наборстратегий, предлагаемых людьми в том или другом случае, произволен. Именно этобеспокоило нас выше. По чистой случайности в первом турнире Аксельрода примернополовина стратегий относилась к добропорядочным. В этих условиях Око за оковыиграла, а Око за два ока выиграла бы, если бы приняла участие в турнире.Допустим, однако, что все представленные стратегии случайно оказалисьнепорядочными. Такая ситуация могла бы возникнуть очень легко. Ведь из 14предложенных стратегий 6 действительно были непорядочными. Если бы числонепорядочных стратегий составило 13, то Око за око не выиграла бы. Атмосфераоказалась бы для нее неподходящей. Не только сумма выигрыша, но и место виерархическом ряду, выстраиваемом на основе достигнутого успеха, определяетсятем, какие стратегии были представлены; иным словами, все зависит от такогопроизвольного фактора, как прихоть того или иного человека. Как мы можемуменьшить эту произвольность Если будем «мыслить в духе ЭСС».

Как вы, вероятно, помните по первым главам,важная характеристика эволюционно стабильной стратегии состоит в том, что онапродолжает оставаться эффективной, когда она уже многочисленна в даннойпопуляции стратегий. Называя Око за око эволюционно стабильной стратегией, мыговорим, что Око за око эффективна в ситуации, в которой эта стратегиядоминирует. Это можно рассматривать как особый тип «силы». Как эволюционисты мыиспытываем соблазн рассматривать его как единственный тип силы, имеющийсущественное значение. Почему это так важно А потому, что в мире дарвинизмавыигрыши выплачиваются не в виде денег, а в виде потомков. Для дарвинистауспешная стратегия —это такая стратегия, которая стала многочисленной в данной популяции стратегий.Для того чтобы стратегия оставалась успешной, она должна быть особенноэффективной тогда, когда она многочисленна, когда она действует в обстановке,где доминируют ее собственные копии.

На самом деле Аксельрод провел третий раундсвоего турнира так, как его мог бы вести естественный отбор, стремящийся найтинекую ЭСС. Правда, он не назвал это третьим раундом, поскольку он не обращалсяс просьбами о новых предложениях, а использовал те же 63 стратегии, что и враунде 2. Мне кажется удобным рассматривать его как раунд 3, потому что,по-моему, он отличается от двух «соревнований по круговой системе» болееосновательно, чем эти два соревнования отличаются друг от друга.

Аксельрод взял эти 63 стратегии и вновьввел их в компьютер в качестве «генерации 1» некой эволюционнойпоследовательности. Поэтому в «генерации 1» были равномерно представлены все 63стратегии. В конце генерации 1 каждой стратегии был выплачен выигрыш не в виде«денег» или «очков», но в виде {шрифт наклонный}потомков{шрифт обычный},идентичных своим (бесполым) родителям. С течением времени, по мере того, какодно поколение сменялось другим, некоторые стратегии становились редкими и вконце концов вовсе исчезали. Другие стратегии стали встречаться чаще. Вслед заизменением этих соотношений изменялась и «обстановка», в которой происходилодальнейшее развитие игры.

В конце концов по прошествии примерно 1000поколений дальнейшие изменения обстановки прекратились. Была достигнутастабильность. До этого благосостояние различных стратегий возрастало и падало,точно так же, как при компьютерном моделировании стратегий Плутов, Простаков иЗлопамятных. Некоторые стратегии пошли на убыль с самого начала, а к 200-мупоколению большая их часть вымерла. Одна или две из непорядочных стратегийстали встречаться все чаще, однако их процветание, как и у Простака в моеймодели, было недолгим. Единственная непорядочная стратегия, сохранившаяся попрошествии 200 поколений, была стратегия под названием Харрингтон. Выигрышиэтой стратегии резко возрастали на протяжении первых 150 поколений, а затемдовольно медленно снижались, и стратегия практически вымерла к 1000-мупоколению. Стратегия Харрингтон была успешной в течение некоторого времени потой же причине, что и моя оригинальная стратегия Плут. Она эксплуатировалапридурков вроде стратегии Око за два ока, пока они еще существовали. Затем,после того как эти придурки были доведены до вымирания, стратегия Харрингтон,лишившись легкой добычи, последовала за ними. Арена оказалась свободной длятаких добропорядочных, но дерзких стратегий, как Око за око.

Сама стратегия Око за око действительновзяла верх в пяти из шести партий третьего раунда, точно так же, как это было враундах 1 и 2. Пять других добропорядочных, но дерзких стратегий добились почтитакого же успеха (высокая частота в популяции), как Око за око, одна из нихдаже победила в шестой партии. После того как все недобропорядочные стратегиибыло доведены до вымирания, ни одну из добропорядочных стратегий нельзя былоотличить от Ока за око или друг от друга, потому что все они, будучидобропорядочными, просто играли друг против друга Кооперируюсь.

Эта неразличимость означает, в частности,что хотя Око за око напоминает ЭСС, она, строго говоря, не является настоящейЭСС. Вспомним: для того, чтобы быть ЭСС, стратегия, когда она становится широкораспространенной, должна быть защищена от проникновения той или иной редкоймутантной стратегии. Что же касается стратегии Око за око, то хотя она и недопускает проникновения какой-либо недобропорядочной стратегии, от другихдобропорядочных стратегий она не защищена. Как мы только что видели, впопуляции добропорядочных стратегий все стратегии будут выглядеть и вести себясовершенно одинаково: все они будут играть Кооперируюсь. Таким образом, любаядругая добропорядочная стратегия, подобно совершенно праведной Всегдакооперируйся, хотя предположительно она будет обладать положительным селективныпреимуществом над стратегией Око за око, тем не менее может проникнуть впопуляцию незамеченно. Поэтому технически Око за око нельзя считатьЭСС.

Можно подумать, что поскольку мирпродолжает оставаться таким же добропорядочным, мы могли бы рассматривать Окоза око как ЭСС. Но, боже, посмотрите, к чему это приведет! В отличие от Ока заоко стратегия Всегда кооперируюсь неустойчива к проникновению непорядочныхстратегий, таких, как Всегда отказываюсь. Стратегия Всегда отказываюсьэффективна против Всегда кооперируюсь, поскольку она всякий раз получает 5очков за риск. Непорядочные стратегии, такие, как Всегда отказываюсь, вступят вигру, поддерживая на низком уровне численность слишком добропорядочныхстратегий, таких, как Всегда кооперируюсь.

Однако, хотя Око за око, строго говоря, неявляется истинной ЭСС, было бы, вероятно, справедливо рассматривать некую смесьв своей основе добропорядочных, но мстительных, «Око за око-подобных»стратегий, как примерно эквивалентную ЭСС. Такая смесь может содержатьнебольшую добавку непорядочности.

Роберт Бойд и Джеффри Лорбербаум (RobertВoуd, Jeffrey Lorberbaum) в одной из интересных работ, продолжающихисследования Аксельрода, рассматривают смесь стратегии Око за око и стратегии,названной Недоверчивой око за око. Недоверчивая око за око технически относитсяк числу непорядочных, но она не слишком уж непорядочна. Она ведет себя точнотак, как сама Око за око после первого хода, но — и именно это делает еетехнически непорядочной — она играет Отказываюсь при самом первом ходе.

В условиях полного доминирования стратегииОко за око стратегия Недоверчивая око за око не может процветать, потому что еепервоначальный отказ запускает непрерывную цепь взаимных обвинений. Если же онавстречается с игроком, принявшим стратегию Око за два ока, то великодушноевсепрощение последней пресекает этот поток взаимных обвинений в зародыше. Обаигрока заканчивают игру с результатом не ниже принятого за точку отсчета (т.е.одни тройки), причем Недоверчивая око за око получает премию за свой начальныйотказ.

Бойд и Лорбербаум показали, что в популяциюстратегий Око за око может проникнуть в эволюционном смысле смесь «Око за дваока и Недоверчивая око за око» — двух стратегий, процветающих в сочетании друг с другом. Это почтинаверное не единственная комбинация, способная к подобной инвазии. Существует,возможно, много смесей слегка непорядочных стратегий с добропорядочными ипрощающими, которые способны к совместной инвазии. Во всем этом можно увидетькак бы отражение хорошо знакомых ситуаций, встречающихся в жизнилюдей.

Аксельрод понимал, что Услугу за услугу,строго говоря, нельзя считать ЭСС и поэтому он описал ее как «Коллективностабильную стратегию». Как и в случае настоящих ЭСС, коллективно стабильнымимогут быть одновременно несколько стратегий. И снова доминирование в популяциизависит просто от везения. Всегда отказываюсь также стабильная стратегия, равнокак и Око за око.

В популяции, в которой Всегда отказываюсьуже достигла доминирующего положения, ни одна другая стратегия не можетпревзойти ее по эффективности. Мы можем рассматривать систему как имеющую дветочки стабильности: одна из них Всегда отказываюсь, а другая — Око за око (или какая-то смесьпо большей части добропорядочных ответных стратегий). Та точка стабильности,которая первой займет доминирующее положение в популяции, и останетсядоминантной.

Что же означает «доминирование» наколичественном уровне Каким должно быть число стратегий Око за око, чтобы онаодолела Всегда отказываюсь Это зависит от конкретных выплат, на которыебанкомет согласился пойти в данной игре. В общем можно лишь сказать, чтосуществует некая критическая частота, некий рубеж. По одну его сторонукритическая частота стратегии Око за око превышена и отбор начинает все большеи больше благоприятствовать этой стратегии. По другую сторону превышенакритическая частота стратегии Всегда отказываюсь и отбор все больше и большеблагоприятствует этой последней. Мы уже встречались с такой ситуацией в гл. 10,при рассмотрении Злопамятных и Плутов.

Совершенно очевидно поэтому, сколь важноезначение имеет то, по какую сторону от рубежа окажется данная популяция в самомначале. Нам необходимо также знать, каким образом популяция может иногдапереходить с одной стороны рубежа на другую.

Допустим, что мы начинаем с популяции, уженаходящейся на стороне Всегда отказываюсь. Немногочисленные индивидуумы,придерживающиеся стратегии Око за око, не встречаются друг с другом достаточночасто, чтобы быть взаимно полезными.

Таким образом, естественный отбор толкаетпопуляцию еще дальше, к самой крайней точке Всегда отказываюсь. Если бы толькоэта популяция смогла просто каким-то образом, в результате случайного дрейфапереступить рубеж, она могла бы скатиться по склону на сторону стратегии Око заоко и всем это было бы очень выгодно, а расплачивался бы банкомет (или«Природа»).

Но, разумеется, популяции не обладают ниволей, ни намерениями или целями, общими для всей группы. Они не могутстремиться к тому, чтобы перейти рубеж. Они перейдут его только в том случае,если их поведут за собой ненаправленные силы Природы.

Как это может произойти Можно было быответить: «Случайно». Однако слово «случайность» просто скрывает наше незнание.Оно означает: «Определяется какими-то пока неизвестными или точно неустановленными факторами».

Pages:     | 1 |   ...   | 41 | 42 || 44 | 45 |   ...   | 52 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.