WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 |   ...   | 40 | 41 || 43 | 44 |   ...   | 52 |

Описанные в гл. 10 птицы, которые удалялидруг у друга клещей из перьев, играли в итерированный вариант Парадоксазаключенных. Как это получается Если вы помните, птице очень важно избавлятьсяот клещей, однако она не может добраться до собственной макушки и ей нужно,чтобы кто-то сделал это за нее. Казалось бы, справедливость требует, чтобы онавпоследствии отплатила за эту услугу тем же самым. Но на процедуру вытаскиванияклещей надо затратить время и энергию, хотя и не слишком много. Если птицаможет безнаказанно сплутовать, т.е. если ей была оказана услуга, а онаотказывается сделать то же самое, то она пожинает все плоды, не расплачиваясьза это. Расположите исходы в порядке их «цены» и вы убедитесь, что перед вамитипичная игра Парадокс заключенных. Когда оба кооперируются (вытаскивают друг удруга клещей), то это дает достаточно хорошие результаты, однако остаетсясоблазн добиться большего, отказавшись оплачивать стоимость ответной услуги.Если оба играют Отказываюсь (отказываются вытаскивать клещей), то ничегохорошего не получается, однако еще хуже затрачивать усилия на вытаскиваниеклещей из другого индивидуума, а самому оставаться зараженным клещами.Соответствующая платежная матрица представлена на рис. 2.

Но это всего лишь один пример. Чем большедумаешь об этом, тем больше понимаешь, что не только жизнь людей, но такжежизнь животных и жизнь растений переполнена играми типа ИтерированногоПарадокса заключенных. Жизнь растений А почему бы нет Вспомните, что речьидет не об осознанных стратегиях (хотя иногда можно говорить и о них), а остратегиях в «мэйнардсмитовском» смысле, стратегиях тех типов, которые могли быпрограммироваться генами. А пока займемся более глубоким изучением того, в чемже состоит важность итерации.

В отличие от простого варианта игры,которая довольно предсказуема в том смысле, что Отказываюсь — единственная разумная стратегия,итеративный вариант предлагает много разных стратегий. В простом вариантевозможны лишь две стратегии: Кооперируюсь и Отказываюсь. Итерация, однако,допускает множество стратегий, и какая из них лучше всех — отнюдь не очевидно. Приведем вкачестве примера одну из тысяч: «играй Кооперируюсь по большей части, но ввыбранных случайным образом 10°/о партий играй Отказываюсь». Другие стратегиимогут зависеть от того, как протекала игра перед этим. Примером служит мой«Злопамятный»: у него хорошая память на лица, и хотя в основном он склоненкооперироваться, он отказывается, если другой игрок отказывался когда-либо впрошлом. Другие стратегии могут быть более снисходительными и не такимизлопамятными.

Число стратегий, возможных в итеративнойигре, ограничено, очевидно, лишь нашей изобретательностью. Можно ли установить,какая из них лучше всех Эту задачу поставил перед собой Аксельрод. У неговозникла увлекательная идея провести конкурс и он пригласил специалистов потеории игр представить свои стратегии. В данном случае стратегии — это заранее составленныепрограммы действия, и соответственно соперники представили свои заявки на языкепрограммирования. Было предложено четырнадцать стратегий. Аксельрод добавил кним пятнадцатую, назвав ее Случайной, которая просто без всякой системы игралато Кооперируюсь, то Отказываюсь и служила своего рода базовой«анти-стратегией»: стратегию, дававшую худшие результаты, чем Случайная,следовало признать очень плохой.

Аксельрод описал все 15 стратегий на одномобщем языке программирования. Каждая стратегия сравнивалась по эффективностипоочередно с каждой из остальных (в том числе не собственной копией) в игреИтерированный Парадокс заключенных. Поскольку стратегий было 15, то компьютерсыграл 15 х 15, или 225, отдельных игр. После того, как каждая пара сделала по200 ходов, все выигрыши были суммированы и был объявлен победитель.

Нас здесь не интересует, какая именностратегия вышла победителем в игре против каждого отдельного противника. Намважно установить, какая стратегия выиграла больше всего «денег» за все свои 15вариантов. «Деньги» —это просто «очки», присуждаемые по следующей схеме: взаимное Кооперирование— 3 очка; Риск— 5 очков; Наказаниеза взаимный отказ — 1очко (эквивалент небольшого штрафа в игре, описанной ранее); Штраф Простаку— 0 очков (эквивалентбольшого штрафа в игре, описанной ранее).

Максимально возможный выигрыш, которыймогла бы получить та или иная стратегия, составляет 15000 очков (200 партий по5 очков за партию с каждым из 15 противников). Минимальный результат составляет0. Излишне говорить, что ни один из этих крайних результатов на самом деле ненаблюдался. Наибольший выигрыш, на который может реально надеяться даннаястратегия в среднем из своих 15 турниров, не может сколько-нибудь значительнопревысить 600 очков. Это все, что мог бы получить каждый из двух игроков, еслибы они оба все время играли Кооперируюсь, зарабатывая по 3 очка за каждую из200 сыгранных партий. Если бы один из них поддался искушению отказаться, точисло его очков, вероятно, оказалось бы меньше 600, так как другой игрокотплатил бы ему тем же (в большей части представленных стратегий было заложенов той или иной форме стремление к ответному удару). Мы можем использовать число600 в качестве своего рода точки отсчета для данной игры и выражать результатыв процентах от этого числа. По такой шкале оценок теоретически можно довестивыигрыш до 166% (1000 очков), но практически ни одна стратегия не заработала всреднем больше 600 очков.

Не забывайте, что «игроками» в турнире былине люди, а программы, точнее — запрограммированные стратегии. Их авторы, т.е. люди, выступали втой же роли, что и гены, программирующие тела (вспомните гл. 4 — компьютер, играющий в шахматы, икомпьютер, созданный по инструкциям с Андромеды). Стратегии, о которых идетречь, можно рассматривать как доверенных лиц их авторов. На самом деле кто-тоиз авторов мог бы представить не одну, а несколько программ (хотя было быжульничеством —которого Аксельрод, вероятно, не допустил бы, — если бы тот или другой автор«забил» весь турнир своими стратегиями, и одна из них воспользовалась быплодами жертвенного кооперирования со стороны других).

Было предложено несколько очень хитроумныхстратегий, хотя они были, конечно, далеко не столь хитроумными, как их авторы.Интересно, что победившая стратегия была проще всех других и на первый взгляднаименее хитроумной. Она называлась «Око за око» и была представлена проф.Анатолем Рапопортом (Anatol Rapoport), известным психологом и специалистом потеории игр из Торонто. По этой стратегии первым ходом должно быть Кооперируюсь,а в дальнейшем следует просто повторять предыдущий ход другогоигрока.

Как проходит игра Око за око Как всегда,развитие событий зависит от поведения второго игрока. Допустим для начала, чтовторой игрок — этотоже стратегия Око за око (напомним, что каждая стратегия играла не толькопротив каждой из 14 других стратегий, но также против копии самой себя). Обестратегии Око за око начинают с кооперирования. При следующем ходе каждый игрокповторяет предыдущий ход противника, т.е. кооперируется. Оба продолжают игратьКооперируюсь до конца игры, которую оба заканчивают, достигнув на 100% суммыочков, принятой за точку отсчета, т.е. заработав по 600 очков.

Допустим, что Око за око играет противстратегии, названной Наивный испытатель. На самом деле Наивный испытатель неучаствовал в конкурсе Аксельрода, но тем не менее этот пример поучителен.Наивный испытатель в основном идентичен программе Око за око, с той разницей,что время от времени, скажем один раз за десять ходов, причем без всякойзакономерности, он совершенно беспричинно играет Отказываюсь и требует 5 очков,причитающиеся ему за риск. До тех пор, пока Наивный испытатель не предприметодин из своих зондирующих отказов, оба игрока ведут себя в соответствии состратегией Око за око. Однако внезапно, без предупреждения, скажем на восьмомходу, Наивный испытатель отказывается. Око за око, разумеется, сыграла в этотраз Кооперируюсь, а поэтому получила 0 очков, как это положено Простаку.Наивный испытатель, казалось бы, добился успеха, заработав за этот ход 5 очков.Но своим следующим ходом Око за око «мстит». Она играет Отказываюсь, простоследуя заложенному в нее правилу копировать предыдущий ход противника. Темвременем стратегия Наивный испытатель, следуя правилу копировать противника,заложенному в нее самое, повторила ее ход — Кооперируюсь. В результате ейдостается Штраф Простаку, т.е. 0 очков, тогда как Око за око получает высшуюплату — 5 очков.Своим следующим ходом Наивный испытатель довольно несправедливо, как можноподумать, — «мстит»за отказ стратегии Око за око. И такое чередование продолжается. При этом обаигрока получают в среднем по 2,5 очка за ход (среднее между 5 и 0). Это меньше,чем те верные 3 очка за ход, которые получают игроки, если они оба играютКооперируюсь (кстати, это и есть причина введения того «дополнительногоусловия», которому не было дано объяснения на с. 188). Итак, когда Наивныйиспытатель играет против стратегии Око за око, оба выигрывают меньше, чем вигре Око за око против Ока за око. Если же игра идет между двумя Наивнымииспытателями, дела обоих обстоят еще хуже, так как серии взаимных отказовначинаются раньше.

Рассмотрим теперь еще одну стратегию,получившую название Раскаивающийся испытатель. Раскаивающийся испытатель сходенс Наивным испытателем, отличаясь от него лишь тем, что для запуска сериипоочередных возмездий необходимо предпринимать активные шаги. Для этого емунужна несколько более долгая «память», чем у стратегий Око за око или Наивныйиспытатель. Раскаивающийся испытатель запоминает, был ли его отказ спонтанным ипривело ли это к быстрому возмездию. В этом случае он, «полный раскаяния»,предоставляет своему противнику право на «один бесплатный удар», за которым неследует возмездия. Это означает, что серии взаимных возмездий пресекаются всамом зачатке. Если теперь продолжить воображаемую игру между стратегиямиРаскаивающийся испытатель и Око за око, то обнаружится, что серии мнимыхвзаимных возмездий быстро прерываются. На протяжении большей части игрыпротивники взаимно кооперируются, что обеспечивает им обоим большой выигрыш.Раскаивающийся испытатель играет более успешно против стратегии Око за око, чемНаивный испытатель, хотя и не так успешно, как Око за око против самойсебя.

Некоторые из стратегий, участвовавших втурнире Аксельрода, были гораздо более хитроумными, чем Раскаивающийсяиспытатель или Наивный испытатель, однако они также набирали в среднем меньшеочков, чем простая стратегия Око за око. В сущности наименее успешной из всехстратегий (если исключить Случайную) оказалась самая сложная, тщательноразработанная стратегия. Она была представлена под девизом «Автор пожелалостаться неизвестным», что послужило поводам для веселых гипотез. Кто авторКакой-то серый кардинал в Пентагоне Глава ЦРУ Генри Киссинджер СамАксельрод Я думаю, что этого мы никогда не узнаем.

Подробно разбирать отдельные стратегии нетак уж интересно. В задачи этой книги не входит обсуждение изобретательностипрограммистов. Гораздо интереснее распределить имеющиеся стратегии поопределенным категориям и изучать эффективность этих более крупныхподразделений. Самая важная из различаемых Аксельродом категорий названа«добропорядочной». Добропорядочная стратегия определяется как такая стратегия,которая никогда не отказывается первой. Примером служит Око за око. Онаспособна отказаться, но делает это только в порядке возмездия. Как Наивный, таки Раскаивающийся испытатели — недобропорядочные стратегии, потому что они иногда, хотя и редко,отказываются без всякого к тому повода. Из 15 стратегий, участвовавших втурнире, 8 были добропорядочными. Показательно, что эти же 8 стратегий набралинаибольшее число очков, а 7 недобропорядочных остались далеко позади. СтратегияОко за око набрала в среднем 504,5 очка, что составляет 84% от нашей точкиотсчета (600 очков) и может считаться хорошим результатом. Другиедобропорядочные стратегии набрали лишь немного меньше очков — от 83,4 до 78,6%, оставив далекопозади самую успешную из всех непорядочных стратегий — Грааскамп, набравшую 66,8%очков.

Еще один из технических терминов Аксельрода— это «прощение». Упрощающей стратегии короткая память, хотя она может давать сдачи. Она оченьбыстро забывает о прошлых обидах. Око за око — прощающая стратегия. Онанемедленно дает отказчику по рукам, но тут же забывает о нанесенной ей обиде.Описанный в гл. 10 Злопамятный никогда не прощает. Он сохраняет в памяти всесобытия до самого конца игры. Он никогда не забывает, если кто-то из игроковхотя бы один раз сыграл против него Отказываюсь. Стратегия, формально названнаяЗлопамятный, участвовала в турнире Аксельрода под именем Фридман и не достиглаособенно хороших результатов. Среди всех добропорядочных стратегий (заметим,что она добропорядочна лишь в техническом смысле, но при этом совершенно ничегоне прощает) пара Злопамятный/Фридман оказалась на втором; месте с конца.Причина, по которой неспособные прощать стратегии не достигают хорошихрезультатов, состоит в том, что они не могут разорвать серию взаимных возмездийдаже в тех случаях, когда их противник «раскаивается». Можно быть болееснисходительным, чем стратегия Око за око. Стратегия Око за два ока разрешаетсвоим противникам два отказа подряд и только потом мстит. Это может показатьсяслишком милостивым и великодушным. Тем не менее Аксельрод установил, что еслибы кто-то представил на рассмотрение стратегию Око за два ока, то она победилабы в турнире. Это обусловлено способностью данной стратегии избегать сериивзаимных возмездий.

Таким образом, мы определили качествавыигрывающих стратегий: добропорядочность и способность к прощению. Это почтиутопическое заключение, что добропорядочность и всепрощение окупаются, вызвалоудивление у многих экспертов, которые пускались на всевозможные хитрости,предлагая стратегии, содержащие в себе скрытые элементы недобропорядочности;даже те, кто предложил добропорядочные стратегии, не решились на что-либо стольвсепрощающее, как Око за два ока.

Аксельрод объявил о втором турнире. Онполучил 62 заявки на участие и снова добавил к ним Случайную стратегию, что всумме составило 63 стратегии. На этот раз по причине, о которой я скажупозднее, точное число ходов за партию — 200 — не было оговорено заранее. Мыснова можем выражать в процентах оценки от точки отсчета или же от результатов,получаемых при условии «Всегда кооперируйся», несмотря на то, что определениеэтой точки отсчета требует более сложных вычислений и она уже не всегда равна600 очкам.

Pages:     | 1 |   ...   | 40 | 41 || 43 | 44 |   ...   | 52 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.