WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Библиотека <Математическое просвещение> Выпуск 25 С. М. Гусейн-Заде РАЗБОРЧИВАЯ НЕВЕСТА Издательство Московского центра непрерывного математического образования Москва • 2003 УДК 519.216 ББК 22.171

Г96 Аннотация Примерно 40 лет тому назад М. Гарднер придумал такую за дачу: <В некотором царстве, в некотором государстве пришло вре мя принцессе выбирать себе жениха. В назначенный день явились 1000 царевичей. Их построили в очередь в случайном порядке и стали по одному приглашать к принцессе. Про любых двух пре тендентов принцесса, познакомившись с ними, может сказать, ка кой из них лучше. Познакомившись с претендентом, принцесса может либо принять предложение (и тогда выбор сделан навсегда), либо отвергнуть его (и тогда претендент потерян: царевичи гор дые и не возвращаются). Какой стратегии должна придерживаться принцесса, чтобы с наибольшей вероятностью выбрать лучшего?>.

В 1965 году формулировку этой задачи и её решение расска зал на своём семинаре Е. Б. Дынкин. Но его метод был необоб щаем на другие варианты задачи: например, когда целью являет ся выбор не наилучшего, а одного из трёх лучших. В таком виде задача была решена автором при помощи метода, который легко переносится и на ряд близких задач. Так из полушуточной зада чи вырос новый раздел математики — т е о р и я о п т и м а л ь ной ос тановки с лучайных проце с с ов.

Текст брошюры представляет собой обработку записи лек ции, прочитанной автором 30 ноября 2002 года на Малом мехмате МГУ для школьников 9—11 классов (запись Ю. Л. Притыкина).

Брошюра рассчитана на широкий круг читателей: школьни ков, студентов, учителей.

Издание осуществлено при поддержке Департамента образования г. Москвы и Московской городской Думы.

ISBN 5-94057-076-3 © С. М. Гусейн-Заде, 2003.

© МЦНМО, 2003.

Сабир Меджидович Гусейн-Заде.

Разборчивая невеста.

(Серия: <Библиотека,,Математическое просвещение“>. Вып. 25).

М.: МЦНМО, 2003. — 24 с.: ил.

Редактор Ю. Л. Притыкин.

Художник А. Ю. Шамшурина. Техн. редактор М. Ю. Панов.

Лицензия ИД № 01335 от 24/III 2000 года. Подписано в печать 14/VII 2003 года.

Формат бумаги 6088 /. Бумага офсетная № 1. Печать офсетная. Физ. печ. л. 1,50.

Усл. печ. л. 1,47. Уч.-изд. л. 1,44. Тираж 3000 экз. Заказ 2711.

Издательство Московского центра непрерывного математического образования.

119002, Москва, Г-2, Бол. Власьевский пер., 11. Тел. 241 72 85, 241 05 00.

Отпечатано с готовых диапозитивов в ФГУП <Производственно-издательский комбинат ВИНИТИ>.

140010, г. Люберцы Московской обл., Октябрьский пр-т, 403. Тел. 554 21 86.

Невеста-девушка смышляла жениха;

Тут нет ещё греха, Да вот что грех: она была спесива.

Сыщи ей жениха, чтоб был хорош, умён, И в лентах, и в чести, и молод был бы он (Красавица была немножко прихотлива):

Ну, чтобы всё имел. Кто ж может всё иметь?

Ещё и то заметь, Чтобы любить её, а ревновать не сметь.

Хоть чудно, только так была она счастлива, Что женихи, как на отбор, Презнатные катили к ней на двор.

Но в выборе её и вкус и мысли тонки:

Такие женихи другим невестам клад, А ей они на взгляд Не женихи, а женишонки!

Ну, как ей выбирать из этих женихов?

И. А. Крылов Разборчивая невеста Речь в данной брошюре пойдёт о задаче, которая, с одной сто роны, достаточно элементарна, чтобы её можно было рассказать от начала и до конца, и, с другой стороны, была придумана не ко гда-то там в девятнадцатом веке или раньше, а во вполне обозри мом прошлом, в веке двадцатом, причём положила начало новому разделу теории вероятностей или даже прикладной теории вероят ностей, который называется теорией оптимальной остановки слу чайных процессов. История этой задачи такова. В 1960 году её при думал Мартин Гарднер, автор огромного количества книг с увлека тельными задачами и головоломками, связанными с математикой.

Его можно назвать популяризатором математики. Оказалось, что на тот момент эта задача в теории вероятностей не рассматривалась.

В 1963 году её решил Евгений Борисович Дынкин, замечательный математик, а также известный организатор сначала вечерних мате матических кружков, а потом и математических классов в школе, сегодня имеющей название <Лицей,,Вторая школа“>. Я расскажу прямо ту задачу, которую решил Дынкин, так как это самый про стой вариант формулировки, а вот его метод решения предназначен только для этой задачи и не работает в самых простых обобщениях.

В 1966 году под влиянием и по совету того же Дынкина я занял ся этой задачей и нашёл решение в достаточно общем виде. Позже с этой задачей оказался связанным очень известный в современной России человек, фамилия которого Березовский. Борис Абрамо вич Березовский известен как бизнесмен и политический деятель, но когда-то он был математиком и защитил докторскую диссерта цию по проблемам, связанным как раз с обобщениями этой задачи.

Теперь я расскажу саму задачу, ровно так, как её формулиро вал Гарднер. Это задача о разборчивой невесте. Пусть в некотором царстве, в некотором государстве принцесса решила, что ей по ра найти себе жениха. Созвали царевичей и королевичей со всего света, и явилось 1000 претендентов. Про любых двух когда-либо увиденных принцесса может сказать, кто из них лучше. При этом царевичи, как говорят математики, образуют упорядоченное мно жество, т. е. если Иван Царевич лучше Василия Царевича, а Ва силий Царевич лучше Фёдора Царевича, то Иван Царевич лучше Фёдора Царевича. Претенденты входят к принцессе по очереди, по одному, причём их порядок определён случайным образом, т. е.

вероятность появления какого-то царевича первым, или пятисо тым, или тысячным совершенно одинакова. Принцесса, разумеет ся, умея их сравнивать, может сказать, что, например, вошедший тридцатым является десятым по качеству, т. е. девять из предыду щих были лучше, а остальные — хуже, и т. д. Цель принцессы — получить самого хорошего жениха, т. е. даже второй её не устраи вает. На каждом шаге, т. е. после встречи с каждым из царевичей, она решает, берёт ли она его в мужья. Если берёт, то на этом смотр претендентов заканчивается, они все разъезжаются по домам.

Если же принцесса ему отказывает, то царевич, будучи отвергну тым, тут же уезжает домой, потому что все царевичи и королеви чи — люди гордые. Показ претендентов на замужество при этом продолжается. Если в конце концов принцесса не получает лучшего, то считается, что она проиграла, выходить замуж вообще не будет, а уйдёт в монастырь (про монастырь я уже от себя придумал, у Гард нера этого не было). Спрашивается, как действовать принцессе, чтобы с наибольшей вероятностью получить лучшего жениха.

В основе решения задачи заложен простой принцип, имею щий громкое название <динамическое программирование>. На са мом деле это просто планирование, решение задачи с конца. Сей час я поясню, что имеется в виду. Предположим, что принцесса пропустила 999 претендентов и сейчас встречается с последним.

Тогда у неё нет никакой альтернативы, всё совершенно ясно. Если последний и есть самый лучший, то принцесса выиграла, добилась своего, если он не самый лучший, то принцесса проиграла и ухо дит в монастырь. В любом случае отвергать последнего претенден та бессмысленно, это к победе точно не приведёт. Теперь предпо ложим, что принцесса знает, как вести себя на 601-м шаге. Попро буем понять, что делать при встрече с 600-м, т. е. за шаг до этого.

Ясно, что если 600-й претендент не лучше всех предыдущих, то и думать нечего, ему нужно отказывать. Вообще в нашей задаче принцесса будет останавливаться только на тех, кто лучше всех предыдущих, иначе она точно проиграет, ведь её устраивает только самый лучший. Если же он действительно лучше всех предыдущих, то у принцессы есть выбор. Например, когда приходит первый, то, естественно, он лучше всех предыдущих, так как и предыдущих-то никаких не было, но останавливаться на нём как-то очень странно, шансов победить мало, с таким же успехом можно и на десятом остановиться, лучше ещё подождать хоть немного, может, кто-ни будь получше появится. Итак, пусть 600-й лучше всех предыдущих, и принцессе нужно оценить (она, наверное, и не может, но ведь для этого математики и существуют), что лучше: выбрать этого самого 600-го или отказать ему, перейти к следующему, а там, как мы помним, уже всё известно, понятно, как нужно поступать, и шансы на получение лучшего жениха мы посчитать сможем.

Итак, объявим для начала, что 1000 мы обозначим за n, т. е.

решим задачу для произвольного количества претендентов. Далее, пусть принцесса находится на шаге t (это номер шага, т. е. на туральное число). Первое, что ей нужно знать — это вероятность победы в случае выбора жениха в момент t, при условии, что он лучше всех предыдущих, т. е. вероятность того, что он не только лучше всех предыдущих, а вообще лучше всех. Обозначим эту ве роятность за gt. Кроме того, необходимо знать ещё одну величи ну — это вероятность того, что она в конце концов получит самого хорошего жениха, при условии, что она пропустит первых t пре тендентов и дальше будет пользоваться оптимальной стратегией (здесь подразумевается наше предположение о том, что принцесса знает, как себя оптимально вести начиная с шага t+1, это и есть принцип, используемый в динамическом программировании). Обо значим эту вероятность за ht. Зная эти две величины для любо го t, мы можем легко понять оптимальную стратегию поведения для принцессы: если на шаге t претендент не лучше всех преды дущих, то, ясное дело, его нужно отвергнуть, если же он действи тельно лучший среди первых t претендентов, то нужно сравнить gt и ht, если б ольше gt, то нужно остановиться на претенденте t, ес ли больше ht, то нужно его отвергнуть и перейти к следующему, такая стратегия следует прямо из определения этих вероятностей.

Что же делать в случае равенства? Понятно, что это неважно, так как вероятность победы в каждом из случаев одинакова, поэтому давайте договоримся, что в случае равенства gt и ht принцесса бу дет, например, всё время останавливаться на текущем претенденте.

Стратегия нами уяснена, осталось только посчитать gt и ht.

Вероятность gt я посчитаю прямо сейчас, явно, а ht пока считать не буду, только скажу достаточно очевидный факт о том, как эта вероятность себя ведёт в зависимости от t.

Итак, посчитаем gt. Начнём, как и было обещано, считать с конца, т. е. сначала посчитаем gn, потом gn-1, и т. д., заполняя gt tn-3 n-2 n-1 n Рис. gt tn-3 n-2 n-1 n Рис. таблицу на рис. 1. Итак, если на шаге n претендент оказался луч ше всех предыдущих, то какова вероятность того, что он действи тельно самый лучший среди всех претендентов? Сто процентов, или единица (рис. 2;

кстати, вероятность можно мерить в процен тах, но проценты — это те же доли, а именно, сотые доли, поэто му вероятность также меряют в долях от единицы). Далее, пусть принцесса оказалась на шаге n-1, и перед ней предстал претен дент, который лучше всех предыдущих. Какова же будет вероят ность проигрыша в случае, если принцесса его выберет? Это бу дет вероятность того, что последний, n-й царевич окажется лучше всех. Но давайте представим всех царевичей и королевичей упоря доченными по возрастанию <хорошести>, <качества> (как мы по мним, по условию это можно сделать). Поскольку царевичи равно вероятно разбросаны по этому списку (что тоже следует из усло вия), то вероятность самого хорошего претендента оказаться на n-м месте (т. е. как раз вероятность проигрыша) точно такая же, как оказаться на 1-м, на 57-м, на 600-м или на любом другом. Значит, они все (эти вероятности) равны, и поэтому вероятность победы n 1 n- равна gn-1=1- = (рис. 3).

n n Теперь хорошо бы уже начать строить гипотезы относительно того, чему равно gt в общем случае, но для этого пока ещё слишком мало данных, поэтому сначала посчитаем gn-2. Это уже сложнее, чем в предыдущих двух случаях, но тут нам поможет один очень полезный способ подсчёта такого рода вероятностей. Представим себе следующую ситуацию. Иван Царевич стоит на перепутье, пе ред ним лежит камень, на котором написано: направо пойдёшь, с вероятностью 0,5 утонешь, налево пойдёшь, с вероятностью 0, шею сломаешь, а прямо пойдёшь, с вероятностью 0,3 волки загры зут. Иван Царевич решает, что выберет себе дорогу, кинув монет ку: если выпадет орёл, то он пойдёт прямо, если решка, то он ещё раз кинет монетку и при выпадении орла пойдёт налево, а при n- gt n tn-3 n-2 n-1 n Рис. выпадении решки направо. Спрашивается, с какой вероятностью Иван Царевич погибнет? Понятно, что вероятность пойти прямо равна 0,5, пойти налево — 0,25, пойти направо — 0,25. Конечно, сумма этих вероятностей равна единице. Погибнуть Иван Царевич может в одном из трёх случаев, в соответствии с количеством на правлений. К примеру, вероятность того, что Иван Царевич выбе рет прямой маршрут и погибнет, равна 0,5·0,3 (важно понимать, что 0,3 — это вероятность Ивана Царевича погибнуть, только если он уже решил пойти прямо, так называемая условная вероятность;

но ещё не зная своего будущего выбора, он может посчитать ве роятность гибели, состоящую из трёх слагаемых, одно из которых как раз 0,5·0,3). Таким образом, полная вероятность гибели Ивана Царевича равна 0,5·0,3+0,25·0,4+0,25·0,5=0,375, т. е. нужно умножить вероятность каждого случая на соответствующую услов ную вероятность, а потом результаты сложить. Эта формула в тео рии вероятностей называется формулой полной вероятности.

Вернёмся теперь к подсчёту gn-2. Предположим, (n-2)-й пре тендент оказался самым лучшим среди всех предыдущих, и посчи таем, какова вероятность того, что он действительно лучше всех, т. е. вероятность того, что ни n-й, ни (n-1)-й не являются самы ми лучшими. Заметим, что вероятность (n-1)-го оказаться лучше (n-2)-го равна (действительно, рассуждая аналогично тому, n- как мы рассуждали при подсчёте gn-1, получаем, что эта вероят ность равна вероятности того, что (n-1)-й претендент окажется именно на последнем месте в списке всех n-1 претендентов, упо рядоченных по возрастанию <качества>). Соответствующая вероят ность того, что (n-1)-й будет не лучше (n-2)-го, равна 1- = n- n- =. Посчитаем условные вероятности победы. Если (n-1)-й n- лучше (n-2)-го, то тогда (n-2)-й точно не самый лучший среди всех n претендентов, т. е. вероятность победы в этом случае рав на 0. Если (n-1)-й хуже (n-2)-го, то тогда (n-2)-й является луч шим среди первых n-1 претендентов. А какая вероятность побе дить в этом случае? Иными словами, какова вероятность лучшего среди первых n-1 остаться лучшим среди всех n? Но ведь мы эту n- вероятность уже считали, она равна, т. е. в точности gn-1.

n Итак, 1 n-2 n-2 n-1 n- gn-2 = ·0+ ·gn-1= · =, n-1 n-1 n-1 n n и мы можем заполнить нашу таблицу немного дальше (рис. 4).

n-2 n- gt n n tn-3 n-2 n-1 n Рис. Теперь уже у нас возникает подозрение насчёт общей форму лы для gt. И действительно, несложно доказать, пользуясь мето t дом математической индукции, что gt= (обязательно проведите n доказательство!).

Вернёмся к ht. Вспомним, как определялась нами эта величи на. Именно, ht — это вероятность принцессы победить, т. е. по лучить в конце концов самого хорошего жениха, если она дойдёт до шага t и пропустит претендента, который ей на этом шаге встретится, а дальше будет действовать по оптимальной страте гии. Иными словами, это вероятность победить, оптимально дей ствуя начиная с шага t+1, а происходящее до этого ни принцессу, ни нас вообще не волнует. Дальше мы посчитаем эту самую веро ятность ht, а сейчас просто заметим одно сразу бросающееся в гла за свойство этой функции. Из определения вероятности ht вытека ет, что какую бы стратегию, при которой принцесса может делать свой выбор только начиная с шага t+1, мы не предложили, веро ятность успеха в случае действия принцессы в соответствии с этой стратегией не превосходит ht. Предложим тогда такую: принцес са, вместо того чтобы сразу, с (t+1)-го шага, действовать опти мально, прогоняет (t+1)-го претендента и действует оптимально, но уже начиная с (t+2)-го шага. Тогда, с одной стороны, вероят ность победы в случае выбора такой стратегии равна ht+1, а с дру гой стороны, это же одна из стратегий для какого бы то ни было действия начиная с шага t+1, отсюда сразу получаем неравенство htht+1 для любого t. Этот факт можно переформулировать так:

чем раньше принцесса начнёт действовать по оптимальной страте гии, тем больше у неё шансов на победу. Значит, ht — монотонно невозрастающая функция (правда, от целочисленного аргумента).

К примеру, hn=0, потому что если принцесса отвергает послед него претендента, то будь её последующая стратегия хоть трижды оптимальной, всё равно принцесса уже не выиграет, так как боль ше никого из претендентов не осталось, однако h1 —вовсе даже и не ноль, а какое-то вполне положительное число, предмет всего нашего изучения, т. е. h1>hn.

Посмотрим, что же у нас получилось. Изобразим графики функций ht и gt, при этом будем рисовать их плавной линией, хо тя на самом деле они точечные, можете считать, что мы эти точки просто соединяем. По одной оси отложим t — время, номер ша p p 1 gt gt ht ht n n t t t1 T t1 T Рис. 5 Рис. га, а по другой p — шансы, вероятность, она принимает значения от 0 до 1. При построении учтём уже полученные результаты — линейность gt и монотонность ht. Тогда у нас получится пример но то, что изображено на рис. 5. Ясно, что построенные графи ки двух функций пересекутся. Обозначим абсциссу точки пересе чения за T (функции определены только в целых точках, но мы их каким-то образом продлили на все числа, поэтому T не обязано быть целым). Вспомним нашу стратегию, которую мы придумали для принцессы: если на шаге t вероятность ht больше gt, то про должать независимо от претендента, если ht не превосходит gt, то останавливаться в случае, когда текущий претендент лучше всех предыдущих и продолжать в случае, когда он не является лучшим среди всех предыдущих. Если t1 — это последнее целое число перед T, то тогда стратегия, как видно из рис. 5, преображается в следу ющую: пропустить первые t1 человек, только посмотрев на них для будущего сравнения с остальными, а дальше остановиться на пер вом же, который лучше всех своих предыдущих. Теперь можно понять, какую ошибку, а вернее, неточность, мы допустили при построении графика. Сравним, например, h1 и h2. Скорее всего, t заведомо больше двух, а значит, и больше единицы. Поэтому на ша ге 1 и на шаге 2 стратегия одна и та же: нужно ждать до шага t1, а сейчас претендента-королевича пропустить. Отсюда и вероятность победы в этих случаях совершенно одинакова и совпадает с ht1.

Таким образом, заключаем, что до момента t1 функция ht оста ётся постоянной и имеет вид, примерно изображённый на рис. 6.

Для решения задачи осталось только посчитать ht, а значит, и t1, чем мы сейчас и займёмся. Делать это мы тоже будем с кон ца, причём в силу вышеприведённого замечания будем считать ht только для tt1. Как уже отмечалось, hn=0 (рис. 7). Посмотрим, ht tn-3 n-2 n-1 n Рис. ht n tn-3 n-2 n-1 n Рис. что у нас с hn-1. Это вероятность того, что принцесса получит луч шего жениха, если пропустит (n-1)-го претендента. Но это про изойдёт в единственном случае — если последний окажется лучше всех. Вероятность этого мы уже считали. Она равна (рис. 8). По n пробуем разобраться с hn-2. Здесь будет уже не столь простая вы кладка. Предположим, что принцесса пропустила претендента с но мером n-2 и дальше действует по оптимальной стратегии. Тогда возможны два варианта: (n-1)-й является лучшим среди первых n-1 претендентов (вероятность этого, как уже неоднократно отме чалось, равна и (n-1)-й не является лучшим среди первых n- вероятность этого, соответственно, равна n-.

n-1 претендентов n- В первом случае очевидно, что этого последнего нужно брать, это соответствует оптимальной стратегии (напомним, что мы догово рились вычислять ht в предположении, что tt1), причём веро n- ятность победы просто равна gn-1=. Во втором случае прин n цесса должна автоматически отказать царевичу, и тогда шансы на победу равны hn-1=. По уже обсуждавшейся формуле полной n вероятности получаем, что 1 n-1 n-2 1 (n-2)+(n-1) hn-2= · + · = n-1 n n-1 n n(n-1) (оставим пока это в таком виде, рис. 9).

Сформулировать гипотезу насчёт общего вида ht пока затруд нительно. Однако нам всё равно придётся потом сравнивать ht и gt.

ht Сделать это можно, к примеру, проследив за величиной. Если gt она больше 1, то ht больше, чем gt, если она меньше 1, то, соответ ственно, наоборот, gt больше ht. Поделив числа из таблицы рис. (n-2)+(n-1) ht n(n-1) n tn-3 n-2 n-1 n Рис. ht 1 1 + gt n-2 n-1 n- tn-3 n-2 n-1 n Рис. на числа из таблицы рис. 4, несложно получить результаты, пред ставленные на рис. 10 (проделайте это!). Закономерность, бросаю щаяся в глаза при рассмотрении этих данных, неслучайна. Давай те попробуем доказать, что t 1 ht= · 1 + +...+ n t t+1 n- (здесь мы использовали уже известный нам факт о том, что gt= t.

= Будем рассуждать по индукции с конца. База (t=n, n- n и n-2) у нас есть. Предположим, что для ht формулу мы уже получили, получим её для ht-1. Итак, пусть на шаге t-1 прин цесса пропустила претендента и перешла на шаг t. Тогда воз можны два случая: t-й претендент может оказаться лучше всех вероятность этого равна 1 и может не оказаться предыдущих t вероятность этого t-1 В первом случае вероятность.

таковым t t в итоге победить равна =gt (потому что, напомню, мы счита n ем ht для тех t, которые больше t1, а для них оптимальная стра тегия поведения принцессы заключается в том, чтобы выбирать претендента в женихи, как только он лучше всех предыдущих).

Во втором случае вероятность итоговой победы принцессы равна t 1 ht= · 1 + +...+ n t t+1 n- (эта формула нам уже <известна> по предположению индукции).

Таким образом, 1 t t-1 t 1 = ht-1= · + · + +...+ t n t n t t+1 n- 1 t-1 1 = = + + +...+ n n t t+1 n- t-1 t-1 1 = = + + +...+ n(t-1) n t t+1 n- t-1 1 1 1 = t-1 + t + t+1 +...+ n-1.

n Формула для ht доказана.

Теперь для окончательного решения задачи нужно сравнить ht и gt. Чтобы это сделать, мы некоторое время назад пытались ht сравнить величину с единицей. Как сейчас уже понятно, для gt tt1 имеет место формула ht 1 = + +...+.

gt t t+1 n- Поэтому способ нахождения t1 нами получен: нужно, постоянно уменьшая t, складывать, начиная с t=n-1, пока сумма не ста t нет больше 1;

то самое t, при котором это произойдёт, и есть t (а при каком-то t это заведомо произойдёт, если конечно у нас не крайний случай и n не равно 1, впрочем, в этом случае у прин 1 цессы нет никаких проблем). Например, если n=5, то + <1, 4 1 1 а + + >1, т. е. стратегия такая: первого пропустить, второ 4 3 го пропустить, а дальше, начиная с третьего, брать в мужья пер вого попавшегося, который лучше всех предыдущих. Такой способ в принципе всегда может привести к ответу, но всё же хотелось бы ещё упростить его, тем более что, как сейчас окажется, это дей ствительно возможно. Попробуем посчитать сумму, которая у нас ht записана в правой части формулы для. При этом сразу необ gt ходимо оговориться, что сумму эту мы будем считать лишь при ближённо, а для этого требуется предположить, что и t, и n —до статочно большие числа (в оригинале задача была сформулирова на для большого n=1000, а из предыдущих рассуждений следует, что t1 — также большое, поэтому наше предположение оправдано).

1 1 Итак, будем считать сумму S= + +...+. Для нача t t+1 n- ла сделаем следующее. Нарисуем график функции y=. Отметим x на нём точки с абсциссами t, t+1, t+2,..., n. А дальше б удем рисовать прямоугольники. Первый расположен между t и t+1, причём его основание лежит на оси Ox, а высота равна. Второй t расположен аналогичным образом между t+1 и t+2, а его вы сота равна. Аналогично третий, четвёртый, и т. д., послед t+ ний будет расположен между n-1 и n (рис. 11). Прямоугольников будет много, потому что, как мы помним, t и n — большие числа.

y y y= x y= x x x O tn O Рис. 11 Рис. Заметим следующее: площадь изображённой фигуры, являю щейся объединением всех прямоугольников, в точности равна сум ме S, которую нам нужно посчитать.

Теперь будем делать совсем странные вещи. Нарисуем опять отдельно график функции y= (рис. 12). Сделаем с ним такую x операцию: сожмём его вдоль оси Ox в 10 раз. Что это значит?

А просто приблизим каждую точку графика к оси Oy на расстоя ние, в 10 раз меньшее того, на котором она находится от этой оси сейчас (точка при этом будет двигаться вдоль оси Ox, поэтому та кое преобразование и называется сжатием). График станет узень ким, прижимающимся к осям координат (рис. 13). Теперь растя нем получившийся график вдоль оси Oy в 10 раз, т. е. удалим каждую точку графика от оси Ox на расстояние, в 10 раз большее того, на котором она находится от этой оси сейчас (рис. 14). Спра шивается, что же у нас получилось? Оказывается, что после этих y y а) а) сжатие в 10 раз x x O O y y б) б) x x O O Рис. 13 Рис. а в р з растяжение двух преобразований график функции y= переходит сам в себя, x т. е. в график функции y=. Действительно, после первого пре x x, образования точка графика с координатами переходит в точ x x, а уже эта точка после второго преобра ку с координатами 10, x x, зования переходит в точку, которая лежит на исходном 10 x графике. (На самом деле мы лишь проверили, что точки исходно го графика переходят в какие-то другие точки исходного графи ка, но мы не проверили, что каждая точка графика является обра зом какой-то точки, т. е. что в каждую точку графика перешла какая-то другая. Однако важно только понимать, что эта провер ка необходима, так как проделать её можно абсолютно аналогично той, которую мы провели.) Добавим к исходному графику фигуру из прямоугольников (см. рис. 11) и проделаем те же операции. Что произойдёт с графи ком, мы уже знаем. Перейдёт в себя. А вот что произойдёт с фи гурой? Понятно, что она как-то будет сжиматься и растягиваться, поэтому форму не сохранит. Но зато можно смело утверждать, что её площадь (как раз то, что нас интересует) не изменится. Действи тельно, возьмём один какой-нибудь прямоугольник из этой фигу ры. Сначала первым преобразованием мы его площадь уменьша ем в 10 раз, а потом вторым увеличиваем в 10 раз, т. е. она ста новится такой же, как и была. Значит, и площадь всей фигуры не меняется.

Для чего же нам всё это было надо? Вот для чего. Сделаем опять те же операции с картинкой на рис. 11, но только сжи мать и растягивать будем не в 10, а в t раз. Посмотрим, что по лучится. Если раньше мы изображали график с непонятными мас штабами по осям, потому что, с одной стороны, t — очень боль шое, — очень маленькое, и адекватно их изобразить сложно, t а с другой стороны, хочется иметь хоть сколько-нибудь наглядную картинку, то теперь можно спокойно объявить масштабы по осям t, равными, так как точка с координатами переходит в точ t ку с координатами (1, 1). Все прямоугольники теперь очень узень кие, ширины (потому что t — большое), расположены они от t n до (рис. 15). Из-за того, что все прямоугольники такие узень t кие, та часть фигуры, которая расположена над гиперболой (гра y y 1 y= y= x x 1 S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) S(x) n x x O O 1 1 x t Рис. 15 Рис., фиком функции y= имеет очень маленькую площадь, поэтому x площадь фигуры, равная нашей сумме S, практически в точности n равна площади под гиперболой от 1 до. Введём обозначение: бу t дем обозначать через S(x) площадь криволинейной трапеции, огра ниченной гиперболой, от 1 до x (рис. 16). Таким образом, имеем:

n.

SS Наша задача, напомню, заключается в том, чтобы найти t первое такое t, что сумма S для него больше 1. Это, как только что стало понятно, равносильно задаче о решении уравнения S(x)=1.

Для решения этого уравнения попробуем сначала выяснить некоторые свойства функции S(x). Первое очевидное свойство за ключается в том, что S(1)=0. Действительно, при x=1 криво линейная трапеция вырождается в отрезок, а его площадь — ноль. Второе свойство: при x>1 выполняется неравенство S(x)>0.

Третье свойство заключается в том, что функция S(x) монотонно возрастает. Четвёртое свойство ключевое: утверждается, что для любых x, y>1 имеет место равенство S(xy)=S(x)+S(y). Для дока зательства сначала изобразим, что эта формула означает. Нарисуем в который раз уже график функции y=, отметим на нём точки x с абсциссами 1, x, y и xy (рис. 17). Заметим, что площадь криволи нейной трапеции от x до xy в точ y ности равна S(xy)-S(x) (по опре y= делению функции S(x)). Теперь x сделаем такое преобразование всей картинки: сначала сожмём её вдоль оси Ox в x раз, а потом растянем вдоль оси Oy в x раз.

Как мы помним, при таком пре x O 1 x y xy образовании график перейдёт сам в себя. Кроме того, точка Рис. x, с координатами перейдёт в точку с координатами (1, 1), x xy, 1 y,.

а точка с координатами — в точку с координатами xy y Значит, криволинейная трапеция под гиперболой от x до xy пе рейдёт в криволинейную трапецию от 1 до y. При этом, как мы помним, площадь при проведённом нами преобразовании сохра няется, отсюда имеем равенство S(xy)-S(x)=S(y), что и требова лось. (Внимательный читатель помнит, что мы доказали инвари антность, т. е. неизменность, площади при таких преобразованиях только для прямоугольника. Доказательство для криволинейных фигур несколько сложнее и упирается непосредственно в определе ние площади, однако всё-таки факт остаётся верным и для криво линейной фигуры, если её площадь может быть сколь угодно точ но приближена суммарной площадью каких-нибудь покрывающих эту фигуру прямоугольников.) Такие свойства напоминают свойства одной из функций, хоро шо известных по школьной программе. Что же это за функция?

Логарифмическая! Сейчас мы это докажем.

В школе до логарифмической изучается сначала показательная функция, являющаяся обратной к логарифмической. Давайте запи шем свойство обратной к S(x) функции, которую обозначим за F(x), получающееся из уже известного четвёртого свойства самой S(x):

F(x+y)=F(x)·F(y). Отсюда тут же получаем, что F(x) — пока зательная. Действительно, пусть F(1)=a. Тогда F(2)=a2, F(3)= =a3, F 2 = a=a1/2, и т. д., для всех рациональных x имеем:

F(x)=ax. Поскольку F(x) монотонна (что следует из соответствую щего свойства функции S(x)), равенство F(x) и ax имеет место для всех действительных чисел, откуда и получаем, что F(x)=ax для всех x (доказательство, как видно, не совсем y полное, предоставляем читателю возможность y=F(x) a провести полное и строгое доказательство са мостоятельно). Эти рассуждения удобно вос принимать, имея перед собой картинку. Изо бразим графики функций S(x) иF(x) (рис. 18).

Кстати, легко доказать ещё одно интересное свойство S(x), не имеющее, правда, непосред a ственного отношения к излагаемому матери y=S(x) алу. А именно, можно доказать (и это вид a1/ но из рисунка), что функция S(x) бесконечно возрастает, т. е. принимает сколь угодно боль x O 1 1 2 шие значения. Действительно, если S(2)=c, то S(4)=2c, S(8)=3c, и вообще, S (2n)=n·c.

Рис. 18 Поэтому S(x) неограниченно возрастает. От y y y а) б) в) x x x O O O 1 2 1 2 2,5 1 2 Рис. сюда мы получили интересный факт: площадь под гиперболой от и до бесконечности сама бесконечна, что вообще говоря, не следу ет только из того, что эта фигура неограничена и бесконечно уда ляется вдоль оси Ox;

существуют бесконечные фигуры с конечной площадью.

Итак, мы доказали, что F(x)=ax. Отсюда получаем, что обрат ная к ней функция S(x)=loga(x). Что такое a? Это F(1), т. е. чи сло, для которого функция S(x) (обратная к F(x)) равна 1. Значит, S(a)=1, т. е. a — то самое число, найти которое мы условились ещё в самом начале поиска суммы S. Оно нам нужно было, что бы знать, когда принцессе делать свой выбор. Попробуем это чи сло оценить.

Для оценки числа a нужно пытаться оценивать различные пло щади под графиком y=. Посмотрим, например, на площадь кри x волинейной трапеции под этим графиком от 1 до 2, которая изобра жена на рис. 19, а. Её площадь строго меньше площади квадрата, изображённого на том же рисунке, а площадь квадрата — едини ца. Значит, S(2)<1 и поэтому a>2. Попробуем сравнить a и 2,5.

Для этого оценим площадь S(2,5), изображённую на рис. 19, б. Эта площадь строго ограничена сверху суммарной площадью трапеции и квадрата, изображённых на том же рисунке, а их площадь равна 3 + =1, значит, S(2,5)<1 и a>2,5. Попробуем оценить a свер 4 ху. Это несколько сложнее, потому что теперь нужно приближать площадь фигурами, которые содержатся в криволинейной трапе ции, а не содержат её. Из рис. 19, в видно, что 1 1 1 1 1 1 1 1 1 1 1 S(3)> + + + + + + + > + + + + 12 11 10 9 8 7 6 5 12 10 10 1 1 1 1 70+252+105+120+140+168 + + + + = = >1, 8 7 6 5 840 поэтому a<3. Таким образом, мы только что установили, что a — некоторое число из отрезка [2,5;

3]. Догадливые уже давно p поняли, что на самом деле чи сло a — не что иное, как из gt вестное из школьного курса ht или из курса математического анализа число e, равное при e мерно 2,718281828...

n Таким образом, стало по t ·n e ht нятно, когда =1 (в реаль Рис. 20 gt ности этого, как мы помним, скорее всего не случится, так как t целое, поэтому будет лишь ht n t 1. Это происходит, когда =e или =. Вспомним наш ри gt t n e сунок, на котором были изображены графики функций ht и gt (рис. 20).

Как мы только что выяснили, то число, которое соответствует n точке пересечения на графике, равно t=. При этом e t ht=gt= =, n e т. е. вероятность успеха принцессы, которую мы искали с само го начала, равна 0,368. Таким образом, ответ на поставленную e вначале задачу выглядит так: принцесса должна сначала пропу стить первую часть женихов (в случае n=1000 это примерно e человек), только запоминая их для будущего сравнения, а дальше она должна брать в мужья первого же, который обладает тем свой ством, что он лучше всех своих предшественников. При этом веро ятность получить в конце концов самого лучшего жениха из всех n претендентов равна примерно 0,368.

* * * Как уже говорилось выше, здесь был рассказан метод решения задачи, отличный от первоначального, придуманного Е. Б. Дынки ным. Этот метод довольно легко обобщается на ряд близких задач.

Например, можно предположить, что принцесса не настолько при вередлива, чтобы требовать только самого лучшего жениха, а её устроит и второй по качеству или, например, один из трёх луч ших. В более общем случае она ставит своей целью выбор одного из m лучших женихов (m — фиксированное заранее число), при этом какой именно из этих m женихов ей достанется — безраз лично. (Задача, которую мы подробно рассмотрели, соответствует m=1.) Ещё более общей постановкой (чуть более сложно формулиру емой) является следующая. Принцесса заранее решает, насколько счастлива (удовлетворена) она будет, если ей достанется k-й по ка честву среди всех женихов. При этом уровень её удовлетворения может измеряться в баллах или в условных единицах (не путать с у. е. в магазинах). Естественно предполагать, что уровень сча стья тем выше, чем лучше жених (в смысле его рейтинга в об щем смысле). Так, принцесса может решить, что если ей достанет ся самый лучший жених, она будет счастлива на 1000 баллов, ес ли второй по качеству — на 500, третий — на 330 и т. п. Опти мальной в этом случае является стратегия принцессы, при кото рой в среднем количество полученных ей баллов было бы макси мально возможным. Некоторую сложность здесь составляет объяс нить, что значит <в среднем>. В теории вероятностей понятие сред него (или, как его ещё называют, математического ожидания) определяется через понятие вероятности. Мы здесь не обсужда ли определение вероятности, предпочитая использовать некоторые её свойства, объясняемые <на пальцах>. Поэтому определять по нятие среднего, описывать его свойства и обсуждать сколь-нибудь подробно последнюю постановку задачи представляется несколько затруднительным. (Впрочем, в описанной ситуации средний балл равен сумме n bipi, i= где pi — вероятность того, что выбранный жених окажется i-м по качеству среди всех претендентов, а bi — количество баллов <зарабатываемых> в этом случае.) Поэтому ограничимся случаем, когда принцесса хочет полу чить одного из m лучших женихов, неважно какого. Схема, опи санная выше, будет работать следующим образом. Если принцес са дождалась последнего — n-го претендента, её стратегия оче видна. Если он оказался одним из m лучших, она его выбирает и она выиграла. Если нет, она проиграла (и отправляется в мо настырь). Предположим, что мы уже разобрались как должна ве сти себя принцесса, если она не сделала выбора до t-го претенден та включительно. Пусть перед ней предстал t-й претендент. Обо значим через ht вероятность того, что принцесса сделает удачный выбор, если она откажет t-му претенденту, а дальше будет поль зоваться оптимальной стратегией (мы предположили, что эта стра тегия уже известна). Вероятность ht, конечно, не зависит от того, какой по рангу среди предшествующих был t-й претендент: пер вый, последний,... А вот вероятность того, что принцесса вы играет, остановив свой выбор как раз на t-м претенденте, от этого зависит. Если он был хуже, чем m-й (по качеству) среди уже про шедших, никаких шансов, что принцесса выиграет, выбрав его, нет. Если он лучший среди первых t, то вероятность сделать удачный выбор, остановившись на нём, по-видимому, выше, чем если он второй (по качеству) среди них. Обозначим через gt(k) вероятность удачи, если принцесса остановит свой выбор на t-м претенденте при условии, что он является k-м по качеству среди первых t. Здесь k может быть любым (целым) числом от 1 до t, од нако, очевидно, что если k>m, то gt(k)=0. Мы знаем (см. выше), что gn(k)=1 при km и gn(k)=0 при k>m.

Одна из стратегий принцессы, отвергнувшей t-го претенден та (возможно, и даже вероятно, не оптимальной), является от каз (t+1)-му претенденту в любом случае. Отсюда следует, что вероятность ht (которая равна вероятности удачного выбора при оптимальном поведении принцессы после того, как был отвергнут t-й претендент), по крайней мере не меньше, чем вероятность ht+ (вероятность удачного выбора, если и (t+1)-й претендент отверг нут): htht+1.

Попробуем разобраться как ведёт себя вероятность gt(k) как функция от t и k. Более-менее очевидно следующее. Во-первых, при фиксированном t вероятность gt(k) не возрастает с ростом k, т. е. она тем больше (или, точнее, не меньше), чем меньше k.

Во-вторых, при фиксированном k вероятность gt(k) не убывает с ростом t: при выборе из 1000 претендентов лучше остановиться на третьем по качеству среди прошедших, если таковым оказал ся 990-й, чем если таковым оказался 10-й (здесь, конечно, пред полагается, что m3). Строго эти свойства могут быть выведены из равенств (*) и (**) ниже.

Если мы (или, точнее, принцесса) уже знаем ht и gt(k), то, как это нетрудно понять из рассуждения, приведённого выше для m=1, оптимальная стратегия выглядит следующим образом. Пред положим, что перед принцессой предстал t-й претендент на её ру ку (предыдущих t-1 она отвергла) и он оказался k-м по каче ству среди первых t. Тогда принцесса сравнивает вероятности ht и gt(k). Если вероятность ht оказалась больше, то она претендента отвергает. Если больше оказалась вероятность gt(k), она даёт ему своё согласие. (Если случайно оказалось, что вероятности ht и gt(k) в точности равны, то она может поступить любым образом. Выше в подобной ситуации мы предлагали принцессе не тянуть время, а принять предложение претендента.) Вероятность успеха принцес сы в этом случае оказывается равной max(ht, gt(k)) (наибольшему из двух указанных чисел). Кстати, нетрудно сообразить, что ис ходная вероятность успеха принцессы (до начала смотрин) может быть вычислена как h0.

Из описанных выше свойств монотонности вероятностей ht и gt(k) как функций от t и k (невозрастание ht с ростомt, неуб ыва ние gt(k) с ростом t и её невозрастание с ростом k) вытекает следу ющее общее описание оптимальной стратегии. Существуют неотри цательные (целые) числа t1t2...tm

Претендента с номером от t2+1 до t3 она выбирает, если он не ху же чем второй по качеству среди всех прошедших (включая его самого), и т. д. Претендента с номером больше tm она выбирает, если он оказывается одним из m лучших среди прошедших. Если претендент, удовлетворяющий описанным свойствам, не встретит ся, то принцесса проиграла.

Возникает естественный вопрос: как могут быть найдены ве роятности ht и gt(k)? Их, как и раньше, можно вычислить по следовательно (начиная с конца!). Очевидно, что hn=0, gn(k) рав но единице при km, и нулю при k>m. Предположим, что мы уже знаем (вычислили) вероятности ht+1 и gt+1(k) для всех k. Вы числим ht. (В этом месте можно даже допустить, что t=0. В ре зультате мы получим вероятность h0, которая равна абсолютной вероятности успеха принцессы на момент начала смотрин.) Если принцесса пропустила t-го претендента, перед её глазами пред стаёт (t+1)-й. Он может быть лучшим среди всех предыдущих (включая, естественно, его самого), либ о вторым по качеству, либ о третьим, и т. д., вплоть до (t+1)-го. Легко сообразить, что веро ятность каждого из этих случаев одна и та же и равна. Если t+ (t+1)-й претендент оказался k-м по качеству, вероятность успеха принцессы при оптимальной стратегии выбора равна, как мы зна ем, max(ht+1, gt+1(k)). Таким образом, с вероятностью вероят t+ ность успеха равна max(ht+1, gt+1(1)), с той же вероятностью она равна max(ht+1, gt+1(2)), и т. д. Применяя обсуждавшуюся выше формулу полной вероятности, получаем, что t+ ht= max(ht+1, gt+1(k))= t+ k= m 1 t+1-m = max(ht+1, gt+1(k))+ ht+1 (*) t+1 t+ k= (последнее равенство имеет место, поскольку при k>m заведомо gt+1(k)=0 и, значит, max(ht+1, gt+1(k))=ht+1).

Обсудим теперь вычисление вероятностей gt(k). Предположим, что принцесса решила остановить свой выбор на претенденте с но мером t, который оказался k-м по качеству среди предыдущих (включая его самого). Чтобы вычислить вероятность её успеха, представим себе, что (уже сделав свой выбор) принцесса решила (любопытства ради) посмотреть и на (t+1)-го претендента. С ве роятностью этот претендент оказался бы самым лучшим t+ из прошедших, с вероятностью — вторым, и т. д. В списке t+ из первых t+1 претендентов избранник принцессы (предложение которого она уже приняла на предыдущем шаге) может либо сохра нить свои позиции и остаться k-м по качеству, либо уступить одну позицию в рейтинге и оказаться (k+1)-м. Легко видеть, что веро ятность второго исхода (избранник теряет свои позиции и оказы k вается (k+1)-м в списке из t+1 претендентов) равна (это — t+ вероятность того, что (t+1)-й претендент окажется не хуже чем k-м по качеству), а вероятность первого исхода (избранник сохра t-k+ няет свои позиции) равна. Нетрудно сообразить, что при t+ первом исходе вероятность успеха принцессы оказывается равной gt+1(k), а при втором — gt+1(k+1). Применяя всё ту же формулу полной вероятности, получаем k gt(k)= gt+1(k+1)+t-k+1 gt+1(k). (**) t+1 t+ Формулы (*) и (**) позволяют последовательно, начиная с кон ца, т. е. с t=n, вычислить вероятности ht и gt(k) и, таким об ра зом, найти оптимальную стратегию принцессы. Для небольших n это можно сделать, например, заполняя таблицу вроде той, кото рая приведена на рис. 21 для n=9, m=2.

Из таблицы и графика, изображённого на рис. 22, можно увидеть, что в указанном случае t1=3, t2=6, т. е. оптимальная стратегия принцессы состоит в том, чтобы отвергнуть первых трёх претендентов в любом случае, остановить свой выбор на четвёртом, пятом или шестом, если он окажется лучше всех предыдущих, а далее (т. е. при знакомстве с претендентами, начиная с седьмого) соглашаться и на второго по качеству среди прошедших. При этом вероятность удачного выбора (h0) оказывается равной 0,65.

k 2 5 7 13 5 11 1 1 9 12 12 18 6 12 gt(k):

1 1 1 5 5 7 2 0 36 12 6 18 12 12 233 233 233 233 28 41 1 7 ht : 360 360 360 360 45 72 2 18 t: 0 1 2 3 4 5 6 7 8 Рис. Мы выяснили, что при m=1 при большом количестве претен t дентов n отношение почти постоянно (т. е. почти не зависит n от n) и приблизительно равно. Более точно можно сказать, что e t отношение стремится к при n стремящемся к бесконечности n e (n). Оказывается, подобное свойство имеет место для любого ti фиксированного m: для любого i (i=1,..., m) отношение име n ет предел при n. При этом и вероятность удачного выбора при оптимальной стратегии имеет некоторый предел при n. Так, t2 t при m=2 отношение стремится к, а отношение стремится n 3 n к (меньшему) корню x0 уравнения x-ln x=1+ln.

ht gt(1) gt(2) t 03 4 6 7 Рис. Величина x0 приблизительно равна 0,347. Таким образом, при большом количестве претендентов n и при m=2 оптимальная стра тегия принцессы состоит в следующем. Она должна пропустить приблизительно 34,7% претендентов, не давая согласия на брак, из следующих приблизительно 32% (вплоть до 66,7% всех пре тендентов) давать согласие на брак только тому, кто лучше всех предыдущих, а из оставшихся 33,3% претендентов соглашаться и на второго по качеству среди уже прошедших. При этом вероят ность удачного выбора (опять-таки при большом n, т. е. при n) оказывается равной 2x0-x2, что приблизительно равно 0,574. Та ким образом, в этом случае шансы принцессы на удачный выбор (при оптимальной стратегии) больше 50%.




© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.