WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

Pages:     | 1 || 3 |

«Серия КЛАССИЧЕСКИЙ УНИВЕРСИТЕТСКИЙ УЧЕБНИК основана в 2002 году по инициативе ректора МГУ им. М.В. Ломоносова академика РАН В.А. Садовничего и посвяшена 250-летию Московского университета ...»

-- [ Страница 2 ] --

Компьютерная имитация (computer simulation). С появлением современных вычислительных средств уровень сложности матема тических моделей, при помощи которых можно делать правильные предсказания о динамике процессов, существенно вырос. Появились модели, способные создавать "иллюзию реальности". Называемые эти модели являются как бы промежуточным зве ном между реальностью и обычными математическими моделями.

Имитационные модели находятся как бы на пределе возможностей вычислительной техники (и системного программирования).

Замечание. Всегда существуют процессы настолько сложные, что они не поддаются изучению математическими методами. Это не ГЛАВА 10. МЕТОДЫ ПРОГНОЗИРОВАНИЯ означает, однако, что они непознаваемы. Просто их рассматривают гуманитарными методами и средствами искусства — столь же не обходимыми методами изучения реальности, как и математические методы. А подвижная граница между гуманитарными и математиче скими методами изучения (в том числе и прогнозирования) реально сти проходит как раз по имитационными моделям в том понимании этого термина, о котором идет речь здесь.

10.3. Качественные методы прогнозирования При отсутствии количественных данных, или когда количественная модель получается слишком дорогой, используются качественные методы прогнозирования (рис. 13), которые строятся на основе раз ного рода экспертных оценок.

Рис. Дельфийский метод (Delphi method), или метод экспертных оце представляет собой процедуру, позволяющую приходить к со гласию группе экспертов из самых разных, но взаимосвязанных об А ЧЕСТВЕННЫЕ МЕТОДЫ ПРОГНОЗИРОВАНИЯ ластей. Работа над составлением прогноза этим методом организу ется так: каждому эксперту независимо рассылается вопросник по поводу рассматриваемой проблемы, ответы экспертов и их мнения кладутся в основу подготовки следующего вопросника, рассы лаемого экспертам, и так далее до тех пор, пока эксперты не прихо дят к согласию (при условии запрета на открытые дискуссии между экспертами). Обычно эта рассылка повторяется раза.

Изучение рынка (market research), или модель ожидания потре бителя. Прогноз строится на основании разнообразных опросов по требителей и последующей статистической обработки.

Метод консенсуса (panel consensus), или мнение жюри, заключа ется в соединении и усреднении мнений группы экспертов в процессе "мозгового штурма".

Совокупное мнение сбытовиков (grass-roots forecasting). Метод опирается на мнение непосредственно контактирующих с потребите лем торговых агентов.

Историческая аналогия (historical analogy) обычно используется в тех случаях, когда нужно дать прогноз продажи товара, по сво им характеристикам близкого к выпущенному ранее (например, его модификации).

Сравнительные характеристики этих пяти методов приведены на рис. 14 и 15.

Рис.

ГЛАВА 10. МЕТОДЫ ПРОГНОЗИРОВАНИЯ Краткосрочный Среднесрочный Долгосрочный Рис. Пояснение к рисункам. На рис. 14а указано среднее время (в ме сяцах), требуемое для составления прогноза. На рис. 145 приведена средняя цена (в тыс. долл.) составления прогноза. На рис. 15 указа на точность прогнозов в зависимости от сроков предсказания.

Обозначения:

d — Delphi method, m — market research, p — panel consensus, g — grass-roots forecasting, h — historical analogy;

пл. — плохая, ср. — средняя, х. — хорошая, от. — отличная, пр. — превосходная.

Часть II СТОХАСТИЧЕСКИЕ МЕТОДЫ Глава СЛУЧАЙНЫЕ СОБЫТИЯ И ВЕРОЯТНОСТИ 11.1. О стохастическом моделировании Стохастические (вероятностные) модели широко применяются в тех случаях, когда те или иные факторы носят неопределенный харак тер. Такие ситуации характерны для самых разных областей чело веческой деятельности. Примерами могут служить погодные усло вия через несколько лет, спрос на какую-либо продукцию, полити ческая ситуация в данной стране и т. п. Для лучшего понимания рассматриваемых методов полезно иметь в виду, что неопределен ность может иметь довольно разный характер. При этом логические рассуждения не создают информацию из ничего, а структурируют уже имеющуюся. В этой главе мы изучим основы методики анализа неопределенности.

11.2. Различные подходы к понятию вероятности Понятие случайного события является основополагающим в изуче нии вероятностных методов и моделей. Под случайным будем по нимать событие, которое может произойти или не произойти в ре зультате некоторого испытания. При этом испытанием может быть как целенаправленное действие, так и явление, происходящее неза висимо от наблюдателя. В дальнейшем случайные события будем называть просто событиями.

ГЛАВА 11. СЛУЧАЙНЫЕ СОБЫТИЯ И ВЕРОЯТНОСТИ Приведем несколько примеров.

Пример 1. Испытание — бросание монеты. Возможные собы тия — выпадание герба или цифры.

Пример 2. Наступает день 12 января — испытание. "В течение дня наблюдается ясная погода" — событие.

Пример 3. Студент сдает экзамен — испытание. "Он получил оценку 5" — событие.

Каждому событию может быть поставлено в соответствие число, принадлежащее отрезку и называемое вероятностью данного события. Вероятность можно понимать как меру достоверности (в том числе и субъективной) данного события. В таком смысле сло во "вероятность" употребляется и в бытовой речи, где, однако, ее обычно "измеряют" в процентах — от 0 до 100%. Вероятность обыч но обозначают буквой р (от англ. probability — вероятность). Чем более достоверным представляется наступление события, тем боль ше его вероятность. Вероятность невозможного события считается равной нулю, вероятность абсолютно достоверного события — еди нице.

Для определения вероятностей событий возможны различные Начнем с рассмотрения ситуации, когда в результате испытания может произойти один из некоторого конечного множества равновоз исходов (пространства исходов). Если общее число исходов (или, иначе говоря, элементарных событий) равно п, то каждому из них приписывается вероятность Рис. • • Пример Бросается игральный кубик, на грани которого на несено разное число точек — от 1 до 6 включительно (рис. 1). Тог да исходов будет шесть: "выпало число 1", "выпало число 2",..., 11.2. РАЗЛИЧНЫЕ ПОДХОДЫ К ПОНЯТИЮ ВЕРОЯТНОСТИ "выпало число 6". Коротко пространство исходов можно записать следующим образом:

{1,2,3,4,5,6}.

Вероятность выпадания каждого из этих чисел равна 1/6 (как гово рят, "один шанс из шести").

Событием можно считать любое подмножество пространства ис ходов, и, наоборот, любое событие является подмножеством про странства исходов. Будем говорить, что событие А произошло, если результат (исход) испытания принадлежит множеству А. (Здесь и далее события будем обозначать, как правило, прописными латин скими буквами). Продолжая пример 4, можно заметить, что собы тию = "выпало четное число очков" соответствует подмножество {2, 4, 6} пространства исходов, а событию = "выпало число оч ков, большее двух" соответствует подмножество {3, 4, 5, 6}.

Посмотрим теперь на ситуацию с более общей точки зрения.

Классическая вероятность Пусть п — число всех равновозможных исходов, — число исхо дов, составляющих событие А. Вероятность события А (обозначение р{А)) определяется следующим образом:

= -.

Это так называемая классическая вероятность. В частности, для упомянутых выше событий и имеем:

Подчеркнем, что формула классической вероятности предполага ет конечность числа исходов п. Обратимся теперь к случаю, когда число исходов бесконечно.

Геометрическая вероятность Пусть на плоскости имеется фигура содержащая фигуру / (рис. 2). Испытание заключается в том, что в фигуру F наугад бро сается точка. Тем самым пространство исходов можно отождествить с этой фигурой. Здесь число исходов бесконечно (у фигуры F бес конечно много точек), притом все исходы имеют одинаковые шансы ГЛАВА 11. СЛУЧАЙНЫЕ СОБЫТИЯ И ВЕРОЯТНОСТИ осуществиться. Определим А как событие, заключающееся в том, что брошенная точка попала в фигуру /. Тогда вероятность собы тия А вероятность) определяется следующим об разом:

где И — площади фигур F и / соответственно.

Рис. Аналогично определяется геометрическая вероятность на прямой и в пространстве, только вместо площадей фигур в формуле для ве роятности надо поставить соответственно длины и объемы.

Пример 5. В результате урагана был оборван телефонный ка бель между 20-м и 60-м километрами линии. Какова вероятность того, что обрыв произошел между 30-м и 35-м километрами?

Здесь = 20 = 40, а = 30 = 5. Значит, р = 5/40 = 1/8.

Статистическая Предположим, что событие А может произойти либо не произойти в результате некоторого эксперимента. Повторим эксперимент п раз и подсчитаем, сколько раз произошло событие А. Пусть это число равно Отношение т/п назовем относительной появ ления события А в п испытаниях. Если при достаточно больших значениях п относительные частоты группируются около некоторой постоянной, то эту постоянную будем считать статистической ве роятностью события — при больших п.

п 11.3. ФОРМУЛЫ А ЛГЕБРЫ СОБЫТИЙ Пример 6. Если подбросить монету п раз и подсчитать число т выпадений герба, то при достаточно большом п отношение т/п будет близко к 0,5 (если монета симметричная — не гнутая, не смещен центр тяжести и пр.).

Субъективная вероятность Во многих реальных ситуациях определение вероятности событий одним из приведенных выше способов невозможно. Тогда на пер вый план выступает отмеченное выше понимание вероятности как меры достоверности того или иного события. В этом случае следует провести экспертный опрос и на основе его результатов получить субъективную вероятность события.

Пример 7. Какова вероятность того, что некто станет президен том на ближайших выборах? Ясно, что здесь может идти речь о ве роятности только в субъективном смысле.

Замечание. С принятием некоторого числа в качестве субъектив ной вероятности связаны два достаточно независимых действия. Во первых, требуется правильно провести опрос и, во-вторых, надо пра вильно учесть уже высказанное мнение экспертов. При этом возни кает ряд психологических и математических проблем. Их обсужде ние, однако, выходит за рамки этой книги.

11.3. Формулы алгебры событии.

Несовместимые и независимые события Если определены вероятности элементарных событий, можно пере ходить к вычислению вероятностей более сложных событий, являю щихся комбинацией определенных ранее элементарных.

Предположим, что с некоторым испытанием связаны события А и В. Назовем их суммой событие, заключающееся в том, что произо шло хотя бы одно из событий — или или В (обозначение: А + В).

Пример 8. Пусть А = "это случилось в сентябре...", В "это случилось в октябре...", С = "это случилось в ноябре...". Тогда + В + С) = "это случилось осенью...".

Произведением событий А В назовем событие, состоящее в со вместном наступлении этих событий (обозначение: АВ).

ГЛАВА 11. СЛУЧАЙНЫЕ СОБЫТИЯ И ВЕРОЯТНОСТИ Пример 9. Пусть А — аудиторию вошел студент", В = ау диторию вошел человек в темных очках". Тогда АВ — аудиторию вошел студент в темных очках".

Событием, противоположным А, назовем событие, состоящее в том, что А не произошло (обозначение: Л, "не Пример 10. Пусть испытанием является бросок баскетболиста по кольцу, А = "баскетболист попал". Тогда — "баскетболист не попал".

Рис.

Рис. 3 Рис. Введенные понятия допускают простую геометрическую интер претацию. Пусть испытанием является бросание точки в область на плоскости, а событиями Л, В, С и D — попадание точки в области, которые мы обозначим теми же буквами — А, В, С и D соответст венно. Тогда сумма событий А и В — область, заштрихованная на рис. 3, сумма + D — на рис. 4. Произведение АВ иллюстрируется на рис. 5, произведение CD — на рис. 6, событие, противоположное А, — на рис. 7. Заметим, что произведение CD является невозмож ным событием, CD = 0.

Перейдем теперь к вычислению вероятностей событий А + В, АВ и считая известными вероятности событий А и В.

11.3. ФОРМУЛЫ АЛГЕБРЫ СОБЫТИЙ Вероятность события А вычисляется легко:

Для вероятности события А + В справедлива следующая фор мула:

+ (1) В это соотношение входит пока неизвестная нам вероятность про изведения АВ. Впрочем, часто слагаемое р(АВ) оказывается рав ным 0. Рассмотрим эту ситуацию подробнее.

Если события А и В не могут произойти одновременно в резуль тате одного испытания (иными словами, если АВ — невозможное со бытие), то их называют несовместимыми, и тогда р(АВ) = 0. Если же события могут произойти в результате одного испытания, то их называют совместимыми.

Пример События А несовместимы.

Пример 12. События А и В на рис. 3, 5 совместимы.

Пример 13. События рис. 4, 6 несовместимы.

Для случая несовместимых событий формула (1) приобретает особенно простой вид:

(2) Для отыскания вероятности произведения событий необходимо ввести еще одно ключевое понятие.

При совместном рассмотрении двух случайных событий часто возникает вопрос: насколько наступление одного из них влияет на возможность наступления другого? Простейший вид связи — при чинный. Однако бывает, что хотя причинной связи нет, но некоторая зависимость все же присутствует.

Рассмотрим испытание, состоящее в однократном бросании игрального кубика. Пусть событие А = "выпало четное число оч ков", событие В — "выпало число очков, большее трех". Неверно утверждать, что одно из событий с неизбежностью влечет за со бой другое. Но некоторая зависимость имеется. Действительно, про странство исходов составляют шесть чисел: {1, 2, 3, 4, 5, 6}. Со бытие А составляют исходы {2, 4, 6}, его вероятность равна 1/2.

Событие В составляют исходы 5, 6}. Из этих трех исходов ровно два (исходы 4 и 6) входят в событие А. Таким образом, если событие В произошло, то вероятность события А равна 2/3 (рис. 8).

ГЛАВА 11. СЛУЧАЙНЫЕ СОБЫТИЯ И ВЕРОЯТНОСТИ Рис. Такая вероятность, называемая условной, обозначается "вероятность А при условии (считаем, что р(В) 0). В случае р{А\В) = 2/3.

Вообще, если наступление события В изменяет вероятность со бытия А, то такие события называются зависимыми. Если же на ступление одного события никак не влияет на шансы наступления другого, то такие события называются независимыми.

Для любых событий А и В (как независимых, так и зависимых) справедлива следующая формула:

(3) Если события А и В независимы (при этом р(А\В) = р(А) и — то формула (3) упрощается:

(4) Справедливо и обратное: если выполняется равенство (4), то собы тия А и В независимы.

Пример Рассмотрим еще одно событие, связанное с броса нием кубика: С — {1,2,3,4}. Нетрудно проверить (например, вос пользовавшись формулой (4)), что события С являются незави симыми, а события В С — зависимыми.

Замечание. Обычно, однако, вопрос о том, являются ли данные со бытия независимыми (и тогда можно применить формулу (4)), ре шается на основании здравого смысла.

Понятия несовместимости и независимости можно обобщить на случай более чем двух событий.

События называются попарно несовместимыми, если появление в результате испытания одного из них исключает возмож ность появления любого другого (рис. 9). В этом случае справедливо 11.3. ФОРМУЛЫ АЛГЕБРЫ СОБЫТИЙ Рис. (5) События называются независимыми в совокупности, если вероятность любого из них 1 п, не меняется при наступлении какого угодно числа событий Aj, j i, 1 j n, из той же совокупности. В этом случае справедлива формула (6) являющаяся обобщением соотношения (4).

Следующая формула справедлива для независимых сти событий •.., (7) Пример 15. Четыре стрелка одновременно стреляют по цели.

Вероятности попадания в цель для каждого стрелка известны: 0,7;

0,75;

0,7 и 0,65 соответственно. Чему равна вероятность того, что цель будет поражена (хотя бы одним стрелком)?

Решение. Обозначим за (г = событие, состоящее в том, что Г-Й стрелок попал в цель. Эти события независимы в совокупно сти, их вероятности по условию таковы:

0,7;

0,7;

0,75;

= 0,65.

Цель будет поражена (событие А), если попадет хотя бы один из стрелков:

А = + + ГЛАВА 11. СЛУЧАЙНЫЕ СОБЫТИЯ И ВЕРОЯТНОСТИ Вычисляя вероятность, получаем:

11.4. Примеры вычисления Перейдем к рассмотрению важного вопроса: как вычислять вероят ности сложных событий, если известны вероятности простых? Под черкнем еще раз, что вероятности простых событий определяются предварительно в классическом, геометрическом либо субъективном понимании.

Единого алгоритма решения произвольной вероятностной задачи не существует. Рассмотрим два взаимодополняющих метода — при менение формул (аналитический метод) и применение дерева веро ятностей (графический метод). Рассмотрение будем вести на приме рах.

Пример 16. Известно, что 5% изделий некоторой фирмы брако ванные. Взяли наугад на проверку два изделия. Какова вероятность того, что одно из этих двух изделий будет забраковано?

Решение 1. Обозначим за событие, состоящее в том, что пер вое (второе) изделие оказалось бракованным. Тогда — проти воположное событие, состоящее в том, что первое (второе) изделие удовлетворяет стандартным требованиям качества. Интересующее нас событие А = {"одна деталь бракованная" } можно представить следующим образом: А = {"первая деталь бракованная" и "вто рая деталь не бракованная" или "первая деталь не бракованная" и "вторая деталь бракованная"}. Вспомнив, что логическим и, или, не соответствуют в формулах алгебры событий умножение, сложение, противоположное событие, запишем:

А = + Теперь перейдем к вычислению вероятности события А. Заметим, что:

1) события и несовместимы;

2) события и а также и независимы.

11.4. ПРИМЕРЫ ВЫЧИСЛЕНИЯ ВЕРОЯТНОСТЕЙ Поэтому (8) Теперь осталось подставить вероятности "простых" событий и По условию 5% изделий бракованные. Поэтому Подставляя в формулу (8), получаем р(А) = 0,05 • 0,95 + • 0,05 = 0,095.

Оба изделия бракованные Выбираем 0,05 • 0, второе изделие Бракованное только первое изделие = 0,05 • 0, Выбираем первое< изделие Бракованное только второе изделие = 0,95 • 0, Выбираем второе изделие Среди двух изделий нет бракованных = 0,95 • 0, Рис. Решение 2. Построим так называемое дерево вероятностей, учиты вающее все возможные исходы (рис. 10). Здесь вершинам дерева (кроме концевых) соответствуют испытания, а ребрам — события.

Сначала рассмотрим первое изделие. При этом возможны два исхо да — изделие может оказаться бракованным (с вероятностью 0,05) либо качественным (с вероятностью 0,95). В каждом из этих случаев ГЛАВА 11. СЛУЧАЙНЫЕ СОБЫТИЯ И ВЕРОЯТНОСТИ рассмотрим второе изделие, которое тоже может быть либо брако ванным, либо качественным (с теми же вероятностями).

В результате получаем четыре возможности, обозначаемые кон цевыми вершинами дерева. К каждой из этих возможностей ведет путь из начальной точки, состоящий из двух ребер дерева. Для нахо ждения вероятностей перемножаются вероятности ребер соответствующего пути.

Искомая вероятность вычисляется как сумма 0,095.

Замечание. Поскольку все возможные исходы в сумме составляют достоверное событие, то суммарная вероятность всегда равна едини це. В данном случае Пример Через остановку пролегают троллейбусный и авто бусный маршруты. Троллейбус подъезжает через каждые 15 минут, автобус — через каждые 25 минут. К остановке подходит пассажир.

Какова вероятность того, что в ближайшие 10 минут на остановке появится троллейбус либо автобус?

Решение 1. Пассажир подошел к остановке в некоторый случайный момент между двумя последовательными приездами троллейбуса.

По условию троллейбус подъезжает через каждые 15 минут. По фор муле геометрической вероятности найдем вероятность р(Т) того, что троллейбус появится на остановке в ближайшие 10 минут:

Вероятность р(А) того, что в ближайшие 10 минут на остановку подъедет автобус, такова:

Нас интересует вероятность события S = ближайшие 10 минут на остановку подъедет троллейбус либо автобус". Ясно, что ПРИМЕРЫ ВЫЧИСЛЕНИЯ ВЕРОЯТНОСТЕЙ Поскольку события Т и А являются независимыми, можно вос пользоваться формулой (7). Имеем:

Таким образом, с вероятностью 0,8 пассажир уедет с остановки в ближайшие 10 минут.

Замечание 1. Вместо обращения к формуле (7) можно было рассу ждать несколько иначе. Пассажир не уедет с остановки в ближайшие 10 минут, если ни троллейбус, ни автобус, т. е. если про изойдет событие ТА. События Г и Л независимы, поэтому Вероятность же того, что пассажир уедет, составляет Замечание 2. Еще один способ рассуждений состоит в применении формулы (1):

(Разумеется, события Т и А совместимы — могут подъехать и трол лейбус, и автобус.) Заметим, однако, что в случае суммы более чем двух событий применима лишь формула (7). Хотя формула (1) и до пускает обобщение на случай большего числа событий, но получаю щиеся выражения довольно громоздки. Например, для трех событий имеем:

Решение 2. Построим дерево вероятностей (рис. 11). Интересующая нас вероятность вычисляется как сумма вероятностей попарно не совместимых событий:

ГЛАВА 11. СЛУЧАЙНЫЕ СОБЫТИЯ И ВЕРОЯТНОСТИ Подъехали и троллейбус и автобус (пассажир уехал) Подъехал только троллейбус (пассажир уехал) Подъехал только автобус (пассажир уехал) Ни троллейбус, ни автобус Т — троллейбус подъехал не подъехали Т — троллейбус не подъехал (пассажир остался) А — автобус подъехал А — автобус не подъехал Рис. Пример 18. Студент пришел на зачет, зная 15 вопросов из 20.

Если студент не может ответить, ему предоставляется еще одна (но не более!) попытка. Какова вероятность сдать зачет?

Решение 1. Введем следующие обозначения:

- студент сразу вытянул знакомый билет (и сдал зачет);

- студент вытянул незнакомый билет (еще одна попытка);

- студент со второго раза наконец-то вытянул знакомый билет (и сдал зачет);

- студент и во второй раз вытянул незнакомый билет (и ему предстоит пересдача);

А - студент сдал зачет.

Студент сдает зачет, если он либо сразу вытянул знакомый билет, либо сначала незнакомый, а во второй раз знакомый билет. Фор мально это можно записать следующим образом:

Переходя к вероятностям, получаем:

ПРИМЕРЫ ВЫЧИСЛЕНИЯ ВЕРОЯТНОСТЕЙ (Условная вероятность равна 15/19, поскольку во второй попытке "участвует" 19 билетов.) Замечание. Можно было рассуждать иначе. Студент не сдает зачет, если и в первый, и во второй раз вытянет незнакомый билет:

Поэтому Отсюда Зачет сдан с первой Первая попытка Зачет сдан со второй Зачет не сдан 3 — знакомый билет 3 — незнакомый билет Рис. Решение 2. Построим дерево вероятностей (рис. 12). Из него легко получить ответ:

Пример 19. Игроки А и В разыгрывают денежный приз в сле дующей игре. Подбрасывается монета до тех пор, пока не выпадет шесть "гербов" либо шесть "цифр". Если выпало шесть "гербов", то выигрывает игрок А, если шесть "цифр" — игрок В. Монету под ГЛАВА 11. СЛУЧАЙНЫЕ СОБЫТИЯ И ВЕРОЯТНОСТИ бросили 8 раз. При счете 5:3 в пользу игрока А (т. е. выпало пять "гербов" и три "цифры") игра прервалась по не зависящим от игро ков причинам. В каком отношении надо поделить денежный приз?

Решение 1. Если бы игра продолжалась, ситуация могла бы раз виваться (начиная с девятого подбрасывания монеты) следующим образом (приведем все возможные варианты и их вероятности):

Г - игрок А выиграл, вероятность 1/2;

Ц Г - игрок А выиграл, вероятность 1/4;

Ц Ц Г - игрок А выиграл,'вероятность 1/8;

Ц Ц Ц - игрок В выиграл, вероятность 1/8.

Таким образом, при счете 5:3 вероятность выигрыша игрока А со ставляет а игрока В — всего 1/8. По-видимому, приз следует разделить в отношении 7:1 в пользу игрока А.

Замечание. Можно было и не перебирать все возможные варианты, а просто заметить, что игрок В выигрывает лишь в случае выпа дания трех цифр подряд. Вероятность этого составляет 1/8, а ве роятность выигрыша игрока (что является противоположным со бытием, ведь ничья правилами игры не предусмотрена) составляет соответственно Решение 2. Дерево вероятностей см. на рис. 13. Вывод тот же, что и в решении 1.

11.5. ФОРМУЛА ПОЛНОЙ ВЕРОЯТНОСТИ И ФОРМУЛА 11.5. Формула вероятности и формула Байеса Одним из эффективных методов вероятностей является формула полной вероятности, являющаяся следствием формул для вероятностей суммы и произведения событий.

Предположим, что событие А может наступить только вместе с одним из попарно несовместимых событий (по отноше нию к событию А будем называть их гипотезами). Тогда событие А влечет за собой появление одного из событий и его можно представить в виде Пример 20. Пусть в доме пять дверей. Событие А = "человек вошел в дом", гипотеза — "человек прошел через дверь", где i = 1,2,3,4,5.

Поскольку события попарно несовместимы, то таковы ми же будут и события Воспользовавшись формулой (5), получаем:

Наконец, вспоминая формулу (3), можно сделать еще одно преобра зование:

Это и есть формула полной вероятности.

ГЛАВА 11. СЛУЧАЙНЫЕ СОБЫТИЯ И ВЕРОЯТНОСТИ С формулой полной вероятности тесно связана формула Байеса, справедливая при тех же предположениях.

Пусть опыт произведен и наступило событие А. Напомним, что событие А могло произойти только вместе с одной из гипотез Поэтому можно вычислить вероятность того, что имело место именно событие Эта апостериорная вероятность p(Hi\A) отличается, вообще говоря, от априорной вероятности (в кото рой не учтен тот факт, что событие А произошло).

Записывая формулы для вероятности произведения событий, имеем:

Приравняв правые части последних формул, получаем равенство И, далее, Привлекая формулу полной вероятности, получаем в итоге фор мулу Пример 21. Предположим, что 5% всех мужчин и 0,25% всех женщин страдают дальтонизмом. Для простоты будем считать, что мужчин и женщин одинаковое число. Какова вероятность того, что наугад выбранное лицо страдает дальтонизмом? Если наугад вы бранное лицо страдает дальтонизмом, то какова вероятность того, что это мужчина?

Решение 1. Здесь = "выбранное лицо — мужчина", — "выб ранное лицо — женщина", А = "выбранное лицо страдает дальто низмом". Требуется вычислить вероятности р(А) и Имеем:

Тогда по формуле полной вероятности 11.5. ФОРМУЛА ПОЛНОЙ ВЕРОЯТНОСТИ И ФОРМУЛА БАЙЕСА и по формуле Байеса Мужчина-дальтоник = 0,5 • 0, Проверка Случайный выбор = 0,5 • 0, Проверка М — мужчина Ж — женщина Д — дальтоник Д — не дальтоник Рис. Решение 2. Построим дерево вероятностей (рис. 15). Справа обозна чены лишь два исхода из четырех возможных, поскольку оставшиеся два нас в данном случае не интересуют. Из рисунка видно, что веро ятность того, что наугад выбранное лицо — составляет Если известно, что наугад выбранное лицо — дальтоник, то число исходов сокращается с четырех до двух обозначенных. Вероятность того, что это мужчина (условная вероятность!), равна ГЛАВА 11. СЛУЧАЙНЫЕ СОБЫТИЯ И ВЕРОЯТНОСТИ Пример 22. На экзамене студентам предлагается 20 билетов, из которых легкие, а 15 — трудные. Два студента по очереди тянут билеты — сначала первый студент, затем второй.

а) Чему равна вероятность вытянуть легкий билет для первого студента?

б) Чему равна вероятность вытянуть легкий билет для второго студента?

в) Известно, что второй студент вытянул легкий билет. Чему рав на вероятность того, что и первый вытянул легкий?

Решение. Введем обозначения:

- первый студент вытянул легкий билет;

- первый студент вытянул трудный билет;

А - второй студент вытянул легкий билет.

Тогда ответ на вопрос пункта а) дает формула классической ве роятности:

ответ на вопрос пункта б) — формула полной вероятности:

а ответ на вопрос пункта в) — формула Байеса:

Пример 23. Фирма планирует выпуск на рынок нового вида то вара. Субъективные представления руководства фирмы таковы: ве роятность хорошего спроса на этот товар составляет 0,7, вероятность плохого спроса — 0,3. Было проведено специальное исследование то варного рынка, которое предсказало плохой сбыт. Однако известно, что исследования такого рода дают правильный прогноз не всегда, а лишь с вероятностью 0,8. Каким образом маркетинговое исследо вание повлияло на вероятности хорошего и плохого сбыта?

Решение. Введем следующие обозначения:

- сбыт будет хорошим;

сбыт будет плохим;

А - исследование рынка предсказало плохой сбыт.

11.6. СХЕМА ИСПЫТАНИЙ БЕРНУЛЛИ Опыт и интуиция руководства фирмы дают в соответствии с усло вием следующие вероятности:

Маркетинговое исследование дает верный результат с вероятно стью 0,8, поэтому Подставляя все эти вероятности в формулу Байеса, получаем:

Ответ: в результате исследования вероятность хорошего сбыта уменьшилась до 0,37, а вероятность плохого увеличилась до 0,63.

11.6. Схема испытаний Бернулли Пусть А — случайное событие, которое может произойти в резуль тате некоторого испытания. Допустим далее, что нас интересует, на ступило ли будем считать возможными лишь два собы тия — А. Обозначим их вероятности через р q соответственно, р + д=1.

Предположим, что испытание повторяется при одних и тех же условиях, скажем, три раза. В результате этого эксперимента (со стоящего из трех испытаний) может произойти одно из следующих восьми событий:

ААА, ААА, ААА, ААА, ААА, ААА, ААА, ААА ГЛАВА 11. СЛУЧАЙНЫЕ СОБЫТИЯ И ВЕРОЯТНОСТИ (запись ААА обозначает событие "в первых двух испытаниях собы тие А не произошло, в третьем — произошло", аналогично записаны остальные семь событий). Подсчитаем вероятности этих событий по формуле (6). Имеем:

Как мы видим, вероятность каждого из исходов ставима в виде fc показывает число наступивших событий А, а (3 — к) соответственно число Вероятностные схемы такого рода называются схемами Бернул ли или схемами биномиальных экспериментов. Эти схемы широко применяются при анализе реальных ситуаций в тех случаях, когда эксперимент можно считать т. е. когда он состоит из фиксированного числа п испытаний, в каждом из этих испытаний происходит либо не происходит не которое событие, вероятность этого события одинакова в каждом испытании, испытания независимы одно от другого.

Пример Тренированный стрелок совершает пять выстрелов по мишени, причем все выстрелы производятся практически в одних и тех же условиях. При этом число попаданий в "десятку" может меняться от 0 до 5.

Пример 25. В помете, состоящем из 8 мышей, происходящих от одних родителей, число мышей, имеющих прямую, а не волнистую шерстку, может равняться произвольному целому числу от 0 до 8.

Пример 26. Один за другим бросают три игральных кубика.

Число выпаданий "шестерки" может принимать одно из четырех значений: от 0 до 3 включительно.

Вероятность того, что событие А произойдет ровно к раз после п испытаний, обозначим через (ясно, что 0 к п).

Справедлива следующая формула:

Здесь р — это вероятность появления события в одном испытании, q = 1 — р, а (читается "С из п по называется биномиальным 11.6. СХЕМА ИСПЫТАНИЙ БЕРНУЛЛИ коэффициентом и вычисляется по любой из формул:

где (читается "п факториал") — произведение натуральных чисел от 1 до включительно:

Заметим также, что по определению принимается:

Пример 27. Монету бросают 10 раз. Какова вероятность того, что при этом герб выпадет три раза? Выпадет меньше двух раз?

Решение. Здесь п — 10, р q = 1/2.

Р{герб выпал три раза} = Р{герб выпал меньше двух раз} = = не выпал ни разу} + выпал один раз} = Пример 28. Студент пишет контрольную работу по теории ве роятностей. У него есть предположение о том, как решить задачу, однако свою способность найти правильное решение студент оцени вает невысоко — примерно числом 0,4.

Вокруг студента в аудитории сидят пять однокурсников. Можно рискнуть опросить их и принять либо отвергнуть решение на основа нии большинства голосов. Подготовку этих однокурсников студент оценивает так же, как и свою.

ГЛАВА СЛУЧАЙНЫЕ СОБЫТИЯ И ВЕРОЯТНОСТИ Как лучше поступить студенту — положиться на свои соображе ния или на большинство голосов однокурсников?

Решение. Для выбора между двумя альтернативами следует снача ла выбрать какой-либо критерий. По-видимому, в данной ситуации таким критерием является вероятность правильно решить задачу.

Опираясь на свои соображения, студент оценивает ее как 0,4.

Вычислим теперь вероятность того, что большинство из пяти опрошенных однокурсников дадут правильный ответ. Большин ство — это либо 3, либо 4, либо 5. Поэтому искомая вероятность вычисляется следующим образом:

Р(0,4;

5, 3) + Р(0,4;

5, 4) + Р(0,4;

5, 5) = • (0,4)3 • (0,6)2 + • (0,4)4 • 0,6 + • (0,4)5 = = 10 • 0,064 • 0,36 + 5 • 0,0256 • 0,6 + 0,010 24 = 0,317 44.

Вероятность снизилось с 0,4 до 0,31744 — более чем на 20%. Вы вод: опрос однокурсников в данной ситуации лучше не проводить.

11.7. Задания и ответы 1. На плоскость нанесена сетка квадратов со стороной 10 см. Най дите вероятность того, что брошенный на плоскость круг радиусом 1 см не пересечет стороны ни одного из квадратов.

Ответ: 0,64.

2. Имеются две сумки с мячами, в каждой по 5 мячей, пронуме рованных от 1 до 5. Наугад вынимается по одному мячу из каждой сумки. Какова вероятность того, что это будут мячи с номерами 2 и 5 (безразлично, какой из них из какой сумки вынут)?

Ответ: 0,08.

3. Пусть испытанием является бросание точки в единичный ква драт, а событием А, В, С, попадание точки в соответствующую прямоугольную область (см. рис. 16, 17). Проверить совместимость и зависимость а) событий В (рис. 16);

б) событий С и D (рис. 17).

Ответ: а) события А и В совместимы и независимы;

б) события С и D несовместимы и зависимы.

11.7. ЗАДАНИЯ И ОТВЕТЫ Рис. Рис. 4. Вероятность того, что в течение одной смены возникнет непо ладка, равна 0,05. Какова вероятность того, что не произойдет ни одной неполадки за три смены?

Ответ: 0,857375.

5. Студент пришел на зачет, зная из 30 вопросов только 24. Ка кова вероятность сдать зачет, если после отказа отвечать на вопрос преподаватель задает еще один вопрос?

6. Два охотника стреляют в волка, причем каждый делает по од ному выстрелу. Для первого охотника вероятность попадания в цель 0,7, для второго — 0,8. Какова вероятность попадания в волка (хотя бы при одном выстреле)? Как изменится результат, если охотники сделают по два выстрела?

Ответ: 0,94;

0,9964.

7. Из большой связки галстуков, в которой галстуки зеленого, красного и желтого цвета находятся в пропорции 5 : 3 : 2, двое мужчин случайным образом выбирают по одному галстуку. Какова вероятность того, что они выберут галстуки одинакового цвета?

Ответ: 0,38.

8. Имеются две урны. В первой находится 1 белый шар, 3 черных и 4 красных, во второй — 3 белых, 2 черных и 3 красных. Из каждой ГЛАВА 11. СЛУЧАЙНЫЕ СОБЫТИЯ И ВЕРОЯТНОСТИ урны извлекают по шару. Найти вероятность того, что цвета выну тых совпадают.

Ответ:

9. На трех станках различной марки изготовляется определен ная деталь. Производительность 1-го станка за смену составляет деталей, 2-го — 35, 3-го — 25 деталей. Установлено, что 2%, 3% и 5% продукции этих станков соответственно имеют скрытые дефекты. В конце смены на контроль взята одна деталь.

а) Какова вероятность того, что эта деталь нестандартная?

б) Если деталь оказалась нестандартной, какова вероятность то го, что она изготовлена на 1-м, 2-м или 3-м станке?

Ответ:

10. Два стрелка независимо один от другого делают по одному выстрелу по мишени. Вероятность попадания в мишень для первого стрелка 0,8, для второго -- 0.4. После стрельбы в мишени обнару жена одна пробоина. Найти вероятность того, что в мишень попал первый стрелок.

Ответ: 6/7.

11. Как изменились бы вероятности хорошего и плохого сбыта в примере 23, если бы исследование рынка предсказало хороший сбыт?

Ответ: вероятность хорошего сбыта — 0,9;

вероятность плохого сбыта — 0,1.

12. Игральный кубик бросают 5 раз. Найдите вероятность того, что число очков, кратное трем, появится 2 раза.

Ответ: 80/243.

13. Всхожесть семян растений данного сорта оценивается вероят ностью, равной 0,8. Какова вероятность того, что из пяти посеянных семян взойдут не менее четырех?

Ответ: 0,737 28.

Глава СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 12.1. Понятие случайной величины.

Закон распределения.

Биномиальная случайная величина Мы уже знакомы с понятиями "испытание", "случайное событие", "вероятность". Теперь приступим к рассмотрению чрезвычайно важ ного случая, который характеризуется следующим обстоятельством:

в результате испытания не только происходит событие, но есть еще и возможность наблюдать некоторое число. Причем это число нас интересует даже в большей степени, чем само событие.

Нетрудно видеть, что возможность наблюдать число часто имела место и в тех испытаниях, которые мы уже рассматривали.

Пример 1. Бросая игральный кубик, мы получаем число точек на верхней грани.

Пример 2. Бросая одновременно три монеты, фиксируем число выпадений герба (это может быть 0, 1, 2 или 3).

Если каждому событию подобным образом поставлено в соответ ствие некоторое число, будем говорить, что задана случайная вели чина. Иными словами, случайная величина — это величина, прини мающая в результате испытания то или иное числовое значение, но заранее неизвестно, какое именно.

Будем обозначать случайные величины большими латинскими буквами X, Y и т. д.

ГЛАВА 12. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ С каждой случайной величиной связано некоторое множество чи сел — значений, которые она может принимать. В результате ис пытания эти значения могут выпадать с различной вероятностью.

Правило, устанавливающее связь между возможными значениями и их вероятностями (точнее, речь идет о вероятности события, за ключающегося в том, что случайная величина приняла то или иное значение), называется законом распределения случайной величины.

Замечание. Случайная величина однозначно и полностью определя ется своим законом распределения, подобно тому как квадрат опре деляется длиной стороны. Переводя эту аналогию в плоскость соот ношения с реальным миром, заметим, что если квадрат со стороной 10 м может быть моделью дома, бассейна или детской площадки, то случайная величина с данным законом распределения может быть моделью числа посетителей магазина в течение дня, числа выпус каемых станком деталей и т. п.

Вследствие тесной связи между понятиями "случайная величина" и "закон распределения" (или даже просто "распределение") они часто используются как синонимы.

Перейдем теперь к рассмотрению того, каким образом может быть задан закон распределения случайной величины, когда она прини мает лишь конечное число значений.

Итак, пусть случайная величина X может принимать одно из п различных значений:

При этом каждое из этих значений величина X принимает с опреде ленной вероятностью — соответственно Иными словами, — это вероятность события "случайная величи на X приняла значение или более кратко: X = — вероятность случайного события X = — вероятность случайного события X = Сведем все эти значения в таблицу 12.1. ПОНЯТИЕ СЛУЧАЙНОЙ ВЕЛИЧИНЫ. ЗАКОН РАСПРЕДЕЛЕНИЯ в первой строке которой указаны значения, принимаемые случайной величиной X, во второй строке — их вероятности. Она называется таблицей распределения случайной величины X. Обычно числа в первой строке таблицы распределения располагают в порядке воз растания.

Замечание. Отметим следующее важное обстоятельство. Поскольку в результате испытания величина X наверняка примет одно из этих значений, сумма несовместимых событий является достоверным событием, вероятность которого равна 1. По этому для таблицы распределения любой случайной величины спра ведливо равенство Итак, для того чтобы при решении конкретной задачи заполнить таблицу распределения заданной случайной величины, надо выпи сать все принимаемые ею значения ветствующие вероятности Вернемся к примеру с игральным кубиком. Для упомянутой там случайной величины (обозначим ее через X) вероятности принять любое из шести значений равны между собой. Таблица распределе ния выглядит так:

Для случайной величины из примера с тремя монетами (обозна чим ее через Y) построить таблицу распределения несколько слож нее. Вспомним, что в результате одновременного бросания трех мо нет возможно всего 8 равновероятных исходов: ГГГ, ГГЦ, ГЦГ, ГЦЦ, ЦГГ, ЦГЦ, ЦЦГ, ЦЦЦ. При первом исходе величина Y принимает значение 3;

при втором, третьем и пятом — значение 2;

при четвер том, шестом и седьмом — значение 1;

при восьмом — значение 0. С учетом этого таблица распределения случайной величины Y такова:

Для более наглядного представления закона распределения ча сто используется координатная плоскость. По оси абсцисс отмеча ют значения, принимаемые случайной величиной, по оси ординат — ГЛАВА 12. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ их вероятности. Затем на плоскости (х,р) отмечают точки • • • случайной величины Y из примера с тремя монетами так, как изображено на рис. 1. Если теперь провести от отмеченных точек вертикальные отрезки до пересечения с осью абсцисс, то получится столбиковая диаграмма (рис. 2). Если же последовательно соединить точки отрезками, получится полигон (рис. 3).

Пример 3 (схема испытаний Бернулли). Испытание пов торяется п раз, причем вероятность успеха в одном испытании рав на р.

Общее число успехов (в п испытаниях) есть случайная величи на, принимающая значения Вероятность того, что эта случайная величина примет значение равна Такую случайную величину будем называть биномиальной и обо значать Она зависит от двух параметров — п и р. Случай ная величина Y из примера 2 является биномиальной случайной величиной с параметрами 3 (три монеты) и 1/2 (такова вероятность выпадения герба у одной монеты):

12.2. Операции над случайной величиной Пусть имеется случайная величина X, принимающая в зависимости от результата испытания те или иные случайные значения. Если к каждому из этих значений прибавить одно и то же число, например 3, то в результате мы получим новые числа — значения случайной величины X + 3.

12.2. ОПЕРАЦИИ НАД СЛУЧАЙНОЙ ВЕЛИЧИНОЙ Таблица распределения случайной величины Х + 3 строится по таблице распределения случайной величины X следующим образом:

Как видно, вторая строка осталась без изменений, поскольку веро ятности событий {X = и (X + 3 = + 3) равны.

Построение таблицы распределения случайной величины X2 не сколько сложнее.

Рассмотрим конкретный пример:

Таблица для случайной величины строится просто:

Пытаясь действовать аналогичным образом для величины X2, т. е.

заменяя все значения числами получаем:

В первой строке есть совпадающие значения. Поэтому следует объ единить их в одно, сложив соответствующие вероятности:

Рассмотрим еще один пример:

Возводя значения случайной величины Z в квадрат, получаем:

И наконец, в результате имеем:

ГЛАВА 12. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Таблицу распределения случайной величины Y = f(X) для лю бой функции / можно построить аналогично. Она строится в два этапа. Сначала вычисляются элементы вспомогательной таблицы Затем совпадающие значения разных чисел и (если такие имеются) объединяются в одно, а соответствующие вероятности складываются.

12.3. Числовые характеристики величины Как было отмечено ранее, случайная величина полностью определя ется своим законом распределения. При этом закон распределения может быть задан, например, при помощи таблицы распределения.

Однако во многих практических задачах (в том числе в задачах при нятия решения) требуется представить информацию о случайной величине в более компактном, обозримом виде. Обычно для этого применяются так называемые числовые характеристики случайной величины — числа, на основании которых можно судить об интере сующих нас факторах.

Приведем пример. Пусть имеются две альтернативные стратегии действий, каждая из которых обещает принести определенную при быль, причем в обоих случаях прибыль зависит от различных слу чайных обстоятельств и в силу этого является случайной величи ной. Законы распределения обеих случайных величин будем считать известными (заданными в виде таблиц). Какую стратегию следует предпочесть?

Ниже мы рассмотрим две числовые характеристики случайной величины, позволяющие в ситуациях такого рода принимать доста точно обоснованное решение.

Математическое ожидание Первая важная характеристика — это среднее ожидаемое значение, принимаемое случайной величиной в больших сериях испытаний.

ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНОЙ ВЕЛИЧИНЫ Пусть имеется случайная величина X с заданной таблицей рас пределения Математическое ожидание (ср. англ. expectation) случайной величины X определяется формулой которая в сокращенной записи выглядит так:

Поясним эту формулу. Предположим, что проведено т испытаний (т — достаточно большое число), при этом раз величина X при няла значение раза — значение..., раз — значение Найдем среднее арифметическое всех этих m значений. Имеем:

Дробь представляет собой относительную частоту появления события X = испытаниях (в т испытаниях событие X = произошло раз). При больших значениях т относительная частота примерно равна вероятности события X = т. е.

Во многих случаях альтернативы можно сравнивать на основании средних значений. Особенно это оправданно тогда, когда решение приходится принимать в однотипных ситуациях много раз, т. е. фа ктически проводить большое число испытаний (например, магазин каждый день решает, сколько батонов хлеба закупить для реализа ции в течение следующего дня).

ГЛАВА 12. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Пример Предприниматель размышляет над тем, куда лучше вложить деньги — в киоск для торговли мороженым или в палатку для торговли хлебобулочными изделиями.

Вложение средств в киоск с вероятностью 0,5 обеспечит годовую прибыль 5 тыс. долл., с вероятностью 0,2 — 10 тыс. долл. и с веро ятностью 0,3 — 3 тыс. долл.

Для палатки прогноз таков: 5,5 тыс. долл. — с вероятностью 0,6, 5 тыс. долл. — с 0,3 и 6,5 тыс. долл. — с вероятностью 0,1.

В каком случае (для киоска или для палатки) математическое ожидание годового дохода больше?

Решение. Для каждого из двух возможных решений годовая при быль является случайной величиной. Обозначив эти величины через X построим таблицы распределения:

3000 5000 10000 5000 5500 X 0,3 0,5 0,2 0,3 0,6 0, Найдем математические ожидания:

= 3000 • 0,3 + 5000 • 0,5 + 10000 • 0,2 = 5400 долл., ЕУ = 5000 • 0,3 + 5500 • 0,6 + 6500 • 0,1 = 5450 долл.

Получается, что ЕУ > Таким образом, математическое ожи дание для палатки больше.

Дисперсия и стандартное отклонение Итак, математическое ожидание определяет, какое значение случай ная величина принимает "в среднем". Следующий простейший при мер показывает, что случайные величины с равным математическим ожиданием могут существенно различаться по степени близости к нему.

Рассмотрим случайные величины X и (1) Нетрудно видеть, что ЕХ — ЕУ = 100. Но если для величины X отклонение от значения 100 незначительно, то для величины У оно весьма заметно.

ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНОЙ ВЕЛИЧИНЫ Если выбор между величинами X и Y — это выбор между двумя альтернативными решениями, то X — это стабильная, предсказуе мая прибыль, а — это риск. Считается, что при принятии решений в большинстве случаев пытаются уменьшить непредсказуемость, по казателем которой является степень отклонения случайной вели чины от ее математического ожидания. Для измерения этого по казателя применяется еще одна числовая характеристика случай ной величины, называемая дисперсией. Обозначение: DX (ср. англ.

dispersion). Покажем, как она вычисляется.

Вычитая из случайной величины X ее математическое ожидание, получаем новую случайную величину Квадрат последней также является случайной величиной математическое ожидание которой и есть дисперсия:

Если величина X задана таблицей то дисперсия случайной величины X может быть вычислена по формуле или более просто:

Пример 5. Вычислим дисперсии случайных величин X и Y, та блицы которых приведены выше — см. (1):

ГЛАВА 12. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Пример 6. Для биномиальной случайной величины X = = Bi(n,p) справедливы соотношения Замечание. Математическое ожидание может быть любым числом, а дисперсия всегда неотрицательна.

Случайные величины, моделирующие какие-либо объекты реаль ного мира, обычно имеют размерность. Это означает, что принима емые ими значения могут измеряться в штуках, метрах, килограм мах и т. п. При этом математическое ожидание случайной величины имеет ту же размерность, что и сама случайная величина. Размер ность же дисперсии равна квадрату размерности случайной величи ны. Например, если случайная величина измеряется в рублях, то ее дисперсия — в рублях в квадрате.

Чтобы не иметь дело с такими причудливыми единицами измере ния, вводится понятие стандартного отклонения. Оно обозначает ся греческой буквой (сигма) и по определению равно квадратному корню из дисперсии Тем самым, стандартное отклонение имеет ту же размерность, что и сама случайная величина.

Выше шла речь об операциях над случайными величинами. В слу чае линейных преобразований случайной величины X е. преобра зований вида где а и b — некоторые числа) математическое ожидание и дисперсию получившейся случайной величины Y можно вычислить, исходя из этих же числовых характеристик величины X. Именно, справедливы следующие формулы:

Стандартная случайная величина Случайная величина, у которой математическое ожидание равно О, а дисперсия равна 1, называется стандартной.

12.4. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ С БЕСКОНЕЧНЫМ ЧИСЛОМ ЗНА ЧЕНИЙ Пусть имеется случайная величина X с математическим ожида нием (мю) и стандартным отклонением Нетрудно показать, что случайная величина является стандартной.

12.4. величины с бесконечным числом значений Выше мы рассматривали случайные величины, принимающие ко нечное число значений. Однако часто возникает необходимость рас смотрения случайных величин, число возможных значений которых бесконечно.

Приведем два простых примера.

7. Испытание состоит в бросании монеты до первого выпадания герба. Случайная величина — количество бросаний — может принимать значения 1, 2, 3 и так далее, т. е. бесконечное число значений.

Пример 8. Испытание состоит в том, что на отрезке [0;

1] число вой оси случайным образом отмечается точка (изначально все точки отрезка "равноправны", т. е. шансы каждой точки быть отмеченной такие же, как у любой другой). Случайная величина X — число от резка [0;

1], соответствующее отмеченной точке, — может принимать любые значения из отрезка [0;

1].

Натуральных чисел, равно как и точек отрезка [0;

1], бесконечно много. Однако на числовой прямой они расположены изолированно друг от друга (дискретно). Отмеченное свойство объединяет вели чину из примера 7 со случайными величинами, принимающими конечное число значений. Все эти величины называются дискрет ными случайными величинами.

Для случайной величины Y из примера 7 можно построить "бес конечную таблицу распределения" следующего вида:

В отличие от дискретных случайных величин случайная величи на X из примера 8 является непрерывной случайной величиной — ГЛАВА 12. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ точки отрезка [0;

1] нельзя одну за другой выделить и записать в таблицу (хотя бы и бесконечную).

Существуют еще случайные величины смешанного типа.

Далее мы будем рассматривать только случайные величины, при нимающие конечное число значений, и непрерывные случайные ве личины.

12.5. Непрерывные величины Под непрерывной случайной величиной мы будем понимать случай ную величину, принимающую значения на прямой, луче (полупря мой) или отрезке. Описание закона распределения в непрерывном случае существенно сложнее, чем в дискретном.

Главное различие в задачах вычисления вероятностей для дис кретного и непрерывного случаев состоит в следующем. В дискрет ном случае ищется вероятность событий типа X = с (случайная величина принимает определенное значение). В непрерывном слу чае вероятности такого типа равны нулю, поэтому интерес предста вляют вероятности событий типа а X b (случайная величина принимает значения из некоторого отрезка). При этом Для случайной величины X, с равной вероятностью принимаю щей любое значение из отрезка [0;

1], естественно считать, что веро ятность попадания в отрезок [а;

равна длине этого отрезка. На пример, Рассмотрим функцию 12.5. НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ (рис. 4). Ее связывает со случайной величиной X следующее обсто ятельство: вероятность события а X b равна площади фигуры, ограниченной прямыми у = 0, х = а, х b графиком функции у = Иными словами, справедливо равенство для любых а и а Таким образом, функция f(x) позволяет вычислять вероятности, связанные со случайной величиной X, т. е., по сути, задает закон распределения случайной величины X.

Посмотрим теперь на ситуацию с более общей точки зрения. Пусть имеется случайная величина X и неотрицательная функция такая, что для любых чисел а и b, a выполняется равенство (рис. 5). В этом случае говорят, что случайная величина X имеет плотность распределения f(x). Записывается это следующим обра зом:

Замечание 1. Интеграл от плотности распределения по всей области возможных значений случайной величины равен 1.

ГЛАВА 12. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Рис. Замечание 2. Описанная ситуация допускает следующую аналогию из механики. Пусть имеется сплошной стержень массой 1 кг. Масса распределена по стержню с различной, вообще говоря, плотностью.

Если мы хотим сколько весит некоторый отрезок стержня, надо взять по этому отрезку интеграл от плотности.

Пример 9. Пусть случайная величина X задана плотностью распределения (рис. 6). Для нахождения вероятностей требуется вычислять соот ветствующие интегралы. Например:

Важно отметить, что поскольку все возможные значения величины X лежат в пределах от 0 до 2.

Пример 10. Показательное (экспоненциальное) распределение задается плотностью вида 12.6. СУММА СЛУЧАЙНЫХ ВЕЛИЧИН Рис. Рис. 7). Здесь Л — некоторое положительное число. Показательное распределение применяется в теории массового обслуживания.

Для непрерывных распределений, как и для дискретных, мож но рассматривать числовые характеристики: математическое ожи дание, дисперсию и др. Они вычисляются при помощи плотности распределения.

12.6. Сумма случайных величин Если в результате испытания принимают определенные значения сразу две случайные величины, Х\ и то их можно рассматривать вместе. В частности, определим их сумму следующим обра зом: если в результате испытания величина принимает значение а величина — значение то случайная величина + принимает значение + Аналогично определяется сумма п случайных величин.

Пример 11. Студент сдает в сессию три экзамена. Оценка по г му экзамену (Г 1,2,3) — случайная величина Тогда общая сум ма оценок за все три экзамена — случайная величина + + Приведем пример построения закона распределения суммы двух случайных величин.

Пример 12. Пусть случайные величины и задаются та блицами распределения следующего вида:

ГЛАВА 12. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Так как принимает три различных значения, a то для суммы + получаем шесть возможностей. Выпишем их, вычислив попутно вероятности.

Итак, определим:

при Таким образом, для величины + получаем следующую та блицу распределения:

Замечание 1. Если и непрерывные случайные величины, то закон распределения суммы + строится гораздо сложнее.

В случае суммирования п дискретных случайных величин, где п > 2, таблица распределения строится аналогичным образом. Как в дискретном, так и в непрерывном случаях для математического ожидания суммы формула:

или, применяя знак сокращенного суммирования:

Аналогичная формула для дисперсии справедлива не всегда, а только в случае независимых случайных величин.

Случайные величины называются независимыми, если закон распределения каждой из них не зависит от того, какие значения приняли другие величины.

Для дисперсии суммы независимых случайных величин справед ливо соотношение Замечание 2. Отметим, что величины •, могут иметь один и тот же закон распределения. В этом случае вместо термина "независимые случайные величины" употребляют термин "незави симые наблюдения (испытания)".

12.7. Нормальное распределение Наиболее часто применяется для анализа реальных ситуаций так называемое нормальное (или гауссово) распределение. Оно зависит от двух параметров, и и задается плотностью вида (рис. 8). Случайную величину, распределенную нормально с пара метрами и будем обозначать Параметры и имеют вполне ясный смысл: это соответственно математическое ожидание и стандартное отклонение. Зависимость нормального распределения от параметров мы обсудим несколько позже, сначала же рассмотрим важный частный случай.

При = 0 и = 1 получается стандартное нормальное распре деление (напомним, что стандартной называется случайная величина с нулевым математическим ожиданием и единичной дис персией). Его плотность будем обозначать особым образом, а ГЛАВА 12. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ исследования функции достаточно рассмотреть ее для значений х 0. В точке х = 0 функция имеет максимум а с увеличением аргумента х убывает, причем это убывание проис ходит довольно быстро:

Перейдем к рассмотрению основной задачи — вычислению веро ятностей типа р(а НОРМАЛЬНОЕ ОПРЕДЕЛЕНИЕ С этой целью определим для неотрицательных чисел х функцию Имеем:

Площадь фигуры, заштрихованной на рис. 10, равна Ф(х). Иначе говоря, функция Ф(х) — первообразная функции Для вычислений, связанных с функцией Ф(х), обычно пользуются таблицами различной степени подробности. Мы будем пользоваться следующей таблицей (для удобства она повторена в приложении в конце книги):

Можно считать, что при х > 3 имеем Ф(х) 0,5.

При помощи этой таблицы можно сразу найти, например, следу ющие вероятности:

U 0,5) = = 0,192, U 0,3) = Ф(0,3) = 0,118.

ГЛАВА 12. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Из симметричности графика плотности распределения (рис. 9), легко видеть, что Поэтому (рис. 11).

Рис. 11 Рис. Поскольку график функции симметричен, справедливы сле дующие соотношения:

U = р(0 U 0,4) = = 0,155, р(-0,8 0) = р(0 0,8) = Ф(0,8) = 0, (рис. 12).

Наконец, вот еще три случая:

р(0,1 U 0,3) = U -0,1) = = Ф(0,3) - Ф(0,1) = 0,118 - 0,040 = 0,078, р(-0,1 U 0,3) = Ф(0,3) + Ф(0,1) = 0,118 + 0,040 = 0,158.

(рис. 13, 14, 15).

Замечание. Во всех этих формулах знак можно заменить на знак <, а знак — на знак >.

12.7. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ Перейдем теперь к рассмотрению нормального распределения об щего вида. Напомним, что нормальное распределение с математиче ским ожиданием и стандартным отклонением обозначается через На рис. 16, 17 показано, как график плотности нормального рас пределения зависит от параметров и Чем больше тем правее расположена наивысшая точка графика (при одинаковых Чем больше тем более пологим является график (при одинаковых ГЛАВА 12. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Пусть имеется случайная величина X — ст). Вычисление ве роятностей типа р(а X сводится к вычислению аналогичных вероятностей для стандартной величины U = Именно: ока зывается, что линейные операции над нормальной случайной вели чиной приводят опять к нормальной случайной величине (с другими числовыми характеристиками). Для нас сейчас важно то, что, отни мая от случайной величины ее математическое ожи дание и деля на стандартное отклонение, получаем в результате стандартную нормальную величину Поэтому Аналогично 12.7. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ В частности, для некоторых конкретных значений получаем:

Приведем еще один пример.

Пример 13. Вес пачек с рисом, расфасованных фирмой "Новый рис", является нормально распределенной случайной величиной с математическим ожиданием 1 кг и стандартным отклонением 10 г.

Какой процент пачек имеет вес:

а) от 990 г до 1020 г;

б) менее 990 г ;

в) более 1020 г?

Решение. Вес пачки риса является нормально распределенной вели чиной X - N(1000,10). Поэтому Ответ: а) 81,8%;

б) 15,9%;

в) 2,3%.

ГЛАВА 12. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ Наряду с вычисленем вероятностей, связанных с нормальным распределением, можно решать задачи и другого типа.

Пример Найти такое число С, что р(0 < U < С) = 0,2.

Решение. Имеем:

По условию Ф(С) 0,2.

Обратимся к таблице значений функции Ф. Среди ее значений нет числа 0,2. Поэтому ищем ближайшее к нему. Это число 0,192, соответствующее значению С = 0,5.

Ответ: С = 0,5.

Пример 15. Найти такое число С, что С) = 0,1.

Рис. Решение. Для любого положительного числа С выполняется нера венство p(U <С)> 0,5.

Поэтому искомое значение С — число отрицательное (рис. 18). С учетом этого получаем, что p{U <С) (в качестве аргумента функции Ф указано положительное число —С). Далее, =0,4.

НОРМА ЛЬНОЕ ОПРЕДЕЛЕНИЕ Среди значений функции Ф ищем ближайшее к 0,4. Это число 0,445, соответствующее значению аргумента 1,6. Поэтому - С =1,6.

Ответ: С — Пример 16. Вес пачек с рисом, расфасованных фирмой "Новый рис", является нормально распределенной случайной величиной с математическим ожиданием 1 кг и стандартным отклонением 10 г.

Проверка показала, что 2,5% выпускаемых пачек имеют вес меньше минимально допустимого стандартом. Каков этот минимальный вес?

Решение. Вес пачки риса является нормально распределенной ве личиной X = Для ответа на вопрос достаточно решить уравнение р(Х < С) 0,025.

Преобразуем его:

р < — = 0,025.

Ясно, С учетом этого получаем Ответ: Минимально допустимый стандартный вес составляет 980 г.

ГЛАВА 12. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 12.8. Формула Муавра-Лапласа Напомним, что биномиальное распределение Bi(n,p) имеет два па раметра — Если случайная величина X распределена за кону то это означает следующее:

к = При DX = пр(1 - р).

Между биномиальным и нормальным распределениями существу ет простая связь. При больших значениях п справедлива следующая приближенная формула:

Bi(n,p) N — р). (2) Эта формула называется формулой Муавра-Лапласа. Мы будем при менять ее для вычисления вероятностей, связанных с биномиальным распределением, при выполнении условий п > 90, пр(1 - р) > 9.

Пример Игральный кубик бросают 120 раз. вероят ность того, что число выпаданий "единицы" будет лежать в пределах от 20 до 30?

Решение. Здесь мы имеем дело с биномиальной случайной величи ной Проверим, можно ли применить формулу Муавра Лапласа:

п = 120 > 90, пр(1 - р) 120 16,7 > 9.

Условия выполнены. Поэтому случайную величину можно заменить нормальным распределением с параметра ми = 120 • - = 20, 12.8. ФОРМУЛА Имеем:

Пример 18. На некотором производстве регулярно проводится проверка качества продукции, для чего выбираются случайным об разом 500 изделий и проверяются. Опыт показывает, что в среднем 11 изделий оказываются бракованными. Найти вероятность того, что во время очередной проверки число бракованных изделий окажется не менее 20.

Решение. Число бракованных изделий является биномиальной слу чайной величиной с параметрами п = 500 ир = 0,022. Прове рим условия применимости формулы Муавра-Лапласа. Имеем:

п = 500 > 90, пр(1 р) = 11 • (1 - = 10,758 > 9.

Условия выполнены, поэтому величину 0,022) можно заме нить нормальной случайной величиной с параметрами:

= пр = 11, -р) = 3,3.

Имеем:

= p(U 2,7) = 0,5 - 0,5 - 0,497 0,003.

Замечание (центральная предельная теорема). Формула Лапласа является частным случаем следующего удивительного утверждения:

сумма большого числа почти произвольных случайных величин распределена приближенно по нормальному закону.

Этот факт является теоретическим обоснованием того, что мно гие реально наблюдаемые величины, испытывающие влияние мно жества случайных факторов, распределены по нормальному закону.

ГЛАВА 12. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 12.9. Задания и ответы 1. Монету бросают 5 раз. Случайная величина X — число выпада ний герба. Составьте таблицу распределения, найдите математиче ское ожидание и дисперсию случайной величины X.

Ответ: 2,5;

1,25.

2. В лотерее на каждые 100 билетов приходится 15 выигрышей.

Количество и размер выигрышей заданы в таблице:

Требуется составить закон распределения случайной величины — размера выигрыша в лотерее, приходящегося на один билет, а также найти математическое ожидание и дисперсию этой случайной вели чины.

Ответ: 0,5;

4,85.

3. Найдите вероятности (здесь и в следующей задаче U = — — стандартная нормальная случайная величина):

б) p(U 0,7);

в) р(0,3 U 0,4);

г) 0,2);

-1,3);

е) p(U -2).

Ответ: а) 0,258;

б) 0,242;

в) 0,037;

г) 0,119;

д) 0,068;

е) 0,977.

4. Найдите число х такое, что а) р(0 U х) = 0,4;

б) <х) = 0,95.

Ответ: а) 1,3;

б) 2.

5. Найдите следующие вероятности:

12.9. ЗАДАНИЯ И ОТВЕТЫ Ответ: а) 0,236;

б) 0,841;

в) 0,232;

г) 0,078;

д) 0,045.

6. Производительность труда рабочих некоторого цеха является нормально распределенной случайной величиной с математическим ожиданием 90 кг за смену и стандартным отклонением 15 кг за сме ну. Вычислите долю рабочих, производительность которых:

а) лежит в промежутке от 80 до 110 кг за смену;

б) превышает 110 кг за смену;

в) менее 80 кг за смену.

г) Какой следует установить норму дневной выработки, чтобы 90% рабочих ее выполняли?

Ответ: а) 0,66;

б) 0,1;

в) 0,24;

г) 70,5 кг.

7. Производство дает 1% брака. Какова вероятность того, что из взятых на исследование 1100 изделий забраковано будет не более 17?

Ответ: 0,964.

8. Какова вероятность того, что при 100-кратном бросании моне ты число выпаданий герба будет от 45 до 55?

Ответ: 0,682.

Зак. Глава О МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ 13.1. Вводные замечания о статистике Математическая статистика изучает различные методы обработки и осмысления результатов многократно повторяемых случайных со бытий. Понятие случайного события определяется в теории веро ятностей, обработка результатов также производится при помощи теоретически разработанных вероятностных методов. Задачей мате матической статистики является построение и оценка адекватности идеальных вероятностных моделей реальных процессов.

В качестве иллюстрации рассмотрим следующий пример. Пусть имеется игральный кубик. Обычно рассматривается мо дель, в соответствии с которой при бросании кубика вероятность выпадания любого числа очков от 1 до 6 одинакова и равна 1/6.

Однако для "реального" кубика может случиться так, что при бро сании его, например, 1000 раз шестерка выпала в 300 случаях. В принципе такое может произойти и в рамках модели с вероятностью 1/6, однако здравый смысл подсказывает, что скорее всего у кубика смещен центр тяжести. Это означает, что в дальнейшем имеет смысл использовать другую гипотезу относительно вероятности выпадания шестерки при бросании данного кубика. Например, довольно логич но предположить, что эта вероятность близка к 0,3.

Для процесса построения и применения моделей характерно сле дующее обстоятельство: чем больше данных, тем точнее, адекватнее модель. В полной мере это относится к статистическим моделям. И в приведенном выше примере с кубиком вывод делается основе многократного повторения испытания (бросания кубика).

13.2. ПЕРВИЧНАЯ ОБРАБОТКА ДАННЫХ Поскольку мы имеем дело со случайными событиями, то рекомен дации, полученные на основе статистических соображений, всегда носят вероятностный характер. Однако это ни в коей мере не снижа ет их ценности. Напротив, вероятностный характер модели является показателем близости к описываемой реальной ситуации, которая зачастую слишком сложна для детерминированного описания.

Приведем несколько примеров практических задач, требующих применения статистических методов.

1. Пусть по некоторому вопросу в городе опрошено N человек, из них М дали положительный ответ и (N — M) — отрицательный. Как по этим данным оценить долю горожан, дающих положительный ответ? Понятно, что эта доля близка к M/N, но в какой степени?

Замечание. Имеется еще немаловажный вопрос о том, каким обра зом правильно организовать опрос (чтобы учесть мнение различных групп населения), но здесь мы этой проблематики касаться не будем.

2. Предположим, что на некоторой фирме применили нововве дение: внедрили новую технологию, перешли на выпуск новой про дукции и т. п. Для простоты будем считать, что регистрируемыми данными являются значения производительности труда в течение дня. Эта производительность зависит от ряда случайных факторов и, следовательно, является случайной величиной.

Пусть имеется последовательность чисел — производительность за некоторый срок. Например: 7, 11, 10, 6, 6, 9, 9, 10, 5, 6, 10, 7 (в этот момент процесс производства был изменен, последующие дан ные относятся к новой ситуации), 11, 7, 9, 8, 10, 9.

Как по имеющимся числовым данным определить, достигнуто ли повышение производительности труда?

3. Требуется дать прогноз на изменение значения некоторой ве личины — курса доллара, спроса на продукцию, числа зрителей на стадионе и т. п. Основными исходными данными здесь являются значения, которые принимала изучаемая величина в прошлом.

13.2. Первичная обработка данных Обработка данных и получение на ее основе каких-либо рекоменда ций относительно принятия того или иного управленческого реше ния — процесс, вообще говоря, многоэтапный. Обычно полученные в результате наблюдений данные представляют собой набор чисел.

ГЛАВА 13. О МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ Просматривая этот набор, как правило, трудно выявить какую-либо закономерность. Поэтому данные подвергают некоторой первичной обработке, целью которой является упрощение дальнейшего анали за. Мы рассмотрим подробно один из возможных способов.

Рассмотрим данные, полученные в результате регистрации зна чений некоторой случайной величины, — набор чисел:

(отметим, что некоторые значения могут совпадать). Этот набор чи сел называется выборкой.

Дальнейшие действия зависят от того, как много в выборке раз личных чисел. Если мы имеем дело с дискретной случайной вели чиной, то различных чисел немного;

если с непрерывной случайной величиной, то могут и все числа оказаться различными. Поэтому далее рассмотрим два этих случая по отдельности.

Дискретный случай Первый этап обработки выборки — это составление вариационного ряда. Его получают так: среди всех чисел отбирают различные и располагают в порядке возрастания — где < < • • < Следующий этап обработки выборки составление дискретной таблицы частот:

Здесь п — число всех измерений, — число измерений, в которых наблюдалось значение Величины называются частотами, а величины — относительными частотами.

Графической иллюстрацией дискретной таблицы частот является столбиковая диаграмма (рис. 1).

Замечание 1. Частоты и относительные частоты пропорциональны, поэтому при построении столбиковой диаграммы вертикальной 13.2. ПЕРВИЧНАЯ ОБРАБОТКА ДАННЫХ Рис. оси можно указывать значения либо относительных частот, либо ча стот — визуальное восприятие от этого не зависит.

Пример 1. Пусть нашей задачей является выявление картины успеваемости студентов, сдавших экзамен по курсу "Математиче ские модели в управлении". На курсе 56 человек. Полученные сту дентами оценки представляют собой (в порядке алфавитного спис ка) следующий набор чисел:

3, 4, 5, 4, 3, 3, 5, 4, 3, 5, 5, 2, 3, 5, 3, 5, 3, 5, 4, 4, 3, 3, 4, 3, 4, 3, 3, 5, 3, 3, 4, 3, 4, 3, 5, 3, 4, 4, 3, 5, 3, 3, 5, 4, 2, 5, 3, 4, 2, 3, 4, 3, 5, 3, 5.

Это и есть исходные данные — выборка. Числа, составляющие выборку, представляют собой реализации случайной величины — оценки на экзамене.

Составление вариационного ряда не представляет сложностей.

Вот он:

2, 3, 4, 5.

Теперь надо подсчитать, сколько раз встречается каждая из оце нок. Это можно сделать непосредственно, однако существует и дру гой способ. Выписываются значения 2, 3, 4, 5 по одному на каждой строке. После этого выборка просматривается: одно число за дру гим, и для каждого значения ставится вертикальный отрезок в со ответствующей строке. После этого подсчитывается число отрезков в каждой строке.

В данном случае имеем:

ГЛАВА О МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ Таблица частот выглядит следующим образом:

Здесь в последней строке — относительные частоты, полученные при делении частот на число измерений п — 56.

Рис. Столбиковая диаграмма, иллюстрирующая полученную таблицу, изображена на рис. 2.

Непрерывный случай Если число различных значений в выборке велико, вычислять час тоту каждого из них не имеет большого смысла. Например, если все значения в выборке различны, то дискретная таблица частот имеет ПОНЯТНО, ЧТО такая таблица не добавляет наглядности.

Поэтому поступают следующим образом. Весь промежуток изме нения значений выборки, от минимального до максимального, раз бивают на интервалы. После этого подсчитывают число значений из выборки, попадающих в каждый интервал (частоты), а затем — относительные частоты. В результате получаем интервальную та 13.2. ПЕРВИЧНАЯ ОБРАБОТКА ДАННЫХ блицу частот:

Здесь п — число всех измерений, — число интервалов, — ко личество чисел, приходящихся на г-й интервал, = — относи тельная частота попадания в г-й интервал. Интервалы обычно берут одинаковой длины, хотя это и не обязательно.

Графической иллюстрацией интервальной таблицы частот явля ется гистограмма (рис. 3). Гистограмма представляет собой ступен чатую линию;

основанием г-й ступеньки является интервал а площадь этой ступеньки равна Замечание 2. Число интервалов т выбирают из соображений на глядности получающейся гистограммы. Обычно т лежит в пределах от 5 до 15.

Замечание 3. Если интервалы выбраны одинаковой длины, то площади ступенек гистограммы пропорциональны их высотам, и в этом случае можно отмечать на оси ординат просто частоты Пример 2. Предположим, что студенты некоторой группы, со стоящей из 25 человек, написали контрольную работу. Каждый сту дент получил определенное количество баллов. Приведем эти баллы (в порядке алфавитного списка группы):

75, 145, 150, 180, 125, 150, 150, 165, 95, 135, 130, 70, 130, 105, 135, 135, 100, 160, 60, 85, 120, 60, 145, 150, 135.

ГЛАВА 13. О МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ Требуется построить интервальную таблицу частот и гистограмму.

Нетрудно найти среди приведенных чисел минимальное и макси мальное — это числа 60 и 180. Таким образом, все значения лежат на отрезке [60;

180]. Разобьем этот отрезок, например, на т — 6 равных частей. После этого подсчитаем число значений, попавших в каждый интервал (воспользуемся методом, описанным в примере 1):

Построим теперь интервальную таблицу частот:

Соответствующая гистограмма изображена на рис. 4. На вертикаль ной оси проставлены частоты — см. замечание 3.

Глава ТОЧЕЧНЫЕ И ИНТЕРВАЛЬНЫЕ ОЦЕНКИ Выше были рассмотрены некоторые методы первичной обработки данных, в ходе которой имеющиеся "сырые" результаты наблюде ний преобразуются для достижения большей наглядности. Теперь мы рассмотрим методы, позволяющие, исходя из тех же данных, де лать предположения относительно числовых характеристик наблю даемой случайной величины — математического ожидания и диспе рсии.

14.1. Точечные оценки При помощи таблицы частот либо гистограммы можно судить (хотя бы примерно) о характере распределения наблюдаемой случайной величины. Однако часто интерес представляют численные харак теристики распределения — математическое ожидание, дисперсия и др. Это обусловлено тем, что в процессе принятия решения удоб нее опираться на небольшое число значимых параметров.

В связи с этим возникает задача: исходя из набора значений (вы борки)..., величины X, полученного в результате п независимых наблюдений, оценить значение математического ожидания дисперсии DX либо еще какого-нибудь параметра. Пока наши рассуждения носят общий характер, мы будем обозначать оцениваемый параметр бу квой в (тэта).

Повторим сказанное иными словами. Имеется случайная величи на X, значения (реализации) которой каким-либо обра ГЛАВА ТОЧЕЧНЫЕ И ИНТЕРВАЛЬНЫЕ ОЦЕНКИ зом становятся нам известными. (Этой случайной величиной может быть число посетителей данного магазина в течение дня, рост в сан тиметрах студента данного вуза, годовой доход гражданина данной страны и У величины X имеется, скажем, математическое ожи дание, которое нам неизвестно. Требуется найти способ, при помощи которого по известным реализациям величины X можно разумным образом оценить неизвестное математическое ожидание.

Сейчас мы рассмотрим, каким образом неизвестный параметр оценивается одним числом. Такая оценка называется точечной.

Любая оценка для 9 - обозначим ее •-- будет представлять собой некоторое выражение, составленное из символов в = Тем самым 9 будет случайной величиной (принимающей свои зна чения в результате п опытов над X). Ее закон распределения будет зависеть от закона распределения случайной величины X (послед нему подчинена каждая из величин и от числа наблю дений п.

Замечание. Подчеркнем, что на момент принятия решения о значе нии параметра в (т. е. после проведения испытаний (наблюдений)) величины являются конкретными числами. Однако на момент, когда выбирается сам метод (алгоритм, формула) вычисле ния величины являются случайными, ведь еще неиз вестно, какие именно значения они примут.

Пример 1. Студент размышляет, ехать ли ему домой или ид ти в библиотеку. Не находя решающих аргументов в пользу того или другого, он решает провести испытание — подбросить монету, и если выпадет герб, то ехать домой (в противном случае — идти в библиотеку). В сущности, решение тем самым принято (определен алгоритм действий). Однако до подбрасывания монеты неизвестно, что же выпадет, герб или цифра (соответственно неизвестно и на правление дальнейших передвижений студента).

Естественно предъявить к оценке 9 некоторые требования. Упо мянем два важнейших.

1) Желательно, чтобы при использовании величины вместо не известного параметра в мы не делали систематических ошибок ни в ОЦЕНКИ сторону завышения, ни в сторону занижения, т. е. чтобы выполня лось равенство = 9.

Оценка, удовлетворяющая такому условию, называется несмещен ной.

2) Желательно, чтобы с увеличением числа п опытов значения случайной величины концентрировались около в все более тесно, т. е. чтобы с ростом п точность оценки возрастала. Поскольку мерой рассеяния случайной величины вокруг ее математического ожида ния является дисперсия, это требование можно сформулировать так:

D9 0 при п оо (дисперсия оценки стремится к нулю при неограниченном возраста нии числа наблюдений). Оценка, удовлетворяющая такому условию, называется состоятельной.

Рассмотрим важный пример — точечную оценку для математи ческого ожидания EX. Таким образом, в данном случае в = EX. В качестве такой оценки примем так называемое эмпирическое сред нее, т. е. среднее арифметическое величин • Случайные величины • • • имеют один и тот же закон распределения, совпадающий с законом распределения величины X.

Поэтому п п -пЕХ = EX.

\ } п п \ / Таким образом, оценка X является несмещенной. Дисперсия этой оценки вычисляется следующим образом:

Выражение DX/n, очевидно, стремится к нулю при неограниченном возрастании п. Отсюда вытекает состоятельность оценки X.

ГЛАВА ТОЧЕЧНЫЕ И ИНТЕРВАЛЬНЫЕ ОЦЕНКИ Соотношения EX EX, DX = (1) п понадобятся нам в дальнейших рассмотрениях.

14.2. Интервальные оценки Рассмотренная в предыдущем пункте точечная оценка часто быва ет достаточной для практических выводов. Однако если есть необ ходимость в более детальном анализе, то надо оценить, насколько истинное значение параметра расходится с точечной оценкой этого значения.

В этом случае можно поступить следующим образом. Выберем интервал таким образом, чтобы вероятность включения в этот интервал параметра в была достаточно велика (близка к едини це). Говоря более строго, это означает, что вероятность выполнения двойного неравенства не меньше заданного числа у.

Вероятность у называется доверительной вероятностью или на дежностью, а интервал доверительным интервалом, (со ответствующим доверительной вероятности Обычно значение у выбирают равным 0,95 либо 0,99.

Рассмотренная оценка называется интервальной. Еще раз под черкнем, что интервальная оценка зависит не только от имеющихся данных, но и от требуемой надежности Методы построения интервальных оценок будут обсуждаться в последующих разделах. Сейчас же приведем неформальный пример, поясняющий различие точечной и интервальной оценок.

Когда о каком-либо человеке говорят: "Ему примерно 38 лет", это ни что иное, как точечная оценка возраста. Когда же говорят: "Ему лет 35-40", это интервальная оценка, доверительный интервал — (35;

40). Надежность оценки при этом в явном виде не указывается, но предполагается довольно близкой к единице.

Иногда можно слышать и высказывания такого рода: "Ему лет 35-40, по крайней мере не больше 45". Очевидно, что доверитель ный интервал (35;

45) имеет большую доверительную вероятность, чем интервал (35;

40). Однако интервальная оценка (35;

40) более ин формативна, чем оценка (35;

45).

ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ 14.3. Оценки математического ожидания нормального распределения В этом разделе мы рассмотрим конкретный пример построения то чечной и интервальной оценок. И здесь, как и ранее, исходными данными являются результаты наблюдений..., Кроме того, известно, что эти числа являются реализациями нор мальной случайной величины Далее вопрос может быть поставлен различным образом:

требуется оценить неизвестный параметр требуется оценить неизвестный параметр известен параметр требуется оценить параметр Из перечисленных трех задач мы рассмотрим лишь одну — послед нюю.

Итак, требуется найти точечную и интервальную оценки мате матического ожидания случайной величины X, распределенной по нормальному закону с известным стандартным отклонением Исходными данными являются оценки требуется еще задать доверительную вероятность Точечная оценка Точечную оценку параметра определим как эмпирическое сред нее:

Как уже отмечалось, такая оценка является несмещенной и состоя тельной для любой случайной величины, в том числе, разумеется, и в данном случае.

Интервальная оценка Для построения интервальной оценки необходимо сначала выбрать доверительную вероятность которая после этого считается задан ной.

Справедливо следующее утверждение: сумма независимых слу чайных величин, каждая из которых распределена по нормальному ГЛАВА ТОЧЕЧНЫЕ И ИНТЕРВАЛЬНЫЕ ОЦЕНКИ закону, также распределена по нормальному закону. Отсюда выте кает, что величина X распределена по нормальному закону.

Выше было показано (см. (1)), что Ее распределение является нормальным с математическим ожида нием 0 и дисперсией 1. Пользуясь этим обстоятельством, можно по данному найти такое число чтобы выполнялось соотношение < U < = (площадь области, заштрихованной на равна Замечание. Индекс 7 выражении подчеркивает зависимость и от Если по контексту понятно, какое имеется в виду, то, опуская индекс, мы будем писать просто и.

Справедливо равенство < U < = < U < = ОЦЕНКИ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ Напомним, что функция служит для вычисления вероятнос тей, связанных с нормальным распределением. Таблица ее значений имеется в приложении (в конце книги).

Для нахождения числа достаточно решить уравнение Число ищется по заданному числу при помощи таблицы значе ний функции Получив мы можем утверждать, что вероятность события < U < или, более подробно, равна Последнее неравенство равносильно следующему:

Таким образом, с доверительной вероятностью математическое ожидание лежит в интервале где — — (2) Число = (4) называется погрешностью оценки математического ожидания. С до верительной вероятностью можно считать, что оценка X отклоня ется от истинного значения не более чем на е (рис. 2).

Из формулы (4) видно, что с ростом числа данных п погрешность становится все меньше, т. е. доверительный интервал сужается. В свою очередь, чем меньше погрешность, тем больше данных необ ходимо собрать для ее достижения. Если требуемая погрешность е задана, то можно найти соответствующий объем данных:

(5) При этом, разумеется, п должно быть целым числом. Так как сбор данных часто связан с некоторыми затратами, обычно берут мини мальное целое п, удовлетворяющее неравенству (5).

Пример 2. При измерении нормальной случайной величины со стандартным отклонением, равным 5, и неизвестным математиче ским ожиданием получена следующая выборка:

3, 12, 8, 14, 15, 6, 19, 10, 15, 6.

Требуется найти: 1) интервал, содержащий параметр /i с довери тельной вероятностью 0,95;

2) погрешность оценки X, соответ ствующую этой доверительной вероятности.

В данном случае 5, п = 10, = 0,95.

Для точечной оценки получаем - 3 + 12 + 8 + 14 + 15 + 6 + 19 + 10 + 15 + X = 10,8.

Решим уравнение = 0,95, = = 0,475.

Для этого следует найти число 0,475 или ближайшее к нему в табли це среди значений функции (таблица дана в приложении). Бли жайшее число — 0,477. Соответствующее ему значение аргумента = 2,0.

ОЦЕНКИ ВЕРОЯТНОСТИ СОБЫТИЯ Теперь осталось воспользоваться формулами (2) и (3), подставив туда данные в условии п и найденные X, Имеем:

= 10,8 - 2 • 10,8 - 3,16 7,64, = 10,8 + 2 • 10,8 + 3,16 13,96.

V Таким образом, искомым доверительным интервалом является ин тервал (7,64;

13,96).

Для погрешности е получаем следующее значение:

= 3,16.

14.4. Оценки вероятности события Пусть некоторое событие происходит в результате единичного испы тания с вероятностью Р, которая нам неизвестна. Однако ситуация позволяет многократно повторить испытание и подсчитать, сколько раз произошло указанное событие. Более точно: пусть произведено п испытаний, в которых событие произошло т раз. Здесь в отличие от предыдущих рассмотрений исходными данными для анализа будут всего два числа — п и т.

Задача, которую мы будем рассматривать, заключается в отыс кании оценки неизвестной вероятности Р по имеющимся данным п, т и доверительной вероятности Точечная оценка Не вызывает сомнений, что точечная оценка Р вероятности Р опре деляется следующим соотношением:

Докажем несмещенность и состоятельность этой оценки.

При любом фиксированном п величина т является случайной величиной с биномиальным законом распределения:

т = Пользуясь этим обстоятельством, можно найти границы довери тельного интервала методом, сходным с методом вычисле ния доверительного интервала для математического ожидания нор мального распределения. Выпишем сразу результат:

ЗАДАНИЯ И ОТВЕТЫ где — решение уравнения = (9) Пример 3. Из 200 случайным образом отобранных изделий не которой фирмы 10 оказались бракованными. Найти доверительный интервал, содержащий с надежностью 0,99 долю бракованных изделий среди всей продукции фирмы.

Решение. Здесь п = 200, = 10, = 0,99.

Применяя формулы (9), (6), (7), (8), получаем, что 0,495, и = 2, (напомним, что это значение находится по таблице), (это точечная оценка), Таким образом, доверительный интервал оказался следующим:

(0,01;

0,09). Иными словами, с доверительной вероятностью 0,99 до ля бракованных изделий лежит в промежутке между 1% и 9%.

14.5. Задания и ответы 1. Выборка из большой партии электроламп содержит 100 ламп.

Средняя продолжительность работы лампы из выборки оказалась равной 1000 ч. Найти 95%-й доверительный интервал для средней ГЛАВА ТОЧЕЧНЫЕ И ОЦЕНКИ продолжительности работы лампы, случайно выбранной из всей партии, если время работы является нормально распределенной слу чайной величиной со стандартным отклонением 40 ч.

Ответ: (992, 1008).

2. У нормально распределенной случайной величины стандарт ное отклонение равно 2. Найти минимальный объем выборки, при котором с надежностью, не меньшей 0,8, погрешность оценки мате матического ожидания будет меньше 0,3.

Ответ: 76.

3. Из 400 случайным образом отобранных изделий некоторой фирмы 20 оказались бракованными. Найти доверительный интер вал, содержащий с надежностью долю бракованных изде лий среди всей продукции фирмы.

Сравните полученный результат с тем, который был получен при разборе примера 3.

Ответ: (0,02;

0,08).

!

Глава КОРРЕЛЯЦИЯ И РЕГРЕССИЯ Одним из важных приложений методов математической статисти ки является установление зависимости между двумя или более на блюдаемыми величинами. При этом наряду с раздельным анализом выборок, составленных из значений этих величин, возможен и сов местный анализ. Ниже рассматриваются некоторые методы такого анализа.

15.1. Корреляция Рассмотрим ситуацию, когда в результате эксперимента измеряется не одна, а сразу две случайные величины, скажем X и Примера ми здесь могут служить врачебный осмотр, где у каждого пациента измеряют рост и вес;

измерение средней температуры воздуха в двух городах в течение определенного дня;

проверка квалификации ра бочих, когда фиксируются производительность и стаж работы.

Итак, исходными данными являются пары чисел (точки) (1) где п — число испытаний. Наряду с анализом величин X и Y по отдельности представляет интерес исследование возможной зависи мости между ними. Являются ли величины X и Y независимыми?

Если же между ними имеется некоторая зависимость, то какова она?

Обратимся к рис. 1-4. На них изображены различные виды графи ков (или диаграмм) рассеяния, т. е. нанесены точки (1). Величины X и Y на рис. 1, по-видимому, независимы: зная, какое значение при няла величина X, ничего нельзя сказать о значении Y. На рис. 2- зависимость налицо: зная значение, которое приняла величина X в ГЛАВА 15. КОРРЕЛЯЦИЯ И РЕГРЕССИЯ результате испытания, можно довольно точно сказать, каково зна чение Зависимость на рис. 3 и 4 близка к линейной, т. е. точки заметным образом группируются вокруг некоторой прямой. В таких случаях говорят, что величины X и Y коррелированы. Существует простой способ определения степени коррелированности случайных величин.

Он основан на вычислении коэффициента корреляции Если по нятно, о каких случайных величинах идет речь, будем вместо писать просто Коэффициент корреляции обладает следующим свойством:

15.1. КОРРЕЛЯЦИЯ При этом чем ближе к нулю, тем слабее корреляция. И наоборот, чем ближе к 1 или 1, тем сильнее корреляция, т. е. зависимость между X и Y близка к линейной. Если в точности равно 1 или —1, то точки (1) лежат на одной прямой.

Подчеркнем, что коэффициент корреляции отражает степень ли нейной зависимости между величинами. При наличии ярко выра женной зависимости другого вида (например, квадратичной) он мо жет быть близок к нулю.

Приведем формулы для вычисления п п Пример. Рассмотрим проблему, которая стоит перед администра цией некоторого крытого стадиона, где проходят матчи, концерты и другие развлекательные мероприятия. Перед каждым таким меро приятием требуется оценить, какое количество зрителей придет, это необходимо для оптимальной организации работы различных вспо могательных служб. Один из подходов к решению этой проблемы — учет предыдущего опыта. В частности, можно предположить, что окончательное число зрителей сильно зависит от того, сколько биле тов продано за день до мероприятия (как раз за сутки определяется план работы вспомогательных служб).

Пусть опыт первых пяти мероприятий этого года таков:

Каков коэффициент корреляции между числом проданных накануне билетов и числом зрителей?

ГЛАВА 15. КОРРЕЛЯЦИЯ И РЕГРЕССИЯ Решение. Примем число билетов за X, а число зрителей за Y. В таблице даны пять реализаций пары случайных величин — пары чисел г — 1,...,5. Для расчета коэффициента корреляции удобно найти суммы Эти суммы подставим затем в формулы (2)-(5). Имеем:

Таким образом, коэффициент корреляции оказался довольно близким к единице. Этим обстоятельством можно воспользоваться для прогнозирования числа зрителей по имеющейся накануне ин формации. О том, каким образом это делается, см. в продолжении этого примера на с. 290.

15.2. РЕГРЕССИЯ 15.2. Регрессия Предположим, что зависимость между случайными величинами X и Y близка к линейной (в этом случае коффициент корреляции г близок к 1 или —1). Тогда естественно ставить вопрос об отыскании функции (6) которая наилучшим образом выражает зависимость Y от X. Для нахождения такой функции пользуются методом наименьших ква дратов.

Итак, пусть даны п пар чисел (иначе говоря, п точек):

•••, Требуется найти такую прямую, чтобы сумма квадратов "отклоне ний" этих точек от прямой (6) была как можно меньше. Это означает, что выражение (7) должно быть минимальным (на рис. 5 отклонения изображены в ви де вертикальных отрезков).

Рис. ГЛАВА 15. КОРРЕЛЯЦИЯ И РЕГРЕССИЯ Выражение (7) является функцией двух переменных а и b (поскольку результаты наблюдений заданы). Можно показать, что выражение (7) принимает минимальное значение, если величины а и b связаны соотношениями Эта система имеет единственное решение:

Найдя значения неизвестных параметров и 6, мы найдем тем са мым прямую (6), наилучшим образом выражающую статистическую связь между величинами X и Полученная прямая называется прямой регрессии Y на X.

примера (начало см. на с. 287). Для прогнози рования числа зрителей надо найти прямую регрессии Y на X. Под ставим найденные значения в формулы (8). Получаем О а = b 1,72.

0,6304 ' ' Таким образом, прямая регрессии имеет уравнение у = 1,58 • х + 1,72.

Если, например, за день до мероприятия продано 4300 билетов, то предполагаемое число зрителей составляет у = 1,58 • 4,3 + 1,72 8,514 8,5 тыс.

Если прямая регрессии найдена, можно оценить, насколько хо рошо она приближает результаты наблюдений. Подставляя в вы ражение (7) найденные значения а и вычислим так называемую среднюю погрешность или ошибку уравнения ре грессии, которую будем обозначать буквой (дельта):

15.3. ЗАДАНИЯ И ОТВЕТЫ Величина 8 дает представление о том, какую в среднем длину имеют вертикальные отрезки на рис. 5. И чем меньше тем ближе резуль таты наблюдений к найденной регрессионной прямой.

Замечание 1 (нелинейная регрессия). Вычисление средней квадра тической погрешности имеет большое значение тогда, когда наряду с моделью линейной зависимости Y от X рассматриваются и другие модели, другие уравнения зависимости. (Например, в случае, приве денном на рис. 2, в качестве уравнения зависимости Y от X уместно подбирать не прямую, а параболу.) Для каждого из уравнений сле дует найти свою среднюю квадратическую погрешность, после чего выбрать из них минимальную. Соответствующая модель и является наилучшей (конечно, при отсутствии каких-либо дополнительных соображений).

Если, например, регрессионная кривая является параболой = ах2 + Ьх + с, то средняя квадратическая погрешность вычисляется по формуле Замечание 2 (множественная регрессия). Возможно рассмотрение зависимости параметра Y от нескольких параметров например, в таком у = + + 6, где числа • • •, Ъ подлежат определению.

15.3. Задания и ответы 1. При измерении в баллах результатов тестирования по истории (X) и географии (К) получены следующие пары чисел для четы рех школьников: (2, 2), (4, 5), (6, 7), (8, 10). Найдите коэффициент корреляции и прямую регрессии Y на X.

Ответ: = 0,997, у — — 0,5.

ГЛАВА 15. КОРРЕЛЯЦИЯ И РЕГРЕССИЯ 2. Проводится исследование на некоторый вид товара.

Пробные продажи показали следующие данные о зависимости днев ного спроса от цены:

Требуется:

а) определить коэффициент корреляции между ценой X спро сом построить прямую регрессии Y на б) исходя из данных пункта а) определить спрос при цене 15 руб.

за ед. товара.

Ответ: а) = -0,986;

у = + 134,5;

б) 65.

3. В ситуации, описанной в предыдущей задаче, была предложена другая модель зависимости спроса от цены:

У + 6.

Какая модель является более адекватной экспериментальным данным?

, Глава ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 16.1. Основные понятия. Примеры Во многих случаях возникает необходимость на основе имеющихся данных решить, справедливо ли то или иное суждение. Например, верно ли, что А более меткий стрелок, чем В, что от дома до работы быстрее доехать на метро, а не на автобусе, что новое лекарство лучше, чем старое.

Если исходные данные таких суждений носят случайный харак тер (а во всех приведенных примерах это именно так!), то и ответы можно давать лишь с определенной степенью уверенности. Однако если вероятность ошибки мала, то суждение можно считать практи чески достоверным, как обычно и решают на практике.

Итак, статистическая гипотеза — это предположение о слу чайной величине, проверяемое по выборке (по результатам наблю дений). Процедура сопоставления высказанной гипотезы с выбороч ными данными называется проверкой гипотезы.

Пример 1. Подбросим монету 10 раз. На основании полученных при этом результатов можно судить о том, является ли монета пра вильной, т. е. одинаковы ли вероятности выпадения герба и цифры.

Возможные гипотезы: 1) монета правильная, 2) чаще выпадает герб, 3) чаще выпадает цифра и т. п.

Важно, что исходное предположение должно быть формализова но в терминах параметров, участвующих в задаче. Выбрав в каче стве параметра вероятность р выпадения герба, приведенные выше гипотезы можно записать так: 1) р = 1/2, 2) р > 1/2, 3) р < 1/2.

ГЛАВА 16. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ Пример 2. А и В сделали по 3 выстрела в мишень.

Гипотезы: 1) А стреляет лучше, 2) В стреляет не хуже, 3) А и В стреляют с одинаковой меткостью и т. п. Читателю предлагается подумать над вопросом: как в данном случае можно формализовать гипотезы?

Обозначим через множество всевозможных результатов наблю дения (выборок) Зафиксируем, далее, гипотезу (по каким-либо причинам наиболее важную) и будем называть ее основной или ну левой. Пусть мы хотим проверить ее, сопоставив с другой, альтер нативной гипотезой (альтернативных гипотез может быть и не сколько, и даже бесконечно много).

Выделим в область S исходя из следующих соображений: если гипотеза верна, то наступление события G S маловероятно.

Записывается это так:

= а, где число близко к нулю. Иными словами, вероятность события G S при условии, что верна гипотеза равна близкому к нулю числу Это число называется уровнем значимости гипотезы а область S — критической областью гипотезы Замечание. Слова "число близко к нулю" могут быть уточнены лишь применительно к конкретной ситуации. Реальная ситуация принятия решения существенно влияет на критерий, какую веро ятность считать малой. Например, при приеме на работу того или иного сотрудника вероятность ошибки = 0,01 следует в большин стве случаев считать малой. Если же речь идет о вероятности отказа тормозной системы автомобиля, то та же вероятность = 0,01 недо пустимо высока (в среднем один отказ на каждые сто торможений).

Мы будем обычно полагать равным 0,01 либо 0,05.

Будем считать, что если событие S все-таки произошло, то гипотеза отвергается. При этом, разумеется, можно допустить ошибку, заключающуюся в том, что гипотеза отвергается, хотя она верна. Это так называемая ошибка первого рода. Ее вероятность равна Возможна и ошибка второго рода, которая состоит в том, что гипотеза принимается, хотя она неверна, а верна одна из аль тернативных гипотез. В случае когда альтернативная гипотеза Н\ единственна и при этом однозначно определено вероятностное рас пределение на можно вычислить вероятность ошибки второго 16.1. ОСНОВНЫЕ ПОНЯТИЯ. ПРИМЕРЫ рода (в предположении, что верна гипотеза Рассмотрим процесс проверки статистической гипотезы на приме ре диагностики туберкулеза (пример принадлежит одному из осно воположников математической статистики — Ю. Нейману).

Пример 3. Представим себе, что в некоторой клинике при об следовании делается несколько рентгеновских снимков пациента с целью обнаружения возможных признаков начинающегося туберку леза. Допустим, что толкование нескольких снимков, принадлежа щих одному и тому же пациенту, производится так, чтобы обеспечить независимость диагноза по каждому снимку от выводов, сделанных по предыдущим снимкам. Этого можно достигнуть, предлагая рент генологу для просмотра в случайном порядке снимки, принадлежа щие разным людям.

В дальнейшем мы будем употреблять термин "рентгеновский ана лиз" для обозначения комбинации из двух операций: производства снимка и толкования его рентгенологом. Таким образом, когда мы говорим, что проделано п рентгеновских анализов индивидуума, мы имеем в виду, что сделано п снимков и по каждому снимку поставлен диагноз.

Пусть прошлый опыт работы клиники выражается в следующем:

1) если пациент не несет никаких следов туберкулеза, то вероят ность того, что отдельный рентгеновский снимок будет ошибочным и у пациента будет признан туберкулез, равна = 0,01;

2) если данный пациент страдает туберкулезом в умеренной фор ме, то вероятность того, что отдельный рентгеновский анализ опре делит болезнь, равна = 0,6. (Для простоты мы игнорируем кате горию пациентов, страдающих туберкулезом в тяжелой форме.) Предположим, что для каждого пациента делается п = 5 неза висимых анализов. Обозначим через число анализов, по которым вынесен положительный ответ. Предположим далее, что если = 0, то пациент считается совершенно здоровым, в противном же случае он подвергается более тщательному обследованию по поводу тубер кулеза.

Только что описанная процедура — это пример испытания стати стической гипотезы.

Гипотез в данном случае две: первая — пациент страдает тубер кулезом, вторая — пациент здоров. По-видимому, в данном случае важнее не проглядеть начинающуюся болезнь, чем не беспокоить ГЛАВА 16. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ пациента лишним анализом. Поэтому в качестве основной гипотезы примем первую — "пациент страдает туберкулезом". Вторая ги потеза является отрицанием основной, обозначим ее — "пациент здоров".

Множеством всевозможных результатов наблюдений будет (рис. 1), поскольку положительный результат могут иметь анализов.

Установившаяся практика состоит в том, что туберкулез подозре вается во всех случаях, когда хотя бы один рентгеновский анализ дал положительный ответ. Это означает, что критическая область S состоит из одной выборочной точки — 0. То есть лишь если среди п 5 рентгеновских анализов нет ни одного положительного, гипотеза о том, что пациент болен, отвергается.

Найдем вероятность ошибки первого рода. Она будет иметь ме сто, если гипотеза истинна, но выборочная точка займет поло жение = 0:

= = = (1 - = (0,4)5 = 0,01024.

Ошибка второго рода будет иметь место, если истинна гипотеза а выборочная точка не займет положения = 0. Вероятность /5 ошибки второго рода равна Полученные формулы можно интерпретировать следующим об разом. Если все сделанные предположения приближенно выполня ются и в клинике постоянно используется описанная процедура многократных рентгеновских анализов, то окончательный диагноз, основанный на пяти анализах, будет отрицательным приблизи тельно для одного процента всех больных туберкулезом пациентов 16.1. ОСНОВНЫЕ ПОНЯТИЯ. ПРИМЕРЫ (а 0,01 = 1%) и приблизительно для 95% всех пациентов, которых не коснулась болезнь (1 — 0,05 = 5%).

Рассмотрим еще один пример процедуры проверки статистиче ской гипотезы.

Пример Крупная партия товара может содержать дефект ные изделия. Поставщик полагает, что их доля составляет 3%, по купатель — 20%. Достигнута следующая договоренность: поставка состоится, если при проверке 10 случайно отобранных изделий будет обнаружено не более одного дефектного.

Сформулируйте нулевую и альтернативную гипотезы. Опреде лите критическую область и область принятия нулевой гипотезы.

Сформулируйте, в чем состоят ошибки первого и второго рода, най дите их вероятности.

Решение. Если смотреть на ситуацию с точки зрения покупателя, то нулевой гипотезой следует, по-видимому, считать гипотезу о 20% дефектных изделий. Альтернативная гипотеза соответствует версии поставщика — дефектных изделий 3%.

Поскольку отбирается 10 изделий и затем фиксируется число де фектных, то множеством всевозможных результатов испытаний бу дет:

fi = так как может оказаться 0, 1, 2,..., 10 дефектных изделий. По условиям поставки гипотеза покупателя отвергается в случае 1, так что критическая область такова:

s Соответственно область принятия нулевой гипотезы:

{2,3,..., 10}.

Ошибка первого рода состоит, напомним, в следующем: нулевая гипотеза отвергается, хотя она верна. В данном случае это означает:

партия закупается, хотя в ней 20% дефектных изделий.

Ошибка второго рода состоит в принятии нулевой гипотезы, в то время как верна альтернативная. Это означает, что поставка не со стоится, хотя в партии лишь 3% дефектных изделий.

Найдем теперь вероятности этих ошибок.

Если нулевая гипотеза верна, то вероятность того, что одно случайно выбранное изделие окажется дефектным, составляет 0,2.

20 ГЛАВА 16. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ Ошибка первого рода произойдет, если из 10 изделий дефектным будет не более чем одно (т. е. 0 либо 1).

Заметим, что в случае истинности гипотезы число дефектных изделий является биномиальной случайной величиной 0,2).

Поэтому 0) = (0,8)10 0,107, = = Теперь можно вычислить вероятность ошибки первого рода:

= = + = = = 0,107 + 0,268 0,375.

Если верна альтернативная гипотеза то вероятность выбрать дефектное изделие составляет 0,03. Ошибка второго рода произо шла, если из 10 изделий дефектными окажутся два или более.

В случае истинности гипотезы число дефектных изделий также является биномиальной случайной величиной, но с другим параметром — 0,03). Поэтому = 0) = (0,97)10 и 0,737, = 1) = 10 • (0,97)9 • 0,03 0,228.

Таким образом, для вероятности 0 ошибки второго рода получаем:

Замечание. Из вероятностей и можно заключить, что оговоренная процедура проверки выгодна скорее поставщику.

16.2. Проверка биномиальных гипотез В этом разделе мы рассмотрим один частный вид гипотез — гипо тезы, связанные с вероятностью события. Проверка таких гипотез связана с биномиальным распределением, поэтому их называют би номиальными гипотезами. Основное отличие от предыдущих рассмо трений в том, что там вероятность ошибки определялась исходя из критической области и области принятия нулевой гипотезы. Теперь мы, напротив, будем искать критическую область исходя из задан ного уровня значимости 16.2. ПРОВЕРКА БИНОМИАЛЬНЫХ ГИПОТЕЗ Пример 5. О некотором игральном кубике было высказано мне ние, что при его бросании "шестерка" выпадает слишком часто. Тре буется проверить, так ли это?

Понятно, что в такой формулировке задача поставлена не впол не четко. Для уточнения определим сначала нулевую и альтерна тивную гипотезы. Поскольку вероятность выпадания "шестерки" у правильного кубика составляет 1/6, то имеем нулевую гипотезу Альтернативную гипотезу естественно выбрать следующим образом:

т. е. "шестерка" выпадает чаще, чем это должно быть. Такая аль тернативная гипотеза называется правосторонней. Другие два вида альтернативных гипотез рассмотрены в последующих примерах.

Другое обстоятельство, требующее уточнения: в чем будет состо ять испытание, на основании которого нулевая гипотеза будет при нята либо отвергнута? Предположим, что испытание состоит в 120 кратном бросании кубика. При этом фиксируется число выпаданий "шестерки", которое обозначим со.

Далее, необходимо выбрать уровень значимости Напомним, что это вероятность отвергнуть нулевую гипотезу при условии, что она верна. Положим, например, = 0,01.

В данном случае множество всевозможных результатов испыта ний fi будет таким:

{0,1,..., 120}, поскольку при 120-кратном бросании кубика "шестерка" может вы пасть от 0 до 120 раз включительно.

Теперь осталось определить критическую область S. Эта задача уже формализована. Действительно, если "шестерка" выпала, ска жем, 50 раз, то нулевую гипотезу следует отвергнуть. А если 40 раз?

Или 30? Ясно, что критическая область S здесь имеет вид +..., 120}, где — число, подлежащее определению. Такая критическая об ласть называется правосторонней, она как бы "прижата" к правой границе множества ГЛАВА 16. ПРОВЕГКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ Для нахождения критической области воспользуемся тем, что чи сло выпаданий "шестерки" в 120 испытаниях — биномиальная случайная величина, которая может быть приближена нормальной случайной величиной. Если р = 1/6 (верна гипотеза Но), то Найдем теперь число для которого = 0,01, где — критическое значение, которое разделяет критическую область и область принятия гипотезы. Как уже отмечалось, крити ческая область здесь является правосторонней (рис. 2).

Можно убедиться, что правостороннее критическое значение вычисляется по формуле (1) где — решение уравнения - 1 - 2а.

Имеем:

= = 2,3, = 20 + 29,2.

Таким образом, если нулевая гипотеза верна, то вероятность выпа дания "шестерки" более чем 29 раз очень мала. В итоге получаем {30, 31,..., 100} 16.2. ПРОВЕРКА БИНОМИАЛЬНЫХ ГИПОТЕЗ (т. е. 30). Соответственно область принятия нулевой гипотезы такова:

{0,1,..., 29}.

Замечание. Напомним, что называется также вероятностью ошиб ки первого рода. Вероятность ошибки второго рода здесь является не числом, а функцией поскольку гипотеза не задает од нозначно закон распределения. Предоставляем заинтересованному читателю самостоятельно определить вид функции В рассмотренном примере критическая область была односто ронней, в частности правосторонней. Левосторонняя критическая область соответствует альтернативным гипотезам вида р < Ле востороннее критическое значение находится по формуле = (2) 3).

Рис. В следующем примере критическая область двусторонняя.

Пример 6. О некоторой монете утверждается, что она правиль ная, т. е. вероятности выпадания герба и цифры равны между со бой. Монету подбросили 100 раз, при этом 70 раз выпал герб, а раз — цифра. Проверить утверждение о правильности монеты на 5%-м уровне значимости (т. е. на уровне значимости — 0,05).

Здесь нулевая и альтернативная гипотезы формулируются сле дующим образом:

ГЛАВА 16. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ где р — вероятность выпадания герба. Здесь альтернативная гипоте за, как и критическая область, является двусторонней. Это обусло влено тем, что нет предположений относительно более частого либо более редкого выпадания герба.

Множество всевозможных результатов испытаний (в данном случае это количество выпаданий герба) составляют целые числа от 0 до 100:

= Число выпаданий герба — это биномиальная случайная вели чина ( 100, ) • Следовательно, На рис. 4 изображена двусторонняя критическая область. Критиче ские значения и вычисляются по формулам (3) где — решение уравнения 1 - а.

В данном случае получаем = = 2, = 50 - 5 • 2 = = 50 + 5 • 2 = 60.

16.2. ПРОВЕРКА БИНОМИАЛЬНЫХ ГИПОТЕЗ Таким образом, критическую область составляют значения до и больше 60:

{0,1,..., {60, 61,..., 100}.

Отметим, что при = 40 либо со = 60 имеет смысл, по-видимому, не принимать окончательного решения о принятии либо отвержении нулевой гипотезы. Но в данном случае испытание дало результат со = 70, поэтому гипотеза отвергается в пользу гипотезы Окончательный вывод таков: монета правильной не является.

В общем случае процедура проверки биномиальной гипотезы со стоит из следующих шагов:

1) формулировка нулевой и альтернативной гипотез;

2) выбор уровня значимости 3) определение объема выборки п;

4) описание множества всевозможных результатов наблюдений 5) вычисление критической области и области принятия нуле вой гипотезы (по одной из формул (1), (2) либо (3));

6) выполнение эксперимента (сбор данных) и принятие решения.

Пример 7. Производственная линия выпускала 5% бракован ных товаров. Было предложено усовершенствование, призванное снизить процент брака. После переналадки линии на осмотр посту пило 300 единиц товара, из которых бракованными оказались 9 еди ниц. Можно ли на 1%-м уровне значимости считать, что качество продукции производственной линии улучшилось?

Решение. Здесь нулевая гипотеза состоит в том, что линия по-преж нему выпускает 5% брака:

Альтернативная гипотеза является левосторонней — процент брака уменьшился:

Уровень значимости и объем выборки даны в условии:

Если при проверке фиксируется число бракованных изделий со, то эта величина может принимать значения из множества ГЛАВА 16. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ В случае истинности гипотезы величина является биноми альной случайной величиной Вг (300;

0,05). Следовательно, Таким образом, критическая область может быть записана в виде S = 6}.

Область принятия нулевой гипотезы соответственно такова:

{7,8,...,300}.

Если в выборке бракованными оказались 9 единиц товара, то сле дует принять нулевую гипотезу. Окончательный вывод: имеющиеся данные не дают оснований считать, что качество продукции улуч шилось.

I 16.3. согласия (хи-квадрат) При проверке биномиальных гипотез требовалось проверить гипо тезу о равенстве неизвестной вероятности некоторому числу. Под черкнем, что речь шла об уточнении значения одного параметра — вероятности. Иной характер имеет ситуация, когда требуется про верить гипотезу о равенстве определенным значениям нескольких вероятностей (иначе говоря, о законе распределения в целом). В та ких случаях применяются так называемые критерии один из которых мы и рассмотрим.

Пусть в результате некоторого испытания может произойти одно из г событий вид:

равна 1. гипотезой невыполнение хотя бы одного из этих равенств.

16.3. КРИТЕРИЙ СОГЛАСИЯ (ХИ-КВАДРАТ) Исходными данными для проверки гипотезы ЯВЛЯЮТСЯ резуль таты п независимых испытаний. Пусть эти результаты следующие:

событие произошло раз, событие произошло раз, событие произошло раз.

Очевидно, что + • • • + = п.

Подсчитаем величину (хи-квадрат) по формуле Это значение будет решающим при проверке гипотезы. Величина показывает, насколько экспериментальные значения расходят ся с теоретически наиболее вероятными значениями Отметим, что величина может принимать лишь неотрицательные значения (отсюда и обозначение Сама проверка гипотезы осуществляется следующим образом.

Выбирается уровень значимости 0,05 либо — 0,01 (возможны, разумеется, и другие значения). Затем вычисляется после чего находится критическое значение (зависящее от и к) по таблице:

Если то гипотеза отвергается, в противном случае — принимается.

Замечание 1. Таблица критических значений (для удобства она повторена в приложении — в конце книги) получена из некоторых теоретических соображений. Дело в том, что при истинности нулевой гипотезы величина оказывается распределенной (приближенно) в ГЛАВА 16. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ соответствии с законом распределения случайной величины — с к степенями (распределение называ ется также распределением К. Пирсона). При этом критическое зна чение определяется из условия Р > = а.

Что касается самой величины то она определяется как сум ма квадратов к независимых стандартных нормальных случайных величин:

где г = Отметим также, что Замечание 2. Критерий применяют тогда, когда все величины достаточно велики, например при > 5, = 1, 2,..., Пример 8. При 4040 бросаниях монеты французский естество испытатель получил 2048 выпаданий герба и 1992 выпа дания цифры. На уровне значимости = 0,05 проверим гипотезу о том, что монета была правильной.

Решение. Здесь в результате испытания может произойти одно из двух событий — выпадание герба либо вынадание цифры. Поэтому имеем:

— {выпадание = {выпадание п = 4040, = 2048, 1992.

Нулевая гипотеза — 16.3. КРИТЕРИЙ СОГЛАСИЯ (ХИ-КВАДРАТ) Число степеней свободы к в данном случае равно — 1 = 2 — 1 = 1.

По известным значениям = 0,05, к = 1 находим в таблице 3,8.

Так как 2 X то нулевая гипотеза принимается — монета была правильной.

Пример 9. Некоторая фирма владеет тремя магазинами, рас положенными недалеко друг от друга. Руководство фирмы реши ло выяснить, посещают ли покупатели все три магазина одинако во охотно либо имеется некоторое различие. (Это различие может быть, по мнению руководства, связано с более или менее выгодным расположением магазинов, разной квалификацией персонала и т. п.) Для проверки была собрана информация о количестве покупате лей, сделавших покупки в течение недели. Оказалось, что в первом магазине это число составляет 160 человек, во втором — 225, в тре тьем Решение. Здесь нулевой гипотезой будет равенство вероятностей по сещения покупателем первого второго и третьего ма газинов:

: = = Рз = В результате испытания получаем 160, 225, 215, п = 160 + 225 + 215 600.

Вычислим величину _ (160 - 200)2 (225 - 200)2 (215 200 ~ 200 200 " ' Обратимся теперь к таблице критических значений (при к = 2).

Даже на уровне значимости = 0,01 имеем 9,2. Таким обра зом, > Хкр Поэтому, видимо, разницу в посещаемости магазинов в течение не дели нельзя объяснить случайными колебаниями.

ГЛАВА 16. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 16.4. Задания и ответы 1. Ваш друг утверждает, что он умеет различать на вкус два близких сорта вина если и не всегда, то хотя бы в четырех случаях из пяти.

Вы же склонны считать, что он просто угадывает.

Сформулируйте оба этих мнения в виде статистических гипотез и предложите какую-либо процедуру проверки. В чем состоят ошибки первого и второго рода?

2. Урна содержит большое количество белых и черных шаров.

100 раз производится следующее действие: из урны наугад достается шар, фиксируется его цвет, затем шар опускается обратно в урну, после чего шары перемешиваются. Оказалось, что 67 раз достали белый шар, 33 раза — черный. Можно ли на 5%-м уровне значимости принять гипотезу о том, что доля белых шаров в урне составляет 0,6?

Ответ: да.

3. Обычно применяемое лекарство снимает послеоперационные боли у 80% пациентов. Новое лекарство, применяемое для тех же целей, помогло 90 пациентам из первых 100 оперированных. Мож но ли на уровне значимости = 0,05 считать, что новое лекарство лучше? А на уровне — 0,01?

Ответ,: да.

4. Игральный кубик бросили 60 раз, при этом числа 1, 2, 3, 4, 5, 6 выпали соответственно 12, 9, 11, 8, 7 раз. Можно ли на 5%-м уровне значимости отвергнуть гипотезу о симметричности кубика?

Ответ: нет.

5. Трое рабочих работают на трех одинаковых станках. В конце смены первый рабочий изготовил 60 деталей, второй — 80, третий — 100 деталей. Можно ли на уровне значимости = 0,01 принять ги потезу о том, что производительности труда первых двух рабочих равны между собой и в 2 раза меньше производительности третьего рабочего?

Ответ: да.

Часть III ИГРОВЫЕ МЕТОДЫ В практической деятельности весьма часто приходится рассматри вать явления и ситуации, в которых участвуют две или более сто роны, имеющие различные интересы и обладающие возможностями применять для достижения своих целей разнообразные действия.

Подобные явления и ситуации принято называть конфликтными или просто конфликтами.

Типичный конфликт характеризуется тремя основными состав ляющими:

1) заинтересованными сторонами, 2) возможными действиями этих сторон, 3) интересами сторон.

Конфликтная ситуация, взятая из реальной жизни, как правило, довольно сложна. К тому же ее изучение затруднено наличием раз ных обстоятельств, часть из которых не оказывает сколько-нибудь существенного влияния ни на развитие конфликта, ни на его исход.

Поэтому для того чтобы анализ конфликтной ситуации оказался возможным, необходимо отвлечение от этих второстепенных факто ров, что при удачном стечении обстоятельств позволяет построить упрощенную формализованную модель конфликта, которую и при нято называть игрой. От реальной конфликтной ситуации игра от личается еще и тем, что ведется по вполне определенным правилам.

Необходимость изучения и анализа конфликтов, представляемых в виде упрощенных математических моделей (игр), вызвала к жизни специальный математический аппарат — теорию игр.

Опишем некоторые основные понятия, используемые в этой тео рии.

Заинтересованные стороны называются игроками. Любое возмож ное для игрока действие (в рамках заданных правил игры) называ ется его стратегией. В условиях конфликта каждый игрок выби ИГРОВЫЕ МЕТОДЫ рает свою стратегию, в результате чего складывается набор стра тегий, называемый ситуацией. Заинтересованность игроков в ситу ации проявляется в том, что каждому игроку в каждой ситуации приписывается число, выражающее степень удовлетворения его ин тересов в этой ситуации и называемое его выигрышем в ней.

В этих условиях протекание конфликта состоит в выборе каждым игроком своей стратегии и получении им в сложившейся ситуации выигрыша из некоторого источника.

На этом пути создается теория игр с выигрышами.

Однако оценка игроком ситуации путем предположения о своем выигрыше, вообще говоря, не всегда возможна практически и даже не всегда имеет смысл. В подобных случаях иногда удается вместо прямых численных оценок ситуаций указывать на их сравнительную предпочтительность для отдельных игроков.

На этом пути создается теория игр с предпочтениями, включа ющая в себя и теорию игр с выигрышами.

В дальнейшем мы ограничимся рассмотрением только игр с выи грышами.

Изучение игр можно проводить с различных точек зрения.

Мы будем стремиться к выработке принципов оптимальности, т. е. того критерия, по которому поведение игроков следует считать оптимальным (разум ным, целесообразным);

к выяснению реализуемости этих принципов, т. е. установлению существования оптимальных в выработанном смысле ситуаций, и отысканию этих реализаций.

Одной из плодотворных форм реализации представлений об оп тимальности можно считать понятие равновесия, при котором скла дывается такая (равновесная) ситуация, в нарушении которой не заинтересован ни один из игроков.

Именно ситуации равновесия могут быть предметом устойчивых договоров между игроками (ни у одного из игроков не будет мотивов к нарушению договора).

Кроме того, ситуации равновесия являются выгодными для ка ждого игрока: в равновесной ситуации каждый игрок получает наи больший выигрыш (разумеется, в той мере, в какой это от него за висит).

Если в игре ситуации равновесия (в пределах отпущенных воз можностей) нет, то, оставаясь в условиях стратегий, имеющихся у игроков, мы сталкиваемся с неразрешимой задачей.

ИГРОВЫЕ МЕТОДЫ При возникновении подобных случаев естественно ставить вопрос о таком расширении первоначального понятия стратегии, чтобы сре ди ситуаций, составленных из обобщенных стратегий, заве домо нашлись равновесные.

Если такие обобщенные стратегии существуют, то обычно они представляются некоторыми комбинациями исходных стратегий.

Для того чтобы отличать прежние стратегии от новых, первые называют а вторые — смешанными стратегиями.

плодотворным является представление смешанной стра тегии как случайного выбора игроками их чистых стратегий, при котором случайные выборы различных игроков независимы в сово купности, а выигрыш каждого из них определяется как математиче ское ожидание случайного выигрыша.

Таким образом, преобразованная игра обычно называется сме шанным расширением исходной игры.

Проиллюстрируем сказанное на примере одного из самых про стых, но одновременно и наиболее изученных и продвинутых классов игр, на так называемых матричных играх. Исследование матричных игр интересно еще и потому, что к ним могут быть приближенно све дены многие игры более общего вида.

Затем мы рассмотрим позиционные и биматричные игры, а также пример игры со многими участниками.

Глава МАТРИЧНЫЕ ИГРЫ Рассмотрим игру, в которой участвуют два игрока, причем каждый из них имеет конечное число стратегий.

Обозначим для удобства одного из игроков через в другого — через В.

Предположим, что игрок А имеет т стратегий:..., а игрок В — п стратегий: В\,. •., Пусть игрок А выбрал стратегию а игрок В — стратегию Будем считать, что выбор игроками стратегий и однознач но определяет исход игры — выигрыш игрока А и выигрыш игрока причем эти выигрыши связаны равенством Последнее условие показывает, что в рассматриваемых обстоя тельствах выигрыш одного из игроков равен выигрышу другого, взя тому с противоположным знаком. Поэтому при анализе такой игры можно рассматривать выигрыши только одного из игроков. Пусть это будут, например, выигрыши игрока А.

Если нам известны значения выигрыша при каждой паре стра тегий (в каждой ситуации) i — то, = п, то их удобно записывать или в виде прямоугольной таблицы, строки которой соответству ют стратегиям игрока А, а столбцы — стратегиям игрока В, ГЛА А МА ТРИЧНЫЕ ИГРЫ или в виде матрицы Полученная матрица имеет размер и называется матрицей игры или платежной матрицей (отсюда и название игры — мат ричная).

Рассматриваемую игру часто называют игрой т х п или т х п игрой.

Замечание. Матричные игры относятся к разряду так называемых антагонистических игр, т. е. игр, в которых интересы игроков прямо противоположны.

Пример 1. Каждый из двух игроков А В одновременно и неза висимо друг от друга записывает на листе бумаги любое целое число.

Если выписанные числа имеют одинаковую четность, то игрок А получает от игрока В 1 рубль, а если разную, то, наоборот, игрок А платит 1 рубль игроку В.

У игрока А две стратегии: А\ — записать четное число и — записать нечетное число.

У игрока В такие же две стратегии: — записать четное число и записать нечетное число.

Выбор игроками соответственно стратегий и однозначно оп ределяет исход игры: — выигрыш игрока А.

Матрица этой 2 х 2-игры имеет следующий вид:

(здесь строки соответствуют стратегиям игрока а столбцы стратегиям игрока В).

17.1. Равновесная ситуация Рассмотрим следующий пример.

Пример 2. Два игрока А не глядя друг на друга, кладут на стол по картонному кружку красного зеленого (д) ИЛИ синего (6) 17.1. РАВНОВЕСНАЯ СИТУАЦИЯ цвета, сравнивают цвета кружков и расплачиваются друг с другом так, как показано в матрице игры:

(напомним, что у этой 3 х 3-матрицы строки соответствуют страте гиям игрока А, а столбцы — стратегиям игрока В).

Считая, что эта 3 х 3-игра повторяется многократно, попробуем определить оптимальные стратегии каждого из игроков.

Начнем с последовательного анализа стратегий игрока не за бывая о том, что, выбирая стратегию игрока А, должно принимать в расчет, что его противник В может ответить на нее той из своих стратегий, при которой выигрыш игрока А будет минимальным.

Так, на стратегию он ответит стратегией (минимальный выигрыш равен —2, что на самом деле означает проигрыш игрока равный 2), на стратегию — стратегией или (минимальный выигрыш игрока А равен 1), а на стратегию — стратегией (минимальный выигрыш игрока А равен —3).

Запишем эти минимальные выигрыши в правом столбце таблицы:

Максимин (rnaxmin). Неудивительно, что игрок А останавливает свой выбор на стратегии при которой его минимальный выигрыш максимален (из трех чисел —2, 1 и —3 максимальным является 1), = 1.

Если игрок А будет придерживаться этой стратегии, то ему гаран тирован выигрыш, не меньший 1, при любом поведении противника.

Аналогичные рассуждения можно провести и за игрока В. Так как игрок В заинтересован в том, чтобы обратить выигрыш игрока А в минимум, то ему нужно проанализировать каждую свою стратегию с точки зрения максимального выигрыша игрока А.

Выбирая свою стратегию, игрок В должен учитывать, что при этом стратегией его противника А может оказаться та, при которой выигрыш игрока А будет максимальным.

Так, на стратегию он ответит стратегией (максимальный выигрыш игрока А равен 3), на стратегию — стратегией (ма ксимальный выигрыш игрока А равен 2), а на стратегию — стра тегией или (максимальный выигрыш игрока А равен 1).

ГЛАВА 11. МАТРИЧНЫЕ ИГРЫ Эти максимальные выигрыши записаны в нижней строке таблицы Минимакс Неудивительно, если игрок В остановит свой выбор на стратегии при которой максимальный выигрыш игрока А минимален (из трех чисел 3, 2 и 1 минимальным является 1), minmax = 1.

Если игрок В будет придерживаться этой стратегии, то при лю бом поведении противника он проиграет не больше 1.

Итак, в рассматриваемой игре числа и minmax совпали:

= minmax (соответствующие элементы в таблице выделены жирным шриф том):

Выделенные стратегии являются оптимальными для иг роков А и В, в следующем смысле:

при многократном повторении игры отказ от выбранной стратегии любого из игроков уменьшает его шансы на выигрыш (увеличивает шансы на проигрыш).

Pages:     | 1 || 3 |



© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.