Автор работы: Пользователь скрыл имя, 14 Ноября 2013 в 12:52, курсовая работа
Подобно линейному программированию теория игр (ТИ) также является одной из современных областей математики. Если при исследовании общей задачи линейного программирования мы определяли способ эффективного использования или распределения ограниченных ресурсов для достижения желаемых целей, то в ТИ нас интересует стратегия, с помощью которой достигается выигрыш, максимально возможный в данной игре. В то время, когда закладывались основы ТИ, замечательное соответствие между этими двумя задачами не было известно.
История развития теории игр
Основные понятия
Матричные игры в чистых стратегиях
Матричные игры в смешанных стратегиях
Связь между теорией игр и линейным программированием
Пример 1
Седловой
точкой является пара (iо = 3; jо = 1), при
которой u =
=
= 2.
Заметим,
что хотя выигрыш в ситуации (3;3) также
равен 2 =
=
, она не является седловой точкой, т.к.
этот выигрыш не является максимальным
среди выигрышей третьего столбца.
Пример 2
Из
анализа матрицы выигрышей
http://gendocs.ru/v1735/?cc=3
Матричные игры в смешанных стратегиях
Если седловая точка отсутствует, решение игры проводят в смешанных стратегиях и решают следующими методами:
http://math.semestr.ru/games/
Если
игра имеет седловую точку, то оптимальными
для игроков будут
2 9
6 3
В данном случае =3, а =6. Таким образом, игрок А может выиграть не менее 3, а игрок В может ограничить свой проигрыш (выигрыш игрока А) шесть единицами. Область между 3 и 6 остается как бы нейтральной, и каждый игрок может попытаться улучшить свой результат за счет этой области. Но как это сделать? Если игроки применяют свои наиболее предпочтительные стратегии А2 и В1, то игрок А выигрывает, а игрок В проигрывает 6 единиц. Это, конечно, устраивает игрока А, но невыгодно игроку В. Поэтому, если игрок В заметит, что игрок А предпочтительно использует свою стратегию А2, то он может перейти на свою стратегию В2 и понизить выигрыш игрока А до 2 единиц. В свою очередь игрок А может в ответ перейти на свою первую стратегию и выиграть уже 9 единиц. В свою очередь, узнав об этом, игрок В может снова сменить стратегию и понизить выигрыш игрока А до 2 единиц.
Из этих рассуждений ясно, что игрокам надо так выбирать свои чистые стратегии в очередной партии, чтобы партнер не догадался об очередном выборе. Этого можно добиться, используя случайный выбор, однако вероятности выбора стратегий необходимо определить. Анализ игры без седловой точки показывает, что игрок А выигрывает больше максимина , получаемого им при максиминной стратегии, если в ходе игрыбудет пользоваться случайным образом не одной, а несколькими чистыми стратегиями, т. е. будет случайным образом смешивать чистые стратегии или говорят применять смешанную стратегию. Аналогично игрок В проиграет меньше минимакса , выплачиваемого им игроку А при минимаксной стратегии, если он будет использовать свою смешанную стратегию.
Обозначим через p1, …, pm вероятности, с которыми игрок А использует в ходе игры свои чистые стратегии А1, ….Am, а через q1, …, qn аналогичные величины для игрока В. Очевидно, должны выполняться условия неотрицательности:
И условия нормировки:
Упорядоченные множества P1, …, pm и Q1, …, qn полностью определяют характер действий игроков и называются смешанными стратегиями игроков А и В соответственно. Очевидно, игроки располагают бесконечным множеством смешанных стратегий.
Так как каждый раз применение игроком одной чистой стратегии исключает применение другой, то чистые стратегии являются несовместными событиями. Кроме того, они являются единственными возможными событиями.
Чистая стратегия есть частный случай смешанной стратегии. Действительно, если в смешанной стратегии какая-либо I-я чистая стратегия применяется с вероятностью 1, то все остальные чистые стратегии не применяются. И эта I-Я чистая стратегия является частным случаем смешанной стратегии. Для соблюдения секретности каждый игрок применяет свои стратегии независимо от выбора другого игрока.
http://matica.org.ua/teoriya-
Пример
Задержание подозреваемого.
Рассмотрим дилемму оперативного работника, направляющегося на задержание подозреваемого, с точки зрения теории игр. Опишем конфликтную ситуацию, несколько упростив ее. Оперуполномоченный может пойти на задержание один, а может вызвать группу захвата. Его противник, предварительного не зная о силах и средствах милиции, в свою очередь, может оказывать или не оказывать сопротивление представителям правоохранительных органов.
Вариант,
при котором оперативник пойдет
один и своими силами сможет задержать
преступника, оценивается им как
выигрыш в 3 единицы (очень хорошо).
Также оценивается и тот
Заметим, что введенные платежи, на основании которых будет получено решение конфликта, оценены нами достаточно условно. При описании конкретного случая нужно стремится задать их, обосновывая количественно, к примеру, с помощью теории вероятностей. Теория игр на этот счет никаких рецептов не дает. Она может лишь сказать, как поступить в случае с уже заданной платежной матрицей, чтобы выиграть как можно больше или проиграть как можно меньше вне зависимости от действий противника.
Платежная матрица в этом случае будет такова:
Наибольшее значение минимумов строк равно 1. Это соответствует второй стратегии оперативника. Наименьшее значение максимумов столбцов – 3 (впрочем, максимумы столбцов в этой матрице совпадают). Мы видим, что нижняя и верхняя цена игры не равны друг другу. Значит, платежная матрица не имеет седловую точку и конфликт не может быть разрешен в чистых стратегиях. Рассмотренный выше способ решения игры уже не применим. Если оперуполномоченный применит вторую стратегию, то это гарантирует ему выигрыш в 1 единицу. Но взять эту стратегию в качестве чистой, т.е. всякий раз при задержании подозреваемого вызывать группу захвата, было бы, безусловно, неэффективно. Это означало бы «стрельбу из пушки по воробьям». Как интуитивно понятно, оперативник должен применять обе стратегии в зависимости от предполагаемой ситуации. Естественно, что в каждом конкретном случае он реализует какую-то одну из них. И теория игр не дает рецепта по поводу того, как поступать оперативнику в отдельном случае. Она, как мы увидим дальше, лишь определяет вероятности применения стратегий игроками. Эти вероятности зависят от условий задачи, т.е. тех платежей, которые были заданы изначально.
http://posobie-mii.narod.ru/
Связь между теорией игр и линейным программированием
Первоначально развитие теории стратегических матричных игр осуществлялось параллельно и независимо от линейного программирования. Позже было установлено, что стратегическая матричная игра может быть сведена к паре двойственных задач линейного программирования. Решив одну из них, получаем оптимальные стратегии игрока 1; решив другую, получаем оптимальные стратегии игрока 2. Математическое соответствие между стратегическими матричными играми и линейным программированием было установлено Дж. Б. Данцигом, сформулировавшим и доказавшим в 1951 г. основную теорему теории игр
http://rudocs.exdat.com/docs/
Теорема. Каждая матричная игра с нулевой суммой всегда имеет решение в смешанных стратегиях, т.е. существуют такое число v и такие стратегии U* и W* игроков 1 и 2 соответственно, что выполняются неравенства:
Поясним смысл доказываемых неравенств: если игрок 1 отклоняется от своей оптимальной стратегии, то его выигрыш не увеличивается по сравнению с ценой игры; если от своей оптимальной стратегии отклоняется игрок 2, то по сравнению с ценой игры его проигрыш не уменьшается.