Автор работы: Пользователь скрыл имя, 15 Октября 2014 в 21:54, курсовая работа
В какой-либо конфликтной ситуации решение принимается не одним индивидуумом, а несколькими участниками, и функция выигрыша каждого индивидуума зависит не только от его стратегии, но также и от решений других участников. Математическая модель такого рода называется игрой, а участники конфликта игроками.
Если игроков двое, а интересы их противоположны, то игра называется антагонистической.
Введение 3
§1. Необходимые сведения о матричных и антагонистических играх 4
1. Понятия антагонистической и матричной игр 4
2. Принципы оптимальности в матричных играх 5
3. Смешанное расширение игры 6
§2. Позиционные игры 9
1. Понятия позиционной игры, дерева игры и информационного множества 9
2. Примеры 10
§3. Позиционные антагонистические игры с полной информацией 11
1. Понятие позиционной игры с полной информацией 11
2. Нормализация позиционной игры с полной информацией 11
3. Теорема Цермело 12
4. Примеры 13
§4. Позиционные антагонистические игры с неполнойинформацией 19
1. Понятие позиционной игры с неполной информацией 19
2. Нормализация позиционной игры с неполной информацией 19
3. Примеры 19
§5. Необходимые сведения о биматричных играх 22
1. Понятие биматричной игры 22
2. Принцип максимина и принцип равновесия. Оптимальность по Парето 22
§6. Позиционная не антагонистическая игра. Ее свойства 25
Заключение 33
Список литературы 34
Содержание
В какой-либо конфликтной ситуации решение принимается не одним индивидуумом, а несколькими участниками, и функция выигрыша каждого индивидуума зависит не только от его стратегии, но также и от решений других участников. Математическая модель такого рода называется игрой, а участники конфликта игроками.
Если игроков двое, а интересы их противоположны, то игра называется антагонистической.
На практике участники конфликтов часто совершают свой выбор не один раз и на всегда, а последовательно во времени, в зависимости от развития конфликта. Одним из классов игр, которые описывают конфликты, динамика которых влияет на поведение участников, являются позиционные игры.
Пусть функция определена на декартовом произведении , где — множества произвольной природы.
Определение 1. Пара называется седловой точкой функции на , если
или, эквивалентно,
Опишем антагонистическую игру. В ней принимают участие два игрока – 1 и 2. Игрок 1 выбирает стратегию из множества стратегий , игрок 2 выбирает стратегию из множества стратегий . Задана функция выигрыша первого игрока , определенная на . Выигрыш первого игрока является проигрышем для второго. Целью первого игрока является увеличение , а целью второго – уменьшение . Таким образом, антагонистическая игра задается набором .
Определение 2. Говорят, что антагонистическая игра имеет решение, если функция имеет на седловую точку. Пусть — седловая точка функции . Тогда тройка называется решением игры, — оптимальными стратегиями игроков, — значением (ценой) игры.
Так же называют ситуацией равновесия (равновесием по Нэшу) в игре Г.
Лемма 1. Если , — две седловые точки функции на , то , т.е. цена игры не зависит от выбора седловой точки.
Определение 3. Антагонистическая игра Г называется матричной, если множества стратегий игроков конечны: . При этом принято обозначать стратегию первого игрока через , стратегию второго через , а выигрыш первого через . Матрица называется матрицей игры. Первый игрок выбирает в ней номер строки , а второй — номер столбца .
В обозначениях матричной игры — седловая точка матрицы A, если
Определение 4. Стратегия первого игрока называется максиминной, если . При этом величина называется нижней ценой игры.
Определение 5. Стратегия второго игрока называется минимаксной, если . При этом величина называется верхней ценой игры.
Далее будем полагать, что множества конечны.
Обозначим , где – количество строк матрицы А игры Г, а – количество столбцов.
В обозначениях матричной игры и учитывая, что и , т.к. на функция достигает своего наименьшего и наибольшего значения, то определения 4 и 5 можно записать в следующем виде.
Определение 4. Стратегия первого игрока называется максиминной, если . При этом величина называется нижней ценой игры.
Определение 5. Стратегия второго игрока называется минимаксной, если . При этом величина называется верхней ценой игры.
Лемма 2. В любой антагонистической игре Г справедливо неравенство
Теорема 1.
1) Для того, чтобы имела седловую точку на , необходимо и достаточно, чтобы было выполнено равенство
2) Пусть выполнено предыдущее равенство. Пара является седловой точкой тогда и только тогда, когда – максиминная, а – минимаксная стратегии игроков.
Теорема .
1) Если – максиминная стратегия первого игрока, – минимаксная стратегия второго игрока игра Г имеет решение, – цена игры, – ситуация равновесия.
2) Если Г имеет решение – максиминная стратегия первого игрока, – минимаксная стратегия второго игрока.
Так же теория игр предлагает использовать игрокам смешанные стратегии. Рассмотрим, как они определяются.
Определение 6. Смешанной стратегией первого игрока в игре Г называется вероятностное распределение на множестве стратегий .
Для первого игрока применить смешанную стратегию — это выбрать стратегию как реализацию случайной величины, имеющей закон распределения .
Рассмотрим вид смешанной стратегии, характерный для матричной игры.
Пусть . Тогда вместо для обозначения смешанной стратегии будем использовать “вероятностный” вектор удовлетворяющий ограничениям Если применяется , то стратегия выбирается с вероятностью .
Множество будем называть множеством чистых стратегий.
Обозначим множества “вероятностных” векторов для первого и второго игроков соответственно. Тогда функция выигрыша - , а соответствующая антагонистическая игра .
Определение 7. Антагонистическая игра называется смешанным расширением игры Г. – множества стратегий.
Для игры можно также ввести понятия максиминной и минимаксной стратегий, седловой точки функции , решения игры. С точностью до обозначений они будут аналогичны соответствующим понятиям для игры Г. Все свойства игры Г справедливы и для игры
Теорема 2. (основная теорема теории матричных игр).
Всякая игра имеет решение.
Последнее утверждение эквивалентно тому, что любая матричная игра Г имеет решение в смешанных стратегиях.
Теорема 3.
1) – решение
2) – ситуация равновесия в , при чем выполняются неравенства (1) – решение .
Определение 1. Позиционной игрой называется бескоалиционная игра, моделирующая процессы последовательного принятия решений игроками в условиях меняющейся во времени информации.
Простейшие примеры позиционных игр: шахматы, шашки, крестики-нолики, домино и др.
Определение 2. Состояния игры называют позициями, а возможные выборы в каждой позиции – альтернативами.
Определение 3. Древовидное упорядоченное множество, с помощью которого можно представить графически множество позиций в такой игре, называется деревом игры.
Для определенности будем рассматривать в этом параграфе, §3 и §4 позиционные игры, в каждой позиции которых ровно две альтернативы – 1 и 2.
Определение 4. Цепь, связывающая начальную вершину с окончательной называется партией.
Число различных партий равно числу окончательных вершин (позиций).
Различают позиционные игры с полной информацией и позиционные игры с неполной информацией.
В позиционных играх с полной информацией каждый игрок, делая свой ход, знает, в какой позиции дерева игры он находится в данный момент.
В позиционных играх с неполной информацией игрок, делающий ход, не знает точно в какой именно позиции дерева игры он фактически находится.
Определение 5. Информационным множеством называется некоторое множество позиций, известное игроку и включающее в себя его фактическую позицию.
Таким образом, в игре с неполной информацией игрок при своем ходе знает, в каком информационном множестве он находится, а в какой конкретно позиции этого множества – ему неизвестно.
Пример 1. Дерево позиционной игры (жирным выделена одна из партий).
Определение 1. Позиционная игра называется игрой с полной информацией, если в каждой позиции любой ее партии игрок, делающий ход, знает, какие альтернативы были выбраны на предыдущих ходах.
Рассмотрим другое представление позиционной игры с полной информацией. Определим её следующим образом. Игра происходит в течение шагов с номерами На каждом шаге игроки по очереди выбирают альтернативы – значения переменных .
Шаг 1. Первый игрок выбирает альтернативу , затем второй игрок, зная выбор первого, выбирает альтернативу .
Пусть игроки в течение шагов выбирали альтернативы соответственно. Обозначим
Шаг t. Первый игрок, зная предыдущие значения , выбирает альтернативу . Далее второй игрок выбирает альтернативу , зная .
После последнего шага возникает пара – партия игры. Для любой партии задается выигрыш первого игрока.
Далее определим игру в нормальной форме. На шаге первый игрок может выбрать альтернативу как значение функции , которая должна быть определена при всевозможных значениях аргументов . Обозначим множество всех таких функций через . Заметим, что , так как на первом шаге первый игрок никакой информацией не располагает.
Стратегия первого игрока представляет собой набор функций
Аналогично, на шаге второй игрок может выбирать альтернативу как значение функции , которая должна быть определена при всевозможных значениях аргументов . Обозначим множество всех таких функций через . Стратегия второго игрока представляет собой набор функций
Любой паре стратегий однозначно соответствует партия игры: и т.д.
Далее , где — партия, соответствующая стратегиям . Многошаговая игра с полной информацией определена в нормальной форме .
Другими словами, нормализация – процесс сведения позиционной игры к матричной.
Пусть - игра, в которой множества конечны.
Определим величину
Теорема 1 (Цермело).
Всякая многошаговая антагонистическая игра с полной информацией имеет решение в чистых стратегиях.
Доказательство.
Покажем, что функция имеет седловую точку на . Для того достаточно доказать, что
Докажем неравенство 1). Имеем
Неравенство 2) доказывается аналогично.
Пример 2. Рассмотрим игру с полной информацией. Начинает игрок А. Он выбирает одну из двух возможных альтернатив – число , равное либо 1, либо 2 (первая и вторая альтернатива соответственно). На ход игрока А игрок В отвечает своим ходом, также выбирая одну из двух альтернатив – число , равное либо 1, либо 2. В результате игрок А или выигрывает, или проигрывает.
1-й ход. Игрок А выбирает
2-й ход. Игрок В выбирает , зная выбор числа игроком А.
Функция выигрыша для игрока А задается следующим образом
На рисунке 2 показаны дерево игры и информационные множества.
Рис. 2 Рис. 3
Пример 2 (продолжение). Нормализация игры.
В обозначениях, приведенных выше, , , , , , , .
Опишем стратегии игроков.
У игрока A две чистых стратеги, т.е. .У игрока В четыре чистых стратегии:
Покажем, как задается выигрыш игрока А.
Если, например, игрок А выбрал стратегию , а игрок B - -стратегию . Тогда . Остальные выигрыши рассчитываются аналогично. Запишем их в виде матрицы игры:
где строки соответствуют стратегиям игрока A, а столбцы – стратегиям игрока В.
Полученная матрица имеет седловую точку. Оптимальная стратегия первого игрока – выбрать , второго игрока - . Цена игры .
Пример 4. «Переговоры».
В переговорах участвуют две стороны A и B. Сначала сторона A высказывает одно из нескольких предложений, способных заинтересовать другую сторону. Затем сторона В, ознакомившись с предложением стороны А, высказывает одно из нескольких встречных предложений, способных, по ее мнению, заинтересовать сторону А. В свою очередь, сторона А, ознакомившись с реакцией стороны В на сделанные предложения, высказывает ей новое предложение, внеся одну из нескольких возможных корректировок в свое первоначальное предложение с учетом мнения стороны В и т. д.
Смоделируем короткий переговорный процесс трехходовой позиционной игрой с полной информацией.
Предположим, что переговоры заканчиваются через три хода, на каждом из которых соответствующая сторона имеет возможность выбора из двух альтернатив, и опишем соответствующую позиционную игру.
1-й ход делает сторона А. Она выбирает одно из двух возможных предложений – число .
2-й ход делает сторона B. Она выбирает число , зная число .
3-й ход делает сторона А. Она выбирает число зная .
После этого сторона А либо получает вознаграждение, либо выплачивает штраф стороне В.
Все эти возможности описываются функцией выигрышей , которая задана следующим образом
На рисунке 4 изображено дерево данной игры.
Опишем стратегии игроков.
Т.к. игроку В известен выбор игрока А на 1-м ходе, то у игрока В те же четыре стратегии, что и в предыдущем примере:
где означает, что если на первом ходе игрок А выбрал , то игрок В на своем ходе должен выбрать число , а если игрок А на первом ходе выбрал , то игрок В должен выбрать , т.е. при любом выборе и т. д.
У игрока А восемь возможных стратегий. Его чистая стратегия в данной игре описывается тройкой
Здесь – альтернатива, которую игрок А выбирает на 1-м ходе, – альтернатива, которую игрок А выбирает на 3-м ходе, если на втором ходе игрок В выбрал и – альтернатива, которую игрок А выбирает на 3-м ходе, если на втором ходе игрок В выбрал .
Опишем стратегии игрока А:
Далее покажем, как в зависимости от применяемых стратегий определяются элементы матрицы игры.
Пусть, например, игрок А выбрал стратегию , а игрок В – стратегию . Это означает, что на первом ходе игрок А выбрал , следовательно, игрок В на 2-м ходе выбрал а на 3-м ходе игрок А выбрал . Итак, . Тогда . Остальные выигрыши рассчитываются аналогично.
Теперь можем составить матрицу игры: