Теория игр

Автор работы: Пользователь скрыл имя, 26 Ноября 2013 в 21:12, курсовая работа

Краткое описание

Проблема выполнения различных вычислений была актуальна во все времена. По мере развития общественно-экономических отношений усложнялись поставленные задачи, которые для своего решения требовали разработки новых методов вычислений. На смену простейшим арифметическим и геометрическим вычислениям пришли алгебраические и тригонометрические вычисления. Организация современного производства требует не только наличия современных станков и оборудования, но и разработки новых технологических процессов и современных методов управления производством. Для решения каждой из поставленных задач разрабатываются математические модели, анализируя которые удается найти наилучшее решение поставленной задачи.

Содержание

Введение
Обзор литературы
1. Основные понятия теории игр
2. Игры с противодействием и нулевой суммой
3. Графический метод решения игровых задач с нулевой суммой
3.1 Решение задач графическим методом
4. Сведение задач теории игр к задачам линейного программирования
4.1 Решение задач
5. Игры с природой (без противодействия)
5.1 Решение задач
Заключение
Список используемой литературы

Скачать полностью (128.96 Кб) Сколько стоит заказать работу?

Прикрепленные файлы: 1 файл

Доклад.doc

— 601.50 Кб (Скачать документ)

седловой точки нет, игра в чистой стратегии не решается. Найдем смешанную стратегию игроков. Посмотрим, можно ли удалить не выгодную стратегию для игроков. Для первого игрока невыгодной считается та стратегия, которая, обеспечивает выигрыш меньший, чем какая либо другая. Для второго игрока считается та стратегия не выгодной, которая обеспечить проигрыш больший, чем другая стратегия.

Невыгодная стратегия для второго игрока:

Ожидаемый выигрыш 1 игрока, если второй выбрал 1 стратегию:

p₁ · 7 + (1 - p₁) · 10 = -3p₁ + 10;

Ожидаемый выигрыш 1 игрока, если второй выбрал 2 стратегию:

p1 · 9 + (1 - p1) · 6 = 3 p1 + 6;

-3p₁ + 10 = 3 p₁ + 6

-3p₁ - 3p₁ = -10 + 6

-6p₁ = -4

p₁ = 2/3 , p₂ =1/3 .

Первому игроку для получения гарантированного выигрыша 7 , (2/3+7) рекомендуется играть 1 стратегией.

Рассмотрим второго игрока.

Ожидаемые проигрыш второго игрока если первый выберет 1 стратегию.

p4 · 7 + (1- p4) · 9 = -2 p4 + 9

Ожидаемые проигрыш второго игрока если первый выберет 2 стратегию.

p4 · 10 + (1- p4) · 6 = 4 p4 + 6

-2p₄ + 9 = 4 p₄ + 6

-2p₄ - 4p₄ = 6 – 9

-6p₄ = -3

р₄ = 1/2 , p₅ =1/2 .

Ответ : Из 2 игр (для первого) 2 надо сыграть 3 стратегией и 1 – 3 стратегией, (для второго) 1 надо сыграть 2 стратегией и 1 – 2 стратегией.

Пример 4: Решить игру, заданную матрицей

Проверим если ли седловая точка:

α = max (5,4,2,1) = 5

β = min (6,8) = 6 α ≠ β

седловой точки нет, игра в чистой стратегии не решается. Найдем смешанную стратегию игроков.

Посмотрим можно ли удалить не выгодную стратегию для игроков Для первого игрока невыгодной считается та стратегия, которая, обеспечивает выигрыш меньший, чем какая либо другая. Для второго игрока считается та стратегия не выгодной, которая обеспечить проигрыш больший, чем другая стратегия.

Невыгодная стратегия для первого игрока:

2,3

Ожидаемый выигрыш 1 игрока, если второй выбрал 1 стратегию:

p₁ · 6 + (1 - p₁) · 1 = 5 p₁ + 1;

Ожидаемый выигрыш 1 игрока, если второй выбрал 2 стратегию:

p₁ · 5 + (1 - p₁) · 8 = -3 p₁ + 8;

5 p₁ + 1 = -3 p₁ + 8

5 p₁ + 3p₁ = 8 – 1

8 p₁ = 7

p₁ = 7/8 , p₂ =1/8 .

Рассмотрим второго игрока.

Ожидаемые проигрыш второго игрока, если первый выберет 1 стратегию.p4 · 6 + (1- p4) · 5 = p4 + 5

Ожидаемые проигрыш второго игрока, если первый выберет 2 стратегию.

p4 · 1 + (1- p4) · 8 = -7 p4 + 8

p₄ + 5 = -7 p₄ + 8

p₄ + 7 p₄ = 8 – 5

8 p₄ = 3

р₄ = 3/8 , p₅ =5/8 .

u = .

Ответ : Из 4 игр (для первого) 7 надо сыграть 8 стратегией и 1 – 8, (для второго) 3 надо сыграть 8 стратегией и 5 – 8.

4. Сведение задач теории игр к задачам линейного

программирования

Предположим, что цена игры положительна (u > 0). Если это не так, то согласно свойству 6 всегда можно подобрать такое число с, прибавление которого ко всем элементам матрицы выигрышей даёт матрицу с положительными элементами, и следовательно, с положительным значением цены игры. При этом оптимальные смешанные стратегии обоих игроков не изменяются.

Свойство 1. Тройка (хо, yо, u) является решением игры G = (Х,Y,А) тогда и только тогда, когда (хо, yо, кu +а) является решением игры G(Х,Y,кА+а), где а – любое вещественное число, к > 0.

Свойство 2. Для того, чтобы хо = ( ) была оптимальной смешанной стратегией матричной игры с матрицей А и ценой игры u, необходимо и достаточно выполнение следующих неравенств

(j = )

Аналогично для игрока 2 : чтобы yо = ( , ..., , ..., ) была оптимальной смешанной стратегией игрока 2 необходимо и достаточно выполнение следующих неравенств:

(i = )

Из последнего свойства вытекает: чтобы установить, является ли предполагаемые (х, y) и u решением матричной игры, достаточно проверить, удовлетворяют ли они неравенствам (*) и (**). С другой стороны, найдя неотрицательные решения неравенств (*) и (**) совместно со следующими уравнениями

получим решение матричной игры.

Итак, пусть дана матричная игра с матрицей А порядка m х n. Согласно свойству 7 оптимальные смешанные стратегии х = (х1, ..., хm), y = (y1, ..., yn) соответственно игроков 1 и 2 и цена игры u должны удовлетворять соотношениям.

Разделим все уравнения и неравенства в (4.4) и (4.5) на u (это можно сделать, т.к. по предположению u > 0) и введём обозначения:

, ,

Тогда (1) и (2) перепишется в виде:

, , , ,

, , , .

Поскольку первый игрок стремится найти такие значения хi и, следовательно, pi , чтобы цена игры u была максимальной, то решение первой задачи сводится к нахождению таких неотрицательных значений pi , при которых

, .

Поскольку второй игрок стремится найти такие значения yj и, следовательно, qj, чтобы цена игры u была наименьшей, то решение второй задачи сводится к нахождению таких неотрицательных значений qj, , при которых

, .

Формулы (3) и (4) выражают двойственные друг другу задачи линейного программирования (ЛП).

Решив эти задачи, получим значения pi , qj и u.Тогда смешанные стратегии, т.е. xi и yj получаются по формулам:

4.1 Решение задач

Пример 5: Найти решение игры, определяемой матрицей.

Решение.

Составим теперь пару взаимно-двойственных задач :

Решим вторую из них

Б.п.	q1	q2	q3	q4	q5	q6	Решение	å	Отношение
	-1	-1	-1	0	0	0	0	-3
q4	1	2	0	1	0	0	1	5	—
q5	1	0	1	0	1	0	1	4
q6	2	1	0	0	0	1	1	5	—

Б.п.	q1	q2	q3	q4	q5	q6	Решение	å	Отношение
	0	-1	0	0	1	0	1	1
q4	1	2	0	1	0	0	1	5
q3	1	0	1	0	1	0	1	4	—
q6	2	1	0	0	0	1	1	5

Б.п.	q1	q2	q3	q4	q5	q6	Решение	å	Отношение
		0	0		1	0
q2		1	0		0	0
q3	1	0	1	0	1	0	1	4
q6		0	0		0	1

Из оптимальной симплекс-таблицы следует, что

(q1, q2, q3) = (0; ; 1),

а из соотношений двойственности следует, что

( p1, p2, p3) = ( ; 1; 0).

Следовательно, цена игры с платёжной матрицей А1 равна

. ,

а игры с платёжной матрицей А:

При этом оптимальные стратегии игроков имеют вид:

Х = (х1, х2, х3) = (uр1; uр2; uр3) = =

Y = (y1, y2, y3) = (uq1; uq2; uq3) = = .

5. Игры с природой (без противодействия)

В играх с противодействием фирме А (одному игроку) противостоит другая фирма – В (игрок). Фирма В выбирает целенаправленную стратегию поведения с тем, чтобы уменьшить выигрыш фирмы А (следовательно, и свой проигрыш).

В играх с природой вторым игроком является природа, которая действует («выбирает» стратегии) случайным образом. То есть она может или улучшать положение первого игрока, или ухудшать. Поэтому существует несколько критериев оценки результатов исследования игровой модели.

Критерий Вальде (пессимистический).

В соответствии с этим критерием следует применять самую осторожную стратегию, которая сведет к минимуму вероятность (риск) проигрыша и доставит минимальную прибыль. Эта стратегия обеспечивается критерием:

max (min a ij ).(5.1)

где минимум выбирается по каждой строке.

То есть этот критерий совпадает с нижней ценой игры.

Критерий максимума (оптимистический).

Этот критерий полагает, что природа будет максимально благосклонна к игроку. Можно выбирать самые авантюристические стратегии и они будут реализоваться

max (max a ij ).(5.2)

где максимум выбирается по каждой строке.

Критерий Гурвица.

Критерий Гурвица занимает промежуточное значение между критерием Вальде и критерием максимума. Сам игрок определяет вероятность своего «везения»

max (α min a ij + (1- α) max a ij ) .(5.3)

Ответственное лицо, принимающее решение, определяет значение коэффициента α. Если потери могут быть весьма значительными, то значение коэффициента α приближается к единице, иначе к 0.

Критерий Сэвиджа.

Этот критерий анализирует возможные риски от применения каждой из стратегий и выбирает такую стратегию, которая обеспечивает приемлемые потери. Риски по каждой стратегии определяются по формуле:

Информация о работе Теория игр