Экономико-математическое моделирование задач теории игр

Автор работы: Пользователь скрыл имя, 13 Мая 2012 в 11:08, реферат

Краткое описание

Довольно часто в своей практической деятельности человеку приходится сталкиваться с задачами, в которых необходимо принимать решение в условиях, когда две или более стороны преследуют различные цели, а результаты любого действия каждой из сторон зависят от мероприятий партнера. Такие ситуации, возникающие, например, при игре в шахматы, шашки или домино, относят к конфликтным: результат каждого хода игрока зависит от ответного хода противника. Каков будет этот ответный ход, заранее неизвестно, поэтому говорят, что решение приходится принимать в условиях неопределенности. Цель игры - выигрыш одного из участников.

Содержание

.Основные понятия и определения. Предмет теории игр.
2.Парные игры с нулевой суммой. Решение в чистых стратегиях.
3.Решение игр в смешанных стратегиях.
4.Геометрическая интерпретация игр.
5.Приведение парной игры к задаче линейного программирования.
6.Общая схема решения парных игр с нулевой суммой.
7. Использование альтернативных критериев определения оптимальных стратегий.

Прикрепленные файлы: 1 файл

ЭММ Реферат.docx

— 145.16 Кб (Скачать документ)
 

v =   =   ≈ 7,14; 
 = 50/7 ∙ 0,04 = 4/14 ≈ 0,29; 
 = 50/7 ∙ 0 = 0; 
 = 50/7 ∙ 0,1 = 10/14 ≈ 0,71; 
 = 50/7 ∙ 0 = 0; 
 = 50/7 ∙ 0,08 = 8/14 ≈ 0,57; 
 = 50/7 ∙ 0,06 = 6/14 ≈ 0,43.


Таким образом, чтобы гарантировать  себе среднюю величину затрат на уровне 7,14 независимо от поведения потребителей, предприятию следует около 57% продукции  отправлять на склад для хранения и около 43% продукции подвергать дополнительной обработке.

 

6. Общая схема  решения парных игр с нулевой  суммой

 

При решении произвольной конечной игры размера mxn рекомендуется придерживаться следующей схемы.

1. Исключить из платежной  матрицы заведомо невыгодные  стратегии.

2. Определить верхнюю  и нижнюю цены игры и проверить,  имеет ли игра седловую точку. Если седловая точка есть, то соответствующие ей стратегии игроков будут оптимальными, а цена игры совпадает с верхней (нижней) ценой.

3. Если седловая точка отсутствует, то решение следует искать в смешанных стратегиях. Игры размера mxn решаются путем сведения к задаче линейного программирования. Для игр размера 2xn или nx2 возможно геометрическое решение. 

7. Использование  альтернативных критериев определения  оптимальных стратегий

 

В задачах, решаемых на основе использования теории игр, довольно часто в качестве противника выступает  так называемая природа. Природа может находиться в одном из множества возможных состояний, которое, в принципе, может быть как конечным, так и бесконечным. Довольно часто в этой ситуации речь идёт о выборе одной (соответственно, чистой) стратегии, т.е. «повторить партию», чтобы вести речь о средних выигрышах, невозможно.

Итак, будем считать, что  множество состояний природы  B(  ) конечно. Все возможные состояния известны, не известно только, какое состояние будет иметь место в условиях, когда планируется реализация принимаемого управленческого решения.

Будем считать, что множество  управленческих решений (планов) Aтакже конечно и равно m.

Как и ранее, исход игры будем определять платёжной матрицей A. Далее условимся, что в том  случае, если элементы aij для игрока представляют собой выигрыш, полезность будем считать, что A – это игрок, B – природа. И наоборот, если aij – затраты, потери, то, как таковой, игрок – это игрок В, природа – игрок А.

Один из критериев, применяемых  при решении подобных задач, был  рассмотрен в предыдущих разделах –  это максиминный/минимаксный критерий (называемый также критерием Вальда).

Рассмотрим некоторые  альтернативные критерии.

 

Критерий  Лапласа

Данный критерий опирается  на «принцип недостаточного основания», согласно которому все состояния природы Bполагаются равновероятными, т.е. вероятности того, что природа окажется в одном из n своих состояний, одинаковы и равны:

.


Если для принимающего решение элементы матрицы aij платёжной матрицы – выигрыши, то оптимальной считается та стратегия Ai, для которой среднее арифметическое возможных выигрышей максимально, т.е. критерий:

.

(5.9)


Если принимающий решение  является игроком B, то критерий становится таким:

.

(5.10)


 

Критерий  Сэвиджа

Введём понятие матрицы рисков R. Это матрица, имеющая размерность mxn. Её элементы rij определяются по следующей формуле (если A – игрок, В - природа):

rij 

 - aij,

(5.11)


где   – максимальный элемент j-ом столбце платёжной матрицы.

Для иллюстрации порядка  формирования матрицы рисков используем пример. Пусть задана следующая платёжная матрица:

A =

4   8   3 
9   5   2 
6   4   8

 .


Если решение принимает  игрок А, то соответствующая матрица  рисков такова:

R =

5   0   5 
0   3   6 
3   4   0

 .


 

Если же человек, принимающий  решение, – игрок В, т.е. aij – потери, то элементы матрицы рисков определяются так:

rij = aij 

,

(5.12)


где   – минимальный элемент в i-ой строке платёжной матрицы.

 

Вернемся к примеру, приведенному выше. В случае, если принимающий  решение - игрок B, матрица рисков будет  такой:

R =

1   5   0 
7   3   0 
2   0   4

 .


 

Критерий Сэвиджа использует матрицу рисков R и рекомендует в условиях неопределенности выбирать ту стратегию, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации, т.е.:

.

(5.13)


По сути, это тот же минимаксный критерий, только по отношению  к матрице рисков, а не к платежной  матрице.

Если принимающий решение  – игрок B, критерий становится таким:

.

(5.14)


Критерий  Гурвица

Данный критерий основан  на использовании так называемого коэффициента доверия. Обозначим его   и предположим, что природа окажется в самом выгодном состоянии с вероятностью   и в самом невыгодном состоянии с вероятностью 1-  .

Критерий Гурвица ориентирован на установление баланса между случаями крайнего пессимизма и крайнего оптимизма  путем взвешивания обоих исходов.

Если принимающий решение  – игрок А, то:

.

(5.15)


Если принимающий решение  – игрок B, то:

.

(5.16)


Заметим, что, если коэффициент  доверия равен нулю, критерий Гурвица  превращается в "классический" минимакс, а при  =1 получаем правило "максимум из максимумов" - выбор лучшего из лучших исходов.

 

Пример 5.8. Телефонная компания должна определить уровень своих возможностей по предоставлению услуг так, чтобы удовлетворить спрос своих клиентов на планируемый период.

Для каждого уровня спроса существуют различные уровни возможностей телефонной компании (например, при  вводе нового тарифа). Имеются четыре варианта спроса на телефонные услуги, что равнозначно наличию четырёх  состояний природы. Известны также  четыре варианта предоставления телефонных услуг. Прибыль для каждого сочетания  «управленческое решение – состояние  природы» приведена в таблице 5.6.

Таблица 5.6 - Платежная матрица  примера 5.8

B1

B2

B3

B4

A1

23

20

12

8

A2

21

24

22

5

A3

5

12

14

9

A4

18

22

9

10


Необходимо определить оптимальную  стратегию телефонной компании, используя  различные критерии.

 

Решение.

Максиминный критерий (критерий Вальда).

В данном случае обычным  образом определяем нижнюю цену игры:  =9.

Оптимальная стратегия - A4.

 

Критерий  Лапласа.

Необходимо определить среднее  арифметическое по каждой из строк  платежной матрицы, а затем выбрать  максимальное значение (критерий (5.9)). В результате расчетов получим:

для стратегии A1: 15,75 ;

для стратегии A2: 18 ;

для стратегии A3: 10 ;

для стратегии A4: 14,75 .

Оптимальная стратегия по критерию Лапласа - A2.

 

Критерий  Сэвиджа.

Сначала сформируем матрицу  рисков R. Для этого воспользуемся  соотношением (5.11), т.е. будем вычитать каждый элемент платежной матрицы  из максимального элемента соответствующего столбца.

В результате получим следующую  матрицу рисков:

R =

0    4   10   2 
 2    0    0    5 
18  12   8   1 
 5    2   13   0

 .


Вычисляя максимум в каждой строке, получим:

для стратегии A1: 10 ;

для стратегии A2: 5 ;

для стратегии A3: 18 ;

для стратегии A4: 13 .

Выбираем минимум. Таким  образом, по критерию Сэвиджа оптимальной является стратегия A2.

 

Критерий  Гурвица.

Определение оптимальной  стратегии по критерию Гурвица предполагает установление коэффициента доверия. Примем его равным 0,5 и найдем оптимальную  стратегию для данного значения. Используя критерий (5.15), для каждой из строк платежной матрицы определим  значение выражения в квадратных скобках:

для стратегии A1: 15,5 ;

для стратегии A2: 14,5 ;

для стратегии A3: 9,5 ;

для стратегии A4: 15,5 .

Таким образом, оптимальными стратегиями по критерию Гурвица  являются две стратегии - Aи A4.

Заметим, что такое решение  было получено при  =0,5. При иных значениях коэффициента доверия оптимальное решение может быть другим.

 


Информация о работе Экономико-математическое моделирование задач теории игр