Экономико-математическое моделирование задач теории игр

Автор работы: Пользователь скрыл имя, 13 Мая 2012 в 11:08, реферат

Краткое описание

Довольно часто в своей практической деятельности человеку приходится сталкиваться с задачами, в которых необходимо принимать решение в условиях, когда две или более стороны преследуют различные цели, а результаты любого действия каждой из сторон зависят от мероприятий партнера. Такие ситуации, возникающие, например, при игре в шахматы, шашки или домино, относят к конфликтным: результат каждого хода игрока зависит от ответного хода противника. Каков будет этот ответный ход, заранее неизвестно, поэтому говорят, что решение приходится принимать в условиях неопределенности. Цель игры - выигрыш одного из участников.

Содержание

.Основные понятия и определения. Предмет теории игр.
2.Парные игры с нулевой суммой. Решение в чистых стратегиях.
3.Решение игр в смешанных стратегиях.
4.Геометрическая интерпретация игр.
5.Приведение парной игры к задаче линейного программирования.
6.Общая схема решения парных игр с нулевой суммой.
7. Использование альтернативных критериев определения оптимальных стратегий.

Прикрепленные файлы: 1 файл

ЭММ Реферат.docx

— 145.16 Кб (Скачать документ)

Решение.

Задача сводится к игровой  модели, в которой игра предприятия А против спроса В задана платежной матрицей, представленной в таблице 5.4.

Определим верхнюю и нижнюю цены игры:   = 3,   = 6. Как видно, седловая точка отсутствует, и решение нужно искать в смешанных стратегиях игроков: U= ( ,  ), Z= ( ,  ,  ,  ).

Решим игру, используя геометрический метод. Соответствующие построения приведены на рисунке 5.5.

 

Рисунок 5.5 – Геометрическое решение игры примера 5.6

Точка M – точка максимального  гарантированного выигрыша. Она находится  на пересечении отрезков, соответствующих  состояниям спроса Bи B3.

Найдем координаты точки M.

B1B'1:

 = 
 ,  откуда  y = 6x + 3,


B3B'3:

 = 
 ,  откуда  y = -2x + 6,


 

6x + 3 = -2x + 6, 
8x = 3, 
x = 3/8, 
y = 21/4.


Таким образом, получим:

 

 = 5/8,   = 3/8, v = 21/4.


Полученное решение интерпретируется следующим образом. Продукция Адолжна составлять 62,5% (5/8) от общего объема выпущенной продукции, продукция А– 37,5% (3/8). Это гарантирует предприятию среднюю прибыль в размере 5,25 (21/4) при любом характере спроса.

Для полного решения игры осталось отыскать оптимальную стратегию  спроса.

Активными стратегиями игрока B (спроса) являются стратегии Bи B3, следовательно,   = 0,   = 0.

Используя выражение (5.2), вытекающее из теоремы об активных стратегиях, составим систему из двух уравнений  с двумя неизвестными:

3  + 6  = 21/4, 
 +   = 1.


 

Второе уравнение умножим  на три и вычтем из первого:

 

3  = 9/4, 
 = 3/4,   = 1/4.


Ответ: U= (5/8, 3/8); Z= (1/4, 0, 3/4, 0); v = 21/4.

 

Еще раз обратим внимание на рисунок 5.5 и платежную матрицу, представленную в таблице 5.4.

Стратегия Bзаведомо невыгодна для игрока В по сравнению со стратегией B1. На рисунке 5.5 все точки отрезка B2B'лежат выше отрезка B1B'1, следовательно, заранее понятно, что стратегия Bне входит в оптимальное решение.

Таким образом, столбец Bможет быть исключен из рассмотрения до начала решения задачи, поскольку соответствующая стратегия заведомо невыгодна для игрока B по сравнению со стратегией B2.

 

Итак, исходная игра может  быть упрощена путем исключения из платежной матрицы строк и  столбцов, соответствующих заведомо невыгодным стратегиям.

Такими стратегиями для  игрока А являются те, которым соответствуют  строки с элементами, заведомо меньшими по сравнению с элементами како-либо другой строки.

Для игрока В невыгодным стратегиям соответствуют столбцы  с элементами, заведомо бoльшими по сравнению с элементами какого-либо другого столбца.

 

5. Приведение парной  игры к задаче линейного программирования

 

Игра размера mxn не имеет наглядной геометрической интерпретации. Ее решение достаточно трудоемко, но принципиальных трудностей не имеет, поскольку может быть сведено к решению задаче линейного программирования.

Наряду с приводимыми  выше теоремой Неймана и теоремой об активных стратегиях справедлива следующая терема теории игр.

 

Теорема. Для того чтобы число v было ценой игры, а U* и Z*- оптимальными стратегиями, необходимо и достаточно выполнение неравенств:

aij
 ≥ v,   

aij
 ≤ v,   
.

 

 

Рассмотрим игру mxn, определяемую матрицей:

A =

a11   a12    ...     a1n 
a21   a22    ...     a2n      

...

am1  am2   ...     amn

.


Как и ранее, игрок A обладает стратегиями A1, A2, ..., Am, игрок В – стратегиями B1, B2, …, Bn. Требуется определить оптимальные стратегии игроков Uи Z*.

Рассмотрим оптимальную  стратегию Uигрока A.

Согласно теореме, приведенной  выше, справедливо следующее утверждение.

Если игрок А применяет  смешанную стратегию U= ( ,  , ...,  ) против чистой стратегии Bигрока В, то он получает средний выигрыш илиматематическое ожидание выигрыша a= a1j  + a2j  + ... + amj ,  .

Для оптимальной стратегии Uвсе средние выигрыши не меньше цены игры v, поэтому получаем систему неравенств:

a11  + a21  + ... + am1  ≥ v, 
a12  + a22  + ... + am2  ≥ v,

...

a1n  + a2n  + ... + amn  ≥ v.


(5.3)


Предположим для определенности, что v > 0.

Этого всегда можно достигнуть благодаря тому, что прибавление  ко всем элементам матрицы А одного и того же постоянного числа С  не приводит к изменению оптимальных  стратегий, а только лишь увеличивает  цену игры на С.

Каждое из неравенств разделим на число v (v > 0), а также введем новые переменные: y=   / v,  y=   / v, ..., y=   / v.

Тогда система (5.3) примет вид:

a11y+ a21y+ ... + am1ym≥ 1, 
a12y+ a22y+ ... + am2y≥ 1,

...

a1ny+ a2ny+ ... + amnym≥ 1.


(5.4)


При этом y≥ 0,    .

Далее рассмотрим равенство   +   + ... +   = 1.

Разделим неравенство  на число v (v ≠ 0). Получим:

y+ y+ ... + y= 1/v.

(5.5)


Вспомним, что цель игрока А – максимизировать свой гарантированный  выигрыш, т.е. цену игры v. Максимизация цены игры v эквивалентна минимизации величины 1/v, поэтому задача может быть сформулирована следующим образом: определить значения переменных y≥ 0, i = 1, 2, …, m, так, чтобы они удовлетворяли линейным ограничениям (5.4) и при этом линейная функция (5.5) обращалась в минимум.

Перед нами задача линейного  программирования.

Решая задачу (5.4) – (5.5), можно  найти оптимальную стратегию U*.

 

Аналогичные рассуждения  выполним и для игрока В.

Обозначив x=   / v,   , в результате получим:

a11x+ a12x+ ... + a1nxn≤ 1, 
a21x+ a22x+ ... + a2nx≤ 1,

...

am1x+ am2x+ ... + amnx≤ 1.


(5.6)


x+ x+ ... + x= 1/v.

(5.7)


Таким образом, задача определения  оптимальной стратегии игрока В  сводится к следующему: определить значения переменных x≥ 0, j = 1, 2, …, n, так, чтобы они удовлетворяли линейным ограничениям (5.6) и при этом линейная функция (5.7) обращалась в максимум.

Решая задачу линейного программирования (5.6) – (5.7), получим оптимальную стратегию Z*.

 

Вновь приведем формулировки полученных задач линейного программирования.

 = y+ y+ ... + y→ min;

 

 = x+ x+ ... + x→ max;

 

a11y+ a21y+ ... + am1ym≥ 1, 
a12y+ a22y+ ... + am2y≥ 1,

...

a1ny+ a2ny+ ... + amnym≥ 1;

 

a11x+ a12x+ ... + a1nxn≤ 1, 
a21x+ a22x+ ... + a2nx≤ 1,

...

am1x+ am2x+ ... + amnx≤ 1;

 
           

y≥ 0,  

.

 

x≥ 0,  

.

 

Очевидно, что задачи (5.4) – (5.5) и (5.6) – (5.7) представляют собой  пару взаимно двойственных задач  линейного программирования. Их решение  позволяет решить соответствующую  игру.

При этом:


 
 = v ∙ 
,  

 
 = v ∙ 
,  
.


(5.8)

 

 

Таким образом, процесс нахождения решения игры с использованием методов  линейного программирования включает следующие этапы.

1. Формулировка пары двойственных  задач линейного программирования, эквивалентных заданной парной  игре.

2. Определение оптимальных  планов двойственных задач.

3. Нахождение решения  игры с использованием соотношений  между оптимальными планами двойственных  задач и оптимальными стратегиями  и ценой игры (формулы (5.8)).

 

Пример 5.7. Предприятие выпускает скоропортящуюся продукцию, которую может сразу отправить потребителю (стратегия В1), отправить на склад для хранения (стратегия В2) или подвергнуть дополнительной обработке (стратегия В3) для длительного хранения.

Потребитель может приобрести продукцию немедленно (стратегия A1), в течение небольшого времени (стратегия A2), по истечении длительного периода времени (стратегия A3).

В случае стратегий Bи Bпредприятие несет дополнительные затраты на хранение и переработку продукции, которые не требуются для B1, однако при Bследует учесть возможные убытки из-за порчи продукции, если потребитель выберет стратегии Аили А3.

Определите оптимальные  пропорции продукции для применения стратегий B1, Bи B3, руководствуясь «минимаксным критерием» (гарантированный средний уровень затрат) при матрице затрат, представленной в таблице 5.5.

Таблица 5.5 - Платежная матрица  примера 5.7

B1

B2

B3

A1

2

5

10

A2

8

6

8

A3

12

8

6


Решение.

Проверим игру на наличие  седловой точки:   = 6,   = 8. Седловая точка отсутствует. Упростить игру, путем исключения заведомо невыгодных стратегий не удается.

Составим пару двойственных задач линейного программирования.

 = y+ y+ y→ min;

 

 = x+ x+ x→ max;

 

2y+ 8y+ 12y≥ 1, 
5y+ 6y+ 8y≥ 1, 
10y+ 8y+ 6y≥ 1;

 

2x+ 5x+ 10x≤ 1, 
8x+ 6x+ 8x≤ 1, 
12x+ 8x+ 6x≤ 1;

 
           

y≥ 0,  y≥ 0,   y≥ 0.

 

x≥ 0,  x≥ 0,   x≥ 0.

 

Методы решения задач  линейного программирования обсуждались  нами в разделе "Линейное программирование".

Решая первую из задач, получим:

 = 0,04;  
 = 0;  
 = 0,1;  
 = 0,14.

Решение второй задачи дает следующие результаты:

 = 0;  
 = 0,08;  
 = 0,06;  
 = 0,14.

Используя соотношения (5.8) найдем решение игры:

Информация о работе Экономико-математическое моделирование задач теории игр