Автор работы: Пользователь скрыл имя, 13 Мая 2012 в 11:08, реферат
Довольно часто в своей практической деятельности человеку приходится сталкиваться с задачами, в которых необходимо принимать решение в условиях, когда две или более стороны преследуют различные цели, а результаты любого действия каждой из сторон зависят от мероприятий партнера. Такие ситуации, возникающие, например, при игре в шахматы, шашки или домино, относят к конфликтным: результат каждого хода игрока зависит от ответного хода противника. Каков будет этот ответный ход, заранее неизвестно, поэтому говорят, что решение приходится принимать в условиях неопределенности. Цель игры - выигрыш одного из участников.
.Основные понятия и определения. Предмет теории игр.
2.Парные игры с нулевой суммой. Решение в чистых стратегиях.
3.Решение игр в смешанных стратегиях.
4.Геометрическая интерпретация игр.
5.Приведение парной игры к задаче линейного программирования.
6.Общая схема решения парных игр с нулевой суммой.
7. Использование альтернативных критериев определения оптимальных стратегий.
Решение.
Задача сводится к игровой модели, в которой игра предприятия А против спроса В задана платежной матрицей, представленной в таблице 5.4.
Определим верхнюю и нижнюю цены игры: = 3, = 6. Как видно, седловая точка отсутствует, и решение нужно искать в смешанных стратегиях игроков: U* = ( , ), Z* = ( , , , ).
Решим игру, используя геометрический метод. Соответствующие построения приведены на рисунке 5.5.
Рисунок 5.5 – Геометрическое решение игры примера 5.6
Точка M – точка максимального гарантированного выигрыша. Она находится на пересечении отрезков, соответствующих состояниям спроса B1 и B3.
Найдем координаты точки M.
B1B'1:
B3B'3:
6x + 3 = -2x + 6, |
Таким образом, получим:
= 5/8, = 3/8, v = 21/4. |
Полученное решение
Для полного решения игры осталось отыскать оптимальную стратегию спроса.
Активными стратегиями игрока B (спроса) являются стратегии B1 и B3, следовательно, = 0, = 0.
Используя выражение (5.2), вытекающее из теоремы об активных стратегиях, составим систему из двух уравнений с двумя неизвестными:
|
Второе уравнение умножим на три и вычтем из первого:
3
= 9/4, |
Ответ: U* = (5/8, 3/8); Z* = (1/4, 0, 3/4, 0); v = 21/4.
Еще раз обратим внимание на рисунок 5.5 и платежную матрицу, представленную в таблице 5.4.
Стратегия B2 заведомо невыгодна для игрока В по сравнению со стратегией B1. На рисунке 5.5 все точки отрезка B2B'2 лежат выше отрезка B1B'1, следовательно, заранее понятно, что стратегия B2 не входит в оптимальное решение.
Таким образом, столбец B2 может быть исключен из рассмотрения до начала решения задачи, поскольку соответствующая стратегия заведомо невыгодна для игрока B по сравнению со стратегией B2.
Итак, исходная игра может быть упрощена путем исключения из платежной матрицы строк и столбцов, соответствующих заведомо невыгодным стратегиям.
Такими стратегиями для игрока А являются те, которым соответствуют строки с элементами, заведомо меньшими по сравнению с элементами како-либо другой строки.
Для игрока В невыгодным стратегиям соответствуют столбцы с элементами, заведомо бoльшими по сравнению с элементами какого-либо другого столбца.
5. Приведение парной
игры к задаче линейного
Игра размера mxn не имеет наглядной геометрической интерпретации. Ее решение достаточно трудоемко, но принципиальных трудностей не имеет, поскольку может быть сведено к решению задаче линейного программирования.
Наряду с приводимыми выше теоремой Неймана и теоремой об активных стратегиях справедлива следующая терема теории игр.
Теорема. Для того чтобы число v было ценой игры, а U* и Z*- оптимальными стратегиями, необходимо и достаточно выполнение неравенств:
Рассмотрим игру mxn, определяемую матрицей:
A = |
|
a11 a12 ... a1n ... am1 am2 ... amn |
. |
Как и ранее, игрок A обладает стратегиями A1, A2, ..., Am, игрок В – стратегиями B1, B2, …, Bn. Требуется определить оптимальные стратегии игроков U* и Z*.
Рассмотрим оптимальную стратегию U* игрока A.
Согласно теореме, приведенной
выше, справедливо следующее
Если игрок А применяет смешанную стратегию U* = ( , , ..., ) против чистой стратегии Bj игрока В, то он получает средний выигрыш илиматематическое ожидание выигрыша aj = a1j + a2j + ... + amj , .
Для оптимальной стратегии U* все средние выигрыши не меньше цены игры v, поэтому получаем систему неравенств:
|
(5.3) |
Предположим для определенности, что v > 0.
Этого всегда можно достигнуть благодаря тому, что прибавление ко всем элементам матрицы А одного и того же постоянного числа С не приводит к изменению оптимальных стратегий, а только лишь увеличивает цену игры на С.
Каждое из неравенств разделим на число v (v > 0), а также введем новые переменные: y1 = / v, y2 = / v, ..., ym = / v.
Тогда система (5.3) примет вид:
|
(5.4) |
При этом yi ≥ 0, .
Далее рассмотрим равенство + + ... + = 1.
Разделим неравенство на число v (v ≠ 0). Получим:
y1 + y2 + ... + ym = 1/v. |
(5.5) |
Вспомним, что цель игрока А – максимизировать свой гарантированный выигрыш, т.е. цену игры v. Максимизация цены игры v эквивалентна минимизации величины 1/v, поэтому задача может быть сформулирована следующим образом: определить значения переменных yi ≥ 0, i = 1, 2, …, m, так, чтобы они удовлетворяли линейным ограничениям (5.4) и при этом линейная функция (5.5) обращалась в минимум.
Перед нами задача линейного программирования.
Решая задачу (5.4) – (5.5), можно найти оптимальную стратегию U*.
Аналогичные рассуждения выполним и для игрока В.
Обозначив xj = / v, , в результате получим:
|
(5.6) |
x1 + x2 + ... + xn = 1/v. |
(5.7) |
Таким образом, задача определения оптимальной стратегии игрока В сводится к следующему: определить значения переменных xj ≥ 0, j = 1, 2, …, n, так, чтобы они удовлетворяли линейным ограничениям (5.6) и при этом линейная функция (5.7) обращалась в максимум.
Решая задачу линейного программирования (5.6) – (5.7), получим оптимальную стратегию Z*.
Вновь приведем формулировки
полученных задач линейного
|
a11y1 + a21y2 +
... + am1ym≥ 1, ... a1ny1 + a2ny2 + ... + amnym≥ 1; |
|
a11x1 + a12x2 +
... + a1nxn≤ 1, ... am1x1 + am2x2 + ... + amnxn ≤ 1; |
||
yi ≥ 0, |
xj ≥ 0, |
Очевидно, что задачи (5.4) – (5.5) и (5.6) – (5.7) представляют собой пару взаимно двойственных задач линейного программирования. Их решение позволяет решить соответствующую игру.
При этом:
|
(5.8) |
Таким образом, процесс нахождения решения игры с использованием методов линейного программирования включает следующие этапы.
1. Формулировка пары
2. Определение оптимальных планов двойственных задач.
3. Нахождение решения
игры с использованием
Пример 5.7. Предприятие выпускает скоропортящуюся продукцию, которую может сразу отправить потребителю (стратегия В1), отправить на склад для хранения (стратегия В2) или подвергнуть дополнительной обработке (стратегия В3) для длительного хранения.
Потребитель может приобрести продукцию немедленно (стратегия A1), в течение небольшого времени (стратегия A2), по истечении длительного периода времени (стратегия A3).
В случае стратегий B2 и B3 предприятие несет дополнительные затраты на хранение и переработку продукции, которые не требуются для B1, однако при B1 следует учесть возможные убытки из-за порчи продукции, если потребитель выберет стратегии А2 или А3.
Определите оптимальные
пропорции продукции для
Таблица 5.5 - Платежная матрица примера 5.7
B1 |
B2 |
B3 | |
A1 |
2 |
5 |
10 |
A2 |
8 |
6 |
8 |
A3 |
12 |
8 |
6 |
Решение.
Проверим игру на наличие седловой точки: = 6, = 8. Седловая точка отсутствует. Упростить игру, путем исключения заведомо невыгодных стратегий не удается.
Составим пару двойственных
задач линейного
|
2y1 + 8y2 + 12y3 ≥
1, |
|
2x1 + 5x2 + 10x3 ≤
1, |
||
y1 ≥ 0, y2 ≥ 0, y3 ≥ 0. |
x1 ≥ 0, x2 ≥ 0, x3 ≥ 0. |
Методы решения задач линейного программирования обсуждались нами в разделе "Линейное программирование".
Решая первую из задач, получим:
Решение второй задачи дает следующие результаты:
Используя соотношения (5.8) найдем решение игры:
Информация о работе Экономико-математическое моделирование задач теории игр