Теория игр

Автор работы: Пользователь скрыл имя, 11 Мая 2013 в 16:48, реферат

Краткое описание

Игр теория, раздел математики, изучающий формальные модели принятия оптимальных решений в условиях конфликта. При этом под конфликтом понимается явление, в котором участвуют различные стороны, наделённые различными интересами и возможностями выбирать доступные для них действия в соответствии с этими интересами. Отдельные математические вопросы,

Скачать полностью (298.87 Кб) Сколько стоит заказать работу?

Прикрепленные файлы: 1 файл

теория игр.docx

— 326.61 Кб (Скачать документ)

• Равновесие доминирующих стратегий. Фирма А сравнивает свой выигрыш при обоих вариантах развития событий (-3 и 0, если Б решает развязать ценовую войну) и (4 и 0, если Б решает снизить выпуск). У нее нет стратегии, обеспечивающей максимальный выигрыш вне зависимости от действий Б: 0 > -3 "не входить на рынок", если Б оставляет выпуск на прежнем уровне, 4 > 0 "входить", если Б снижает выпуск (см. сплошные стрелки). Хотя у фирмы А нет доминирующей стратегии, у Б такая стратегия есть. Она заинтересована снижать выпуск вне зависимости от действий А (4 > -2, 10 10, см. пунктирные стрелки). Следовательно, равновесие доминирующих стратегий отсутствует.

• Равновесие по Нэшу. Лучший ответ фирмы А на решение фирмы Б оставить выпуск прежним – не входить, а на решение снизить выпуск – входить. Лучший ответ фирмы Б на решение фирмы А войти на рынок – снизить выпуск, при решении не входить – обе стратегии равнозначны. Поэтому два равновесия по Нэшу (N₁, N₂) находятся в точках (4, 4) и (0, 10) – А входит, а Б снижает выпуск, или А не входит, а Б не снижает выпуск. Убедиться в этом достаточно легко, так как в этих точках никто из участников не заинтересован в изменении своей стратегии.

• Равновесие по Штакельбергу. Предположим, первой принимает решение фирма А. Если она выбирает входить на рынок, то в конечном счете окажется в точке (4, 4): выбор фирмы Б однозначен в этой ситуации, 4 > -2. Если она решает воздержаться от входа на рынок, то итогом будут две точки (0, 10): предпочтения фирмы Б допускают оба варианта. Зная это, фирма А максимизирует свой выигрыш в точках (4, 4) и (0, 10), сравнивая 4 и 0. Предпочтения однозначны, и первое равновесие по Штакельбергу St_A будет находиться в точке (4, 4). Аналогичным образом, равновесие по Штакельбергу St_Б, когда первой принимает решение фирма Б, будет находиться в точке (0, 10).

• Равновесие по Парето. Чтобы определить оптимум по Парето, мы должны последовательно перебрать все четыре исхода игры, отвечая на вопрос: "Обеспечивает ли переход к любому другому исходу игры увеличение полезности одновременно для обоих участников?" Например, из исхода (-3, -2) мы можем перейти к любому другому исходу, выполняя указанное условие. Только из исхода (4, 4) мы не можем двинуться дальше, не уменьшая при этом полезности ни одного из игроков, это и будет равновесием по Парето, Р.

5.2. Классификация моделей

Теперь рассмотрим несколько базовых для теории игр моделей. Эти модели отличаются количеством точек равновесия по Нэшу и их совпадением или несовпадением с точками равновесия по Штакельбергу и по Парето. В общем виде типология моделей для двух участников, используемых в теории игр, будет выглядеть следующим образом³:

N St	2	1	0
-	I. N₁ = St₁ = St₂ = P N₂	II. N = St₁ = St₂ = P
-		III. N = St₁ = St₂ P
	IV. N₁ = St₁ = P₁ (N₂ = St₂ = P₂)	V. N = St₁ + P₁ (St₂ = P₂)	VII. St₁ = P₁ (St₂ = P₂)
		VI. N = St₁ , (St₂ = P)	VIII. St₁ = P St₂

Модель I касается выбора двумя студентами места встречи: каждого из них при желании можно найти либо в библиотеке, либо в буфете. Предполагается, что встреча в буфете обеспечит обоим студентам большую полезность, они смогут сопроводить ее чашкой кофе или кружкой пива:

Эта игра особенно интересна в связи с тем, что с ее помощью иллюстрируется идея "фокальной точки"⁴ – спонтанно выбираемого обоими студентами места встречи. Если оба хорошо знают друг друга, то им не составит особого труда предположить место, где они смогут найти друг друга. По всей вероятности "фокальной точкой" чаще всего будет буфет.

Модель II иллюстрируется ситуацией "конфликта между супругами в жесткой форме". Супруги решают, каким образом провести вечер, выбирая между двумя альтернативами – идти на концерт или на футбольный матч. Индивидуальные предпочтения очевидны: жена предпочитает концерт, муж – матч, и при этом супруги достаточно низко оценивают удовольствие от совместно проведенного вечера:

Игра интересна тем, что здесь у обоих участников есть доминирующая стратегия (х), идти на концерт – для супруги, идти на матч – для супруга.

Следующая модель III – уже обсуждавшаяся "дилемма заключенных":

Модель IV является вариацией по поводу конфликта между супругами, но на этот раз в мягкой форме. Единственное отличие от конфликта в жесткой форме – супруги высоко оценивают удовольствие от совместно проведенного вечера:

"Проблема разоружения" иллюстрирует модель V. Страна А решает вопрос, развязывать ли войну в отношении страны Б или нет, страна же Б выбирает, вооружаться ли ей или разоружаться. Проблема в том, что разоруженная страна Б станет легкой добычей для агрессора А, а вооруженная сможет адекватно ответить на агрессию:

Ситуация тяжелого морального выбора, связанного с принятием решения о просмотре эротического фильма "9 ¹/₂ недель", является иллюстрацией модели VI. Первый потенциальный зритель будет сожалеть, если ему не удастся увидеть фильм, но если он его все же начинает смотреть, то ему становится стыдно. Для второго зрителя, ханжи, просмотр фильма следует запретить всем, но если уж его смотреть, то только ему одному.

Модель VII может быть представлена в форме следующей игры. Каждый игрок в начале игры имеет 2 дол. и кладет половину этой суммы в коробку. Затем коробка передается первому игроку, который может либо оставить ее себе, либо выбросить в колодец. Второй участник должен предсказать поведение первого, и если ему это удается, то он получает 1 дол. (который оставался у первого). Если же ему не удается угадать, то он отдает первому игроку остававшийся у него доллар. Кроме того, если коробку не бросают в колодец, то игроки делят между собой находящуюся в ней сумму.

Наконец, взаимоотношения государства и инвестора описываются моделью VIII. У инвестора есть два варианта действий – инвестировать в стране или не инвестировать. Государство же может устанавливать высокое налогообложение доходов от инвестиций или отменить налоги вообще.

Выводы. Рассмотренные модели позволяют увидеть и проанализировать проблемы, возникающие в ходе взаимодействий индивидов⁵:

• Проблема координации возникает в случае существования двух точек равновесия по Нэшу (модели I, IV). Решение проблемы координации связано с введением дополнительных институциональных условий, существования "фокальных точек" или соглашений. Например, согласование супругами своих действий существенно облегчается при наличии соглашения о приоритете интересов супруги.

• Проблема совместимости характерна для ситуаций, когда равновесие по Нэшу отсутствует (модели VII, VIII). Индивиды не могут согласовать свои действия, если институты не ограничивают и не "направляют" выбор стратегий. Например, введение во взаимоотношения государства и инвестора фактора репутации государства позволяет остановиться на исходе (2, 3).

• Проблема кооперации – равновесие по Нэшу существует, оно единственно, но Парето-неоптимально (модель III – "дилемма заключенных"). И в этой ситуации введение институционального ограничения, нормы "не признавать вину никогда", как мы уже видели на примере итальянской мафии, обеспечивает достижение оптимального по Парето результата.

• Проблема справедливости становится актуальной, если единственное равновесие по Нэшу характеризуется асимметричным, несправедливым распределением выигрыша между участниками взаимодействия (модели V, VI). Одним из вариантов решения проблемы несправедливости будет переход к повторяющимся играм и возникновение норм на основе "смешанных" стратегий, когда в момент времени t₀ индивид выбирает стратегию А, а в момент времени t₁ – стратегию Б и т. д.

Лекция №6. ПОВТОРЯЮЩИЕСЯ ИГРЫ

6.1. Смешанные стратегии

Обратимся к более подробному анализу повторяющихся игр. Когда игроки попадают в определенную ситуацию выбора неоднократно, то их взаимодействие существенным образом усложняется. Они могут позволить себе комбинировать стратегии, максимизируя общий выигрыш. Покажем это с помощью модели, описывающей отношения между Центральным банком (ЦБ) и экономическим агентом в связи с проводимой ЦБ кредитно-денежной политикой. К слову, эта ситуация интересна еще и в качестве примера использования теории игр для анализа конкретных экономических проблем. Итак, ЦБ ориентируется либо на жесткую кредитно-денежную политику, стремясь поддержать инфляцию на фиксированном уровне ( ), либо на эмиссию и, следовательно, повышение темпов инфляции ( ). В свою очередь, экономический агент действует на основе своих инфляционных ожиданий (устанавливает цены на свою продукцию, решает вопросы о приобретении товаров и услуг и т.д.), которые могут либо подтверждаться, либо не подтверждаться в результате проводимой ЦБ политики. В случае если > , ЦБ получает прибыль от сеньоража и от инфляционного налога. Если > , то в проигрыше оказывается и ЦБ из-за сокращения поступлений от сеньоража, и экономические агенты, которые продолжают нести тяжесть инфляционного налога⁶. Если > , то сохраняется статус-кво и в проигрыше никто не оказывается. Наконец, если < , то проигрывают только экономические агенты: производители – из-за потери спроса на необоснованно подорожавшую продукцию, потребители – из-за создания неоправданных запасов.

Предложенная модель практически идентична по своей структуре базовой модели VIII: при однократном взаимодействии у агентов нет доминирующих стратегий, отсутствует и равновесие по Нэшу. При повторяющемся многократно взаимодействии, а именно такое взаимодействие и характерно для реальных ситуаций, оба участника могут использовать и ту, и другую имеющуюся у них в распоряжении стратегии. Позволяет ли игрокам чередование стратегий в определенной последовательности максимизировать свою полезность, т. е. достичь равновесия по Нэшу в смешанных стратегиях⁷: исхода, при котором ни один участник не может увеличить свой выигрыш, изменяя в одностороннем порядке свою стратегию? Предположим, что ЦБ проводит жесткую кредитно-денежную политику с вероятностью P₁ (в P₁ % случаев), а с вероятностью (1 – P₁) – инфляционную политику. Тогда при выборе экономическим агентом неинфляционных ожиданий ( = ) ЦБ может рассчитывать на получение выигрыша, равного EU(ЦБ) = P₁ 0 + 1 (1 – P₁) = 1 – P₁. В случае инфляционных ожиданий у экономического агента выигрыш ЦБ составит EU(ЦБ) = Р₁ 0 + (1 – P₁) (-2) = 2P₁ – 2. Теперь допустим, что экономический агент имеет неифляционные ожидания с вероятностью Р₂ (в P₂ % случаев), а инфляционные ожидания – с вероятностью (1 – Р₂). Отсюда ожидаемая полезность ЦБ в итоге составит EU(ЦБ) = Р₂ (1 – P₁) + (1 – P₂) (2P₁ – 2) = 3P₂ – 3P₁P₂ + 2P₁ – 2. Аналогичные расчеты для экономического агента дадут EU(э.а.) = P₁ (P₂ – 1) + (1 – P₁) (-P₂ – 2) = 2P₁P₂ + P₁ – P₂ – 2. Если мы перепишем данные выражения в следующей форме EU(ЦБ) = P₁ (2 – 3P₂) + 3P₂ – 2 и EU(э.а.) = P₂ (2P₁ – 1) + P₁ – 2, то нетрудно заметить, что при Р₂ = 2/3 выигрыш ЦБ не зависит от его собственной политики, а при P₁ = 1/2 выигрыш экономического агента не зависит от его ожиданий.

Иными словами, равновесием по Нэшу в смешанных стратегиях будет формирование экономическим агентом в ²/₃ случаев неинфляционных ожиданий и проведение ЦБ в половине случаев жесткой кредитно-денежной политики. Найденное равновесие достижимо при условии, что экономические агенты формируют ожидания рациональным образом, а не на основе инфляционных ожиданий в предыдущий период, скорректированных на ошибку прогноза предыдущего периода⁸. Следовательно, изменения в политике ЦБ влияют на поведение экономических агентов только в той степени, в которой они неожиданны и непредсказуемы. Стратегия ЦБ в 50% случаев проводить жесткую кредитно-денежную политику, а в 50% – мягкую как нельзя лучше соответствует созданию атмосферы непредсказуемости. Интересно, что в России 90-х годов господствовал адаптивный тип инфляционных ожиданий⁹, не обеспечивающий минимизацию проигрыша для экономических агентов при данных заложенных в модель условиях.

6.2. Эволюционно-стабильная стратегия

Разновидностью повторяющихся игр являются ситуации, когда индивид многократно попадает в определенную ситуацию выбора, но его контрагент не постоянен, а в каждом периоде индивид взаимодействует с новым визави. Поэтому вероятность выбора контрагентом той или иной стратегии будет зависеть не столько от конфигурации смешанной стратегии, сколько от предпочтений каждого из контрагентов. В частности, предполагается, что из общего числа N потенциальных контрагентов n (n / N %) всегда выбирают стратегию А, а m (m/N %) – стратегию Б. Тем самым создаются предпосылки для достижения нового типа равновесия, эволюционно-стабильных стратегий. Эволюционно-стабильной (ESS – Evolutionary Stable Strategy) становится та стратегия, при которой если все члены определенной популяции используют ее, то никакая альтернативная стратегия не может ее вытеснить посредством механизма естественного отбора¹⁰. Рассмотрим в качестве примера простейший вариант проблемы координации: разъезд на узкой дороге двух автомобилей (ситуация близка по некоторым параметрам и к модели I, и к модели IV). Предполагается, что в данной местности лево- и правосторонний стандарты движения равноправны (или же Правила дорожного движения просто не всегда выполняются)¹¹. Автомобилю А движутся навстречу несколько автомобилей, с которыми ему нужно разъехаться. Если оба автомобиля принимают влево, въезжая на левую обочину по ходу движения, то они разъезжаются без проблем. То же самое происходит, если оба автомобиля принимают вправо. Когда же один автомобиль принимает вправо, а второй – влево и наоборот, то разъехаться они не смогут:

Итак, автомобилисту А известен приблизительный процент автомобилистов Б, систематически принимающих влево (P), и процент автомобилистов Б, принимающих вправо (1 – Р). Условие для того, чтобы стратегия "принять вправо" стала для автомобилиста А эволюционно-стабильной, формулируется следующим образом: EU (вправо) > EU (влево), или 0P+ 1 (1 – P) (1P + 0 (1 – P), откуда P > 1/2. Таким образом, при превышении доли автомобилистов во встречном потоке, принимающих вправо, уровня 50% эволюционно-стабильной стратегией становится "принять вправо" – сворачивать на правую обочину при каждом разъезде.

Информация о работе Теория игр