Теория игр

Автор работы: Пользователь скрыл имя, 11 Мая 2013 в 16:48, реферат

Краткое описание

Игр теория, раздел математики, изучающий формальные модели принятия оптимальных решений в условиях конфликта. При этом под конфликтом понимается явление, в котором участвуют различные стороны, наделённые различными интересами и возможностями выбирать доступные для них действия в соответствии с этими интересами. Отдельные математические вопросы,

Прикрепленные файлы: 1 файл

теория игр.docx

— 326.61 Кб (Скачать документ)

Игр теория

Игр теория, раздел математики, изучающий формальные модели принятия оптимальных решений в условиях конфликта. При этом под конфликтом понимается явление, в котором участвуют различные стороны, наделённые различными интересами и возможностями выбирать доступные для них действия в соответствии с этими интересами. Отдельные математические вопросы, касающиеся конфликтов, рассматривались (начиная с 17 в.) многими учёными. Систематическая же математическая теория игр была детально разработана американскими учёными Дж. Нейманом и О. Моргенштерном (1944) как средство математического подхода к явлениям конкурентной экономики. В ходе своего развития И. т. переросла эти рамки и превратилась в общую математическую теорию конфликтов. В рамках И. т. в принципе поддаются математическому описанию военные и правовые конфликты, спортивные состязания, "салонные" игры, а также явления, связанные с биологической борьбой за существование.

В условиях конфликта стремление противника скрыть свои предстоящие  действия порождает неопределённость. Наоборот, неопределённость при принятии решений (например, на основе недостаточных  данных) можно интерпретировать как  конфликт принимающего решения субъекта с природой. Поэтому И. т. рассматривается  также как теория принятия оптимальных  решений в условиях неопределённости. Она позволяет математизировать некоторые важные аспекты принятия решений в технике, сельском хозяйстве, медицине и социологии. Перспективен подход с позиций И. т. к проблемам  управления, планирования и прогнозирования.

Основным в И. т. является понятие игры, являющееся формализованным  представлением о конфликте. Точное описание конфликта в виде игры состоит  поэтому в указании того, кто и  как участвует в конфликте, каковы возможные исходы конфликта, а также  кто и в какой форме заинтересован  в этих исходах. Участвующие в  конфликте стороны называются коалициями действия; доступные для них действия — их стратегиями; возможные исходы конфликта — ситуациями (обычно каждая ситуация понимается как результат  выбора каждой из коалиций действия некоторой  своей стратегии); стороны, заинтересованные в исходах конфликта, — коалициями интересов; их интересы описываются  предпочтениями тех или иных ситуаций (эти предпочтения часто выражаются численными выигрышами). Конкретизация  перечисленных объектов и связей между ними порождает разнообразные  частные классы игр.

Если в игре имеется  единственная коалиция действия, то стратегии  этой коалиции можно отождествить с  ситуациями и далее больше уже  о стратегиях не упоминать. Такие  игры называются нестратегическими. Класс  нестратегических игр весьма обширен. К их числу относятся, в частности, кооперативные игры (см. Кооперативная теория игр).

Примером нестратегической (кооперативной) игры может служить  простая игра, состоящая в следующем. Множеством ситуаций являются в ней  всевозможные распределения (дележи) между  игроками некоторого количества однородной полезности (например, денег). Каждый делёж  описывается теми суммами, которые  при этом получают отдельные игроки. Коалиция интересов называется выигрывающей, если она может даже в условиях противодействия со стороны всех остальных игроков присвоить  и разделить между своими членами  всю имеющуюся полезность. Все  коалиции, не являющиеся выигрывающими, совсем не могут присвоить какой-либо доли полезности. Такие коалиции называются проигрывающими. Естественно считать, что выигрывающая коалиция предпочитает один делёж другому, если доля каждого из её членов в условиях первого дележа больше, чем в условиях второго. Проигрывающие же коалиции не могут сравнивать дележи по предпочтительности (это условие также вполне естественно: коалиция интересов, которая сама не в состоянии добиться ничего, вынуждена соглашаться на любой делёж и лишена возможности выбора между дележами).

Если в игре имеется  более одной коалиции действия, то игра называется стратегической. Важный класс стратегических игр составляют бескоалиционные игры, в которых  коалиции действия совпадают с коалициями интересов (они называются игроками), а предпочтения для игроков описываются  их функциями выигрыша: игрок предпочитает одну ситуацию другой, если в первой ситуации он получает больший выигрыш, чем во второй.

Одним из простейших примеров бескоалиционной игры может служить "морра" в следующем своём  варианте. Три игрока показывают одновременно 1 или 2 пальца каждый. Если все три  игрока показывают одно и то же число, то выигрыш каждого равен нулю. В противном случае один из игроков  показывает a ( = 1 или 2) и получает b из некоторого источника (например, из банка, образованного предварительными взносами), а два других игрока, показывающие одно и то же b ( ¹ a), не получают ничего.

Если в бескоалиционной  игре участвуют два игрока, а значения их функций выигрыша в любой ситуации отличаются только знаками, то игра называется антагонистической игрой; в ней выигрыш одного из игроков в точности равен проигрышу другого. Если в антагонистической игре множества стратегий обоих игроков конечны, то игра называется матричной игрой ввиду некоторой специфической возможности её описания.

В качестве другого примера  бескоалиционной игры можно привести шахматы. В этой игре участвуют два  игрока (белые и чёрные). Стратегия  каждого из игроков есть мыслимое (хотя практически и не поддающееся  детальному описанию) правило выбора в каждой возможной позиции некоторого хода, допускаемого движениями фигур. Пара таких правил (за белых и  за чёрных) составляет ситуацию, которая  полностью определяет протекание шахматной  партии и в том числе её исход. Функция выигрыша белых имеет  значение 1 на выигрываемых партиях, 0 на ничейных и — 1 на проигрываемых (такой  способ начисления очков практически  ничем не отличается от принятого  в турнирной и матчевой практике). Функция выигрыша чёрных отличается от функции выигрыша белых лишь знаком. Из сказанного видно, что шахматы  относятся к числу антагонистических  и притом матричных игр. В шахматах стратегии не выбираются игроками до начала игры, а реализуются постепенно, ход за ходом. Это значит, что шахматы  принадлежат к позиционным играм.

И. т. является нормативной  теорией, тоесть предметом её изучения являются не столько сами модели конфликтов (игры), как таковые, сколько содержание принимаемых в играх принципов  оптимальности, существования ситуаций, на которых эти принципы оптимальности  реализуются (такие ситуации или  множества ситуаций называются решениями  в смысле соответствующего принципа оптимальности), и, наконец, способы  нахождения таких ситуаций. Рассматриваемые  в И. т. объекты — игры — весьма разнообразны, и пока не удалось  установить принципов оптимальности, общих для всех классов игр. Практически  это означает, что единого для  всех игр истолкования понятия оптимальности  ещё не выработано. Поэтому прежде чем говорить, например, о наивыгоднейшем поведении игрока в игре, необходимо установить, в каком смысле эта  выгодность понимается. Все применяемые  в И. т. принципы оптимальности при  всём их внешнем разнообразии отражают прямо или косвенно идею устойчивости ситуаций или множеств ситуаций, составляющих решения. В бескоалиционных играх основным принципом оптимальности считается принцип осуществимости цели, приводящий к ситуациям равновесия. Эти ситуации характеризуются тем свойством, что любой игрок, который отклонится от ситуации равновесия (при условии, что остальные игроки не изменят своих стратегий), не увеличит этим своего выигрыша.

В частном случае антагонистических  игр принцип осуществимости цели превращается в так называемый принцип  максимина (отражающий стремление максимизировать  минимальный выигрыш).

Принципы оптимальности (первоначально выбиравшиеся интуитивно) выводятся на основании некоторых  заранее задаваемых их свойств, имеющих  характер аксиом. Существенно, что различные  применяемые в И. т. принципы оптимальности  могут противоречить друг другу.

Теоремы существования в  И. т. доказываются преимущественно  теми же неконструктивными средствами, что и в других разделах математики: при помощи теорем о неподвижной  точке, о выделении из бесконечной  последовательности сходящейся подпоследовательности  и т. п., или же, в весьма узких  случаях, путём интуитивного указания вида решения и последующего нахождения решения в этом виде.

Фактическое решение некоторых  классов антагонистических игр  сводится к решению дифференциальных и интегральных уравнений, а матричных  игр — к решению стандартной  задачи линейного программирования. Разрабатываются приближённые и численные методы решения игр. Для многих игр оптимальными оказываются так называемые смешанные стратегии, тоесть стратегии, выбираемые случайно (например, по жребию).

И. т., созданная для математического  решения задач экономического и  социального происхождения, не может  в целом сводиться к классическим математическим теориям, созданным  для решения физических и технических  задач. Однако в различных конкретных вопросах И. т. широко используются весьма разнообразные классические математические методы. Кроме этого, И. т. связана  с рядом математических дисциплин  внутренним образом. В И. т. систематически и по существу употребляются понятия  теории вероятностей. На языке И. т. можно сформулировать большинство  задач математической статистики. Необходимость  при анализе игры количественного  учёта неопределённости предопределяет важность и тем самым связь  И. т. с теорией информации и через  её посредство — с кибернетикой. Кроме того, И. т., будучи теорией  принятия решений, может рассматриваться  как существенная составная часть  математического аппарата операций исследования.

И. т. применяется в экономике, технике, военном деле и даже в  антропологии. Основные трудности практического  применения И. т. связаны с экономической  и социальной природой моделируемых ею явлений и недостаточным умением  составлять такие модели на количественном уровне.

К 70-м гг. 20 в. число публикаций по научным вопросам И. т. достигло многих сотен (в том числе несколько  десятков монографий). Курсы по И. т. читаются во многих высших учебных  заведениях для студентов математических и экономических специальностей (в СССР — с 1956).

Международные конференции  по И. т. проходили в Принстоне (1961), Иерусалиме (1965), Вене (1967) и Беркли (1970). Всесоюзные конференции по И. т. состоялись в Ереване (1968) и Вильнюсе (1971).

Лит.: Нейман Дж. Моргенштерн О., Теория игр и экономическое поведение, пер. с англ., М., 1970; Льюс Р., Райфа Х., Игры и решения, пер. с англ., М., 1961; Карлин С., Математические методы в теории игр, программировании и экономике, пер. с англ., М., 1964; Воробьев Н. Н., Современное состояние теории игр, "Успехи математических наук", 1970, т. 25, № 2(152), с. 80—140; Оуэн Г., Теория игр, пер. с англ., М., 1971; Contributions to the theory of games, v.1—4, Princeton, 1950—59; Advances in game theory, Princeton, 1964.


 

 

Право регулирует поведение  людей в сложных ситуациях, ког  да в процессе их взаимодействия возникает  конфликт. Этот кон фликт можно  представить в виде математической модели, которая называется игрой. В зависимости от возможности предварительных переговоров между игроками различают кооперативные и некоопе ративные игры. Игра называется кооперативной, если до ее начала игроки образуют коалиции и договариваются о своих стратегиях. Примером кооперативной игры может служить образование коали ций в парламенте при голосовании. Мы будем иметь дело с играми, в которых игроки не могут координировать свои стратегии подоб ным образом. Действительно, если бы они могли договариваться, то необходимости в институте не возникало бы, а между тем цель нашего использования игр в Главе 1 — объяснить, почему в опреде-ленных ситуациях возникает потребность в институте.  
Игры, в которых каждый участник действует независимо от других и заинтересован в достижении наиболее благоприятного результата для себя при заданных правилах игры и существую щих ограничениях, называются некооперативными. В некоопера тивных играх даже если все участники взаимодействия выбирают такие варианты поведения, при которых достигается кооперация, они делают это только потому, что каждому из них это становится выгодным.  
Каждая игра, описывающая конфликт при взаимодействии людей, должна содержать следующие составляющие:  
множество участников взаимодействия, или игроков; игро кам можно присваивать номера или имена;  
описание возможных действий каждого из игроков, кото рые называются стратегиями;  
набор выигрышей, которые получают игроки при каждом возможном исходе.  
В теории игр предполагается, что выигрыши, которые по лучает каждый игрок, и стратегии, доступные им, известны всем игрокам, т.е. каждый игрок знает свои возможные стратегии и выигрыши и ему также известны стратегии и выигрыши другого игрока. На основе этой информации каждый игрок решает, ка кую стратегию выбрать. Цель каждого игрока — добиться макси мального выигрыша (или минимального проигрыша), т.е. каждый игрок обнаруживает признаки «человека экономического», который действует в своих собственных эгоистических интересах и макси мизирует собственное благосостояние.

Выигрыш каждого из игроков зависит от того, какую стра тегию выбрал этот игрок, а также от стратегии другого игрока. Зависимость выигрышей игроков от выбранных ими стратегий описывается матрицей выигрышей. Строки этой матрицы — это возможные стратегии первого игрока, а столбцы — возможные стратегии второго игрока. В каждой клетке матрицы располагают ся пары выигрышей, которые определяются соответствующими стратегиями игроков. Напомним, что выигрыш первого игрока зависит не только от того, какую стратегию выбрал он сам (т.е. от номера строки), но также и от того, какую стратегию выбрал вто рой игрок (т.е. от номера столбца). До того момента, когда взаи модействие действительно произойдет, игроки не знают точную величину своего выигрыша, т.е. игроки осуществляют выбор в условиях неопределенности.  
Мы будем иметь дело с играми, в которых принимают уча стие два игрока. Эти игроки на протяжении всего взаимодействия будут выбирать только один вариант поведения, в этом случае стратегия игрока называется чистой, в отличие от другой страте гии, которая называется смешанной, потому что игрок чередует ва рианты своего поведения в соответствии с определенной частотой выбора (вероятностью) каждой из стратегий.  
Математические игры часто иллюстрируются с помощью обыч ных игр, в которые играют люди. Проиллюстрируем эти понятия на примере детской игры «камень — ножницы — бумага», правила ко торой всем хорошо известны [Kreps, 1997, р. 9—36]. В эту игру обыч но играют вдвоем. Игроки — ребенок А и ребенок Б — одновременно выбирают один из трех возможных вариантов — камень, ножницы, или бумага. Это и будут возможные стратегии участников игры. В зависимости от того, какой выбор сделал каждый ребенок, игру выигрывает или ребенок А, или ребенок Б, возможна также ничья. Предположим, что в случае выигрыша ребенок получает 1, в случае проигрыша — теряет 1, а в случае ничьей — 0. Тогда эту игру можно представить в следующей форме:  
Таблица 10 Ребенок Б Камень Ножницы Бумага Ребенок А Камень 0;0 +1;-1 -1;+1 Ножницы -1;+1 0;0 +1;-1 Бумага +1;-1 -1;+1 0;0

В этой игре есть все необходимые составляющие: два игрока — ребенок А и ребенок Б, у каждого игрока есть три доступные стратегии — сказать «камень», «ножницы» или «бумага». Стратегии ребенка А представлены в строках, а стра тегии ребенка Б — в столбцах матрицы. Каждая клетка матри цы задает платежи, которые получит каждый участник при вы боре соответствующих стратегий. Первая цифра в ячейке — это выигрыш ребенка А, вторая цифра в ячейке — выигрыш ребенка Б. Например, если ребенок А выберет камень (верхняя строка), а ребенок Б — бумагу (правый столбец), то ребенок А проиграет 1, а ребенок Б — выиграет 1 (результатом игры будет пересечение верх ней строки и правого столбца).  
Игры, представленные в подобной форме, называются ма тричными играми.  
Одним из решений игры может быть нахождение равновесия по Нэшу, т.е. такого набора стратегий (по одной для каждого игро ка), при котором ни один из игроков не имеет стимула в односто роннем порядке поменять свою стратегию. Или, выражаясь более просто, можно сказать, что игроки будут находиться в равнове сии по Нэшу, если, узнав о выборе другого игрока, каждый из них остается довольным своим выбором.  
Рассмотрим следующую игру:  
Таблица 11 Б 1 2 А 1 5;5 -1;6 2 6;-1 0;0  
Равновесием по Нэшу в этой игре является пара стратегий {2;2}. Если бы игроки А и Б одновременно вместе изменили свой выбор в пользу стратегии «1», каждый из них увеличил бы свой выигрыш с 0 до 5. Однако, это вряд ли возможно в ситуации, когда они выбирают стратегию одновременно и не могут повлиять друг на друга. У каждого игрока есть стимул отклониться от стратегии «1» в одиночку, так как тем самым он может увеличить свой выи грыш с 5 до 6. И даже если бы игроки могли заранее договорить ся о том, что каждый выберет стратегию «1» в ситуации, когда не существует гарантии выполнения обязательства не отклоняться от стратегии «1», или когда нет возможности наказать провинив шуюся сторону, результат, скорее всего не изменился бы.

 

 

Определив предмет институционализма  как анализ взаимодействия индивидов  и структур, его обеспечивающих, необходимо обратиться к вопросу  о методе. Математический аппарат, традиционно  используемый экономистами (дифференциальное исчисление), вряд ли приемлем в качестве базового метода в анализе взаимодействий. Главным образом потому, что использование  этого аппарата обосновывается рядом  утверждений из «жесткого ядра»  неоклассики, с которыми соглашаются  далеко не все институцио-налисты: полной рациональностью индивидов; существованием, единственностью и Парето-оптимальностью равновесия; экзогенным характером предпочтений, описываемых ординалистской теорией  предельной полезности.

Формальные модели в институциональной  экономике строятся с помощью теории игр, развитие которой берет отсчет с момента появления книги Дж. фон Неймана и О. Моргенштерна «Теория игр и экономическое поведение» (1944). Во-первых, теория игр занимается анализом ситуаций, в которых поведение индивидов взаимообусловлено: решение каждого из них оказывает влияние на результат взаимодействия и. следовательно, на решения остальных индивидов. Решая вопрос о своих действиях, индивид вынужден ставить себя на место контрагентов. Во-вторых, теория игр не требует полной рациональности индивидов, в ней используется целый ряд моделей индивидов, от индивида как совершенного калькулятора до индивида как робота. В-третьих, теория игр не предполагает существования, единственности и Парето-оптималь-ности равновесия во взаимодействиях. Эти причины и обусловливают наш интерес к формальным моделям институтов, построенным с помощью теории игр. Обратимся к их анализу более подробно.

Первое уточнение касается кооперативных и некооперативных игр. В кооперативных играх возможны обмен информации между участниками и формирование коалиций. В некооперативных играх, о которых и пойдет в основном речь, исходным пунктом в анализе является индивидуальный участник, причем обмен информации между участниками и формирование коалиций исключены. Далее, игра может быть представлена либо в стратегической (матричной), либо в развернутой форме 1. Например, вернемся к упомянутой в предыдущих лекциях «дилемме заключенных» (рис. 5.1).

 


 

Рис. 5.1

Первые цифры в описании результатов взаимодействия отражают полезность первого участника, вторые — второго: U1 (признавать, при условии, что второй не признает) = 3. Напомним, что здесь речь идет о «полезности» различных сроков осуждения, которая обратно пропорциональна их величине.

5.1. Типы равновесий

В каждом взаимодействии могут существовать различные виды равновесий: равновесие доминирующих стратегий, равновесие по Нэшу, равновесие по Штакельбергу и равновесие по Парето. Доминирующей стратегией называется такой план действий, который обеспечивает участнику максимальную полезность вне зависимости от действий другого участника1. Соответственно, равновесием доминирующих стратегий будет пересечение доминирующих стратегий обоих участников игры. Равновесие по Нэшу — ситуация, в которой стратегия каждого из игроков является лучшим ответом на действия другого  игрока.   Иными  словами,  это равновесие

обеспечивает игрока максимумом полезности в зависимости от действий другого игрока. Равновесие по Штакельбергу возникает тогда, когда существует временной лаг в принятии решений участниками игры: один из них принимает решения, уже зная, как поступил другой. Таким образом, равновесие по Штакельбергу соответствует максимуму полезности игроков в условиях неодновременности принятия ими решений. В отличие от равновесия доминирующих стратегий и равновесия по Нэшу этот вид равновесия существует всегда. Наконец, равновесие по Парето существует при условии, что нельзя увеличить полезность обоих игроков одновременно. Рассмотрим на одном из примеров технологию поиска равновесий всех четырех видов.

Доминирующая стратегия — такой план действий, который обеспечивает участнику максимальную полезность вне зависимости от действий другого участника.

Равновесие по Нэшу — ситуация, в которой ни один из игроков не может увеличить свой выигрыш в одностороннем порядке, меняя свой план действий.

Равновесие по Штакельбергу -— ситуация, когда ни один из игроков не может увеличить свой выигрыш в одностороннем порядке, а решения принимаются сначала одним игроком и становятся известными второму игроку.

Равновесие по Парето — ситуация, когда нельзя улучшить положение ни одного из игроков, не ухудшая при этом положения другого и не снижая суммарного выигрыша игроков.

Пусть фирма А  стремится нарушить монополию фирмы  Б на выпуск определенного продукта. Фирма А решает, стоит ли ей входить  на рынок, а фирма Б — стоит  ли ей снижать выпуск в том случае, если А все же решает входить2. В случае неизменного выпуска на фирме Б обе фирмы в проигрыше, если же фирма Б решает снизить выпуск, то она «делится» своей прибылью с А.

 

•    Равновесие доминирующих стратегий. Фирма А сравнивает свой выигрыш при обоих вариантах развития событий (-3 и О, если Б решает развязать ценовую войну) и (4 и 0, если Б решает снизить выпуск). У нее нет стратегии, обеспечивающей максимальный выигрыш вне зависимости от действий Б: 0 > -3 => «не входить на рынок», если Б оставляет выпуск на прежнем уровне, 4 > 0 => «входить», если Б снижает выпуск (см. сплошные стрелки). Хотя у фирмы А нет доминирующей стратегии, у Б такая стратегия есть. Она заинтересована снижать выпуск вне зависимости от действий А (4 > —2, 10 = 10, см. пунктирные стрелки). Следовательно, равновесие доминирующих стратегий отсутствует.

•    Равновесие по Нэшу. Лучший ответ фирмы А на решение фирмы Б оставить выпуск прежним — не входить, а на решение снизить выпуск — входить. Лучший ответ фирмы Б на решение фирмы А войти на рынок — снизить выпуск, при решении не входить — обе стратегии равнозначны. Поэтому два равновесия по Нэшу (N1, N2) находятся в точках (4, 4) и (0, 10) — А входит, а Б снижает выпуск, или А не входит, а Б не снижает выпуск. Убедиться в этом достаточно легко, так как в этих точках никто из участников не заинтересован в изменении своей стратегии.

•    Равновесие по Штакельбергу. Предположим, первой принимает решение фирма А. Если она выбирает входить на рынок, то в конечном счете окажется в точке (4, 4): выбор фирмы Б однозначен в этой ситуации, 4 > —2. Если она решает воздержаться от входа на рынок, то итогом будут две точки (0, 10): предпочтения фирмы Б допускают оба варианта. Зная это, фирма А максимизирует свой выигрыш в точках (4, 4) и (0, 10), сравнивая 4 и 0. Предпочтения однозначны, и первое равновесие по Штакельбергу StA будет находиться в точке (4, 4). Аналогичным образом, равновесие по Штакельбергу StБ , когда первой принимает решение фирма Б, будет находиться в точке (0, 10).

Информация о работе Теория игр