Теория статистических решений. Игры с природой

Автор работы: Пользователь скрыл имя, 15 Сентября 2013 в 17:46, курсовая работа

Краткое описание

В курсе “Теория принятия решений" особое внимание сосредоточено на способах решения конкретных практических задач. Минуя сложную математику, которая лежит в основе методов принятия решений, слушатели знакомятся со всеми основными достижениями в прикладной ТПР - от возможных способов моделирования до принципов оптимальности выбранного решения.

Содержание

1. Введение…………………………………………………………………….…..3
2. История теории статистических решений……………………………………5
3. Методологические основы теории принятия решений……………….……..6
4. Будущее теории принятия решений………………………………………….7
5. Элементы теории статистических решений………………………….………8
6. Игры с природой в условиях определенности………………………………9
7. Игры с природой в условиях неопределенности……………………………11
8. Заключение………………………………………………….……………….…18
9. Список использованной литературы…………………………………………19

Прикрепленные файлы: 1 файл

Курсовая Теория принятия решений.doc

— 158.50 Кб (Скачать документ)

Ответ: нужно купить специализированное оборудование.

Однако в играх с  природой положение коренным образом  меняется: уже в условии заложена устойчивая смешанная стратегия  природы: у = ( 0,3; 0,4; 0,2; 0,1) и мы знаем, что именно этой стратегии придерживается природа.

Если же человек - первый игрок - будет продолжать играть оптимально, то его выигрыш составит  v(x*) = - 150 0,3 - 160 0,4 - 170 0,2 - 180 0,1 = - 161 , а если применит первую, неоптимальную стратегию, то математическое ожидание его выигрыша составит  v(x') = - 100  0,3 - 140  0,4 - 180 0,2 - 220  0,1 = - 144 .

Таким образом, первому  игроку выгодно играть неоптимально !

Ответ: не покупать специализированное оборудование.

Существенное различие между значениями v(x*) и v(x') обьясняется  тем, что смешанная стратегия  природы неоптимальна и она, "отклоняясь" от своей оптимальной стратегии "недополучает" 36 ден.единиц выигрыша.

Игры с природой в условиях неопределенности.

Если распределение  вероятностей будущих состояний  природы не известно, вся информация о природе сводится к перечню ее возможных состояний.

Пример. Игра "Поставщик".

Выпуск продукции фирмы  существенно зависит от скоропортящегося материала, например, молока или ягод, поставляемого партиями стоимостью 100ед. Если поставка не прибывает в  срок, фирма теряет 400 ед. от недовыпуска продукции. Фирма может послать к поставщику свой транспорт (расходы 50 ед.), однако опыт показывает, что в половине случаев транспорт возвращается ни с чем. Можно увеличить вероятность получения материала до 80%, если предварительно послать своего  представителя, но расходы увеличатся еще на 50 ед. Существует возможность приобретать более дорогой (на 50%) материал-заменитель у другого, вполне надежного поставщика, однако, кроме расходов на транспорт (50 ед.) возможны дополнительные издержки хранения материала в размере 30 ед., если его  количество на складе превысит допустимую норму, равную одной партии.

Какой стратегии должен придерживаться завод в сложившейся  ситуации? 

 

Формализация. У природы два состояния: поставщик надежный и поставщик ненадежный. У фирмы - четыре стратегии: 1) не осуществлять никаких дополнительных действий, 2) послать к поставщику свой транстпорт, 3) послать к поставщику представителя и транстпорт, 4) купить и привезти материал-заменитель от другого поставщика.

Составим таблицу расчетов:

 

Затраты и убытки фирмы-изготовителя

Ситуация

Стоимость материала

Недовыпуск продукции

Транспорт

Команди-ровочные расходы

Издержки хранения

Общая сумма

1 1

- 100

0

0

0

0

- 100

1 2

0

- 400

0

0

0

- 400

2 1

- 100

0

- 50

0

0

- 150

2 2

- 50

- 200

- 50

0

0

- 300

3 1

- 100

0

- 50

- 50

0

- 200

3 2

- 80

- 80

- 50

- 50

0

- 260

4 1

- 250

0

- 50

0

- 30

- 330

4 2

- 150

0

- 50

0

0

- 200


 

 

Решение. На основе полученных результатов вычислений можно составить платежную матрицу:

   

min

max

- 100

- 400

- 400

 

- 150

- 300

- 300

 

- 200

- 260

- 260

- 260

- 330

- 200

- 330

 

Ответ. Нужно придерживаться третьей стратегии и затраты не превысят 260 ед., если послать к поставщику представителя и транстпорт.  

 

1. Рассмотренный способ поиска оптимального решения называется критерием Вальда(Максиминный критерий принятия решения). Выбирается решение, гарантирующее получение выигрыша не меньше, чем maxmin:

v= maxminaij = -260 ед.

Применяя этот критерий мы представляем на месте природы  активного и злонамеренного противника. Это пессимистичный подход. 

 

2. Максимаксный критерий. Самый благоприятный случай:

v= maximaxaij = -100 ед.

Если фирма ничего не предпримет, то потратит не больше 100 единиц. Это критерий абсолютного оптимизма.

3. Критерий  пессимизма-оптимизма Гурвица.

Представляется логичным, что при выборе решения вместо двух крайностей в оценке ситуации придерживаться некоторой промежуточной  позиции, учитывающей возможность  как наихудшего, так и наилучшего, благоприятного поведения природы. Такой компромиссный вариант и был предложен Гурвицем. Согласно этому подходу для каждого решения необходимо определить линейную комбинацию min и max выигрыша и взять ту стратегию, для которой эта величина окажется наибольшей:

v= max[a maxaij + (1-a) minaij ], где a - “степень оптимизма” , 0£ a £1.

При  a = 0 критерий Гурвица тождественен критерию Вальда, а при a =1  совпадает с максиминным решением.

На выбор значения степени оптимизма оказывает  влияние мера ответственности: чем  серьезнее последствия ошибочных решений, тем больше желание принимающего решение застраховаться, то есть степень оптимизма a ближе к нулю.

Влияние степени оптимизма  на выбор решения в задаче “Поставщик”.

 

Степень оптимизма

Решение

 

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

А1

1 стратегия

-370

-340

-310

-280

-250

-220

-190*

-160*

-130*

А2

2 стратегия

-285

-270

-255

-240

-225*

-210*

-195

-180

-165

А3

3 стратегия

-254*

-248*

-242*

-236*

-230

-224

-218

-212

-206

А4

4 стратегия

-317

-304

-281

-278

-265

-252

-239

-226

-213


Величина vH  для каждого значения  a отмечена*. При   a £ 4/9 критерий Гурвица рекомендует в задаче “Поставщик” решение А3, при 4/9£ a £2/3 - решение А2. В остальных случаях А1. Ане выгодно во всех случаях.

4. Критерий  Сэвиджа (критерий минимакса риска).

На практике, выбирая одно из возможных решений, часто останавливаются на том, осуществление которого приведет к наименее тяжелым последствиям, если выбор окажется ошибочным. Этот подход к выбору решения математически был сформулирован американским статистиком Сэвиджем в 1954 году и получил название принципа Сэвиджа. Он особенно удобен для экономических задач и часто применяется для выбора решений в играх человека с природой.

По принципу Сэвиджа  каждое решение характеризуется  величиной дополнительных потерь, которые  возникают при реализации этого решения, по сравнению с реализацией решения, правильного при данном состоянии природы. Естественно, что правильное решение не влечет за собой никаких дополнительных потерь, и их величина равна нулю.

При выборе решения, наилучшим  образом соответствующего различным состояниям природы, следует принимать во внимание только эти дополнительные потери, которые по существу, будут являться следствием ошибок выбора.

Для решения задачи строится так называемая “матрица рисков”, элементы котрой показывают, какой убыток понесет игрок (ЛПР) в результате выбора неоптимального аврианта решения.

Риском игрока rij при выборе стратегии i в условиях (состояниях) природы j называется разность между максимальным выигрышем, который можно получить в этих условиях и выигрышем, который получит игрок в тех же условиях, применяя стратегию i.

Если бы игрок знал заранее будущее состояние природы j, он выбрал бы стратегию, которой соответствует max элемент в данном столбце: maxaij, тогда риск:   rij = maxiaij  -  aij.

Критерий Сэвиджа рекомендует  в условиях неопределенности выбирать решение, обеспечивающее минимальное  значение максимального риска:

v= minmaxrij = minmax(maxaij  -  aij).

Для задачи “Поставщик”  минимакс риска достигается сразу  при двух стратегиях А2  и А3:

   

max

min

0

200

200

 

50

100

100

100

100

60

100

100

230

0

130

 

5. Критерий  Лапласа.

В ряде случаев представляется правдоподобным следующее рассуждение: поскольку неизвестны будущие состояния  природы, постольку можно считать  их равновероятными. Этот подход к решению используется в критерии “недостаточного основания” Лапласа.

Для решения задачи для  каждого решения подсчитывается математическое ожидание выигрыша (вероятности  состояний природы полагаются равными y= 1/n, j = 1:n), и выбирается то решение, при котором величина этого выигрыша максимальна.

v= maxå1/n aij  = 1/n maxå aij.

Решением игры “Поставщик”  по критерию Лапласа является вторая стратегия:

 

max

-250

 

-225

-225

-230

 

-265

 

Гипотеза о равновероятности состояний природы является довольно искусственной, поэтому принципом Лапласа можно пользоваться лишь в ограниченных случаях. В более общем случае следует считать, что состояния природы не равновероятны и использовать для решения критерий Байеса-Лапласа.

6.Критерий  Байеса-Лапласа.

Этот критерий отступает  от условий полной неопределенности - он предполагает, что возможным  состояниям природы можно приписать  определенную вероятность их наступления  и, определив математическое ожидание выигрыша для каждого решения, выбрать то, которое обеспечивает наибольшее значение выигрыша:

vBL = maxå aij  yj.

Этот метод предполагает возможность использования какой-либо предварительной информации о состояниях природы. При этом предполагается как  повторяемость состояний природы, так и повторяемость решений, и прежде всего, наличие достаточно достоверных данных о прошлых состояниях природы. То есть основываясь на предыдущих наблюдениях прогнозировать будущее состояние природы (статистический принцип).

Возвращаясь к нашей  игре “Поставщик” предположим, что руководители фирмы-потребителя, прежде чем принять решение, проанализировали, насколько точно поставщие ранее выполнял сроки поставок, и выяснили, что в 25 случаях из 100 сырье поступало с опозданием.

Исходя из этого, можно  приписать вероятность наступления первого состояния природы вероятность y= 0,75 = (1-0,25), второго - y= 0,25. Тогда согласно критерию Байеса-Лапласа оптимальным является решение А1.

Стратегии

å aij yj

А1

- 175*

А2

-187,5

А3

- 215

А4

- 297,5


Перечисленные критерии не исчерпывают всего многообразия критериев выбора решения в условиях неопределенности, в частности, критериев выбора наилучших смешанных стратегий, однако и этого достаточно, чтобы проблема выбора решения стала неоднозначной:

Решение

Критерии

Стратегии

Вальда

maxmax

Гурвица

Сэвиджа

Лапласа

Байеса-Л

А1

 

*

*

   

*

А2

   

*

*

*

 

А3

*

 

*

*

   

А4

           

Из таблицы видно, что  от выбранного критерия (а в конечном счете - от допущений) зависит и выбор  оптимального решения.

Выбор критерия ( как и  выбор принципа оптимальности) является наиболее трудной и ответственной задачей в теории принятия решений. Однако конкретная ситуация никогда не бывает настолько неопределенной,  чтобы нельзя было получить хоты-бы частичной информации отностительно вероятностного распределения состояний природы. В этом случае, оценив распределение вероятностей состояний природы применяют метод Байеса-Лапласа, либо проводяд эксперимент, позволяющий уточнить поведение природы.

 

 

 

 

Заключение

В заключение данной работы можно сделать вывод о необходимости использования теории игр в современных экономических условиях.

В условиях альтернативы (выбора) очень часто нелегко принять  решение и выбрать ту или иную стратегию. Исследование операций позволяет  с помощью использования соответствующих математических методов принять обоснованное решение о целесообразности той или иной стратегии. Теория игр, имеющая в запасе арсенал методов решения матричных игр, позволяет эффективно решать указанные задачи несколькими методами и из их множества выбрать наиболее эффективные, а также упрощать исходные матрицы игр.

Информация о работе Теория статистических решений. Игры с природой