Автор работы: Пользователь скрыл имя, 15 Сентября 2013 в 17:46, курсовая работа
В курсе “Теория принятия решений" особое внимание сосредоточено на способах решения конкретных практических задач. Минуя сложную математику, которая лежит в основе методов принятия решений, слушатели знакомятся со всеми основными достижениями в прикладной ТПР - от возможных способов моделирования до принципов оптимальности выбранного решения.
1. Введение…………………………………………………………………….…..3
2. История теории статистических решений……………………………………5
3. Методологические основы теории принятия решений……………….……..6
4. Будущее теории принятия решений………………………………………….7
5. Элементы теории статистических решений………………………….………8
6. Игры с природой в условиях определенности………………………………9
7. Игры с природой в условиях неопределенности……………………………11
8. Заключение………………………………………………….……………….…18
9. Список использованной литературы…………………………………………19
Ответ: нужно купить специализированное оборудование.
Однако в играх с природой положение коренным образом меняется: уже в условии заложена устойчивая смешанная стратегия природы: у = ( 0,3; 0,4; 0,2; 0,1) и мы знаем, что именно этой стратегии придерживается природа.
Если же человек - первый игрок - будет продолжать играть оптимально, то его выигрыш составит v(x*) = - 150 0,3 - 160 0,4 - 170 0,2 - 180 0,1 = - 161 , а если применит первую, неоптимальную стратегию, то математическое ожидание его выигрыша составит v(x') = - 100 0,3 - 140 0,4 - 180 0,2 - 220 0,1 = - 144 .
Таким образом, первому игроку выгодно играть неоптимально !
Ответ: не покупать специализированное оборудование.
Существенное различие между значениями v(x*) и v(x') обьясняется тем, что смешанная стратегия природы неоптимальна и она, "отклоняясь" от своей оптимальной стратегии "недополучает" 36 ден.единиц выигрыша.
Если распределение вероятностей будущих состояний природы не известно, вся информация о природе сводится к перечню ее возможных состояний.
Пример. Игра "Поставщик".
Выпуск продукции фирмы существенно зависит от скоропортящегося материала, например, молока или ягод, поставляемого партиями стоимостью 100ед. Если поставка не прибывает в срок, фирма теряет 400 ед. от недовыпуска продукции. Фирма может послать к поставщику свой транспорт (расходы 50 ед.), однако опыт показывает, что в половине случаев транспорт возвращается ни с чем. Можно увеличить вероятность получения материала до 80%, если предварительно послать своего представителя, но расходы увеличатся еще на 50 ед. Существует возможность приобретать более дорогой (на 50%) материал-заменитель у другого, вполне надежного поставщика, однако, кроме расходов на транспорт (50 ед.) возможны дополнительные издержки хранения материала в размере 30 ед., если его количество на складе превысит допустимую норму, равную одной партии.
Какой стратегии должен придерживаться завод в сложившейся ситуации?
Формализация. У природы два состояния: поставщик надежный и поставщик ненадежный. У фирмы - четыре стратегии: 1) не осуществлять никаких дополнительных действий, 2) послать к поставщику свой транстпорт, 3) послать к поставщику представителя и транстпорт, 4) купить и привезти материал-заменитель от другого поставщика.
Составим таблицу расчетов:
Затраты и убытки фирмы-изготовителя | ||||||
Ситуация |
Стоимость материала |
Недовыпуск продукции |
Транспорт |
Команди-ровочные расходы |
Издержки хранения |
Общая сумма |
1 1 |
- 100 |
0 |
0 |
0 |
0 |
- 100 |
1 2 |
0 |
- 400 |
0 |
0 |
0 |
- 400 |
2 1 |
- 100 |
0 |
- 50 |
0 |
0 |
- 150 |
2 2 |
- 50 |
- 200 |
- 50 |
0 |
0 |
- 300 |
3 1 |
- 100 |
0 |
- 50 |
- 50 |
0 |
- 200 |
3 2 |
- 80 |
- 80 |
- 50 |
- 50 |
0 |
- 260 |
4 1 |
- 250 |
0 |
- 50 |
0 |
- 30 |
- 330 |
4 2 |
- 150 |
0 |
- 50 |
0 |
0 |
- 200 |
Решение. На основе полученных результатов вычислений можно составить платежную матрицу:
min |
max | ||
- 100 |
- 400 |
- 400 |
|
- 150 |
- 300 |
- 300 |
|
- 200 |
- 260 |
- 260 |
- 260 |
- 330 |
- 200 |
- 330 |
Ответ. Нужно придерживаться третьей стратегии и затраты не превысят 260 ед., если послать к поставщику представителя и транстпорт.
1. Рассмотренный способ поиска оптимального решения называется критерием Вальда(Максиминный критерий принятия решения). Выбирается решение, гарантирующее получение выигрыша не меньше, чем maxmin:
vW = maxi minj aij = -260 ед.
Применяя этот критерий мы представляем на месте природы активного и злонамеренного противника. Это пессимистичный подход.
2. Максимаксный критерий. Самый благоприятный случай:
vM = maximaxj aij = -100 ед.
Если фирма ничего не предпримет, то потратит не больше 100 единиц. Это критерий абсолютного оптимизма.
3. Критерий пессимизма-оптимизма Гурвица.
Представляется логичным, что при выборе решения вместо двух крайностей в оценке ситуации придерживаться некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего, благоприятного поведения природы. Такой компромиссный вариант и был предложен Гурвицем. Согласно этому подходу для каждого решения необходимо определить линейную комбинацию min и max выигрыша и взять ту стратегию, для которой эта величина окажется наибольшей:
vH = maxi [a maxi aij + (1-a) minj aij ], где a - “степень оптимизма” , 0£ a £1.
При a = 0 критерий Гурвица тождественен критерию Вальда, а при a =1 совпадает с максиминным решением.
На выбор значения
степени оптимизма оказывает
влияние мера ответственности: чем
серьезнее последствия ошибочны
Влияние степени оптимизма на выбор решения в задаче “Поставщик”.
Степень оптимизма | ||||||||||
Решение |
0,1 |
0,2 |
0,3 |
0,4 |
0,5 |
0,6 |
0,7 |
0,8 |
0,9 | |
А1 |
1 стратегия |
-370 |
-340 |
-310 |
-280 |
-250 |
-220 |
-190* |
-160* |
-130* |
А2 |
2 стратегия |
-285 |
-270 |
-255 |
-240 |
-225* |
-210* |
-195 |
-180 |
-165 |
А3 |
3 стратегия |
-254* |
-248* |
-242* |
-236* |
-230 |
-224 |
-218 |
-212 |
-206 |
А4 |
4 стратегия |
-317 |
-304 |
-281 |
-278 |
-265 |
-252 |
-239 |
-226 |
-213 |
Величина vH для каждого значения a отмечена*. При a £ 4/9 критерий Гурвица рекомендует в задаче “Поставщик” решение А3, при 4/9£ a £2/3 - решение А2. В остальных случаях А1. А4 не выгодно во всех случаях.
4. Критерий Сэвиджа (критерий минимакса риска).
На практике, выбирая одно из возможных решений, часто останавливаются на том, осуществление которого приведет к наименее тяжелым последствиям, если выбор окажется ошибочным. Этот подход к выбору решения математически был сформулирован американским статистиком Сэвиджем в 1954 году и получил название принципа Сэвиджа. Он особенно удобен для экономических задач и часто применяется для выбора решений в играх человека с природой.
По принципу Сэвиджа каждое решение характеризуется величиной дополнительных потерь, которые возникают при реализации этого решения, по сравнению с реализацией решения, правильного при данном состоянии природы. Естественно, что правильное решение не влечет за собой никаких дополнительных потерь, и их величина равна нулю.
При выборе решения, наилучшим образом соответствующего различным состояниям природы, следует принимать во внимание только эти дополнительные потери, которые по существу, будут являться следствием ошибок выбора.
Для решения задачи строится так называемая “матрица рисков”, элементы котрой показывают, какой убыток понесет игрок (ЛПР) в результате выбора неоптимального аврианта решения.
Риском игрока rij при выборе стратегии i в условиях (состояниях) природы j называется разность между максимальным выигрышем, который можно получить в этих условиях и выигрышем, который получит игрок в тех же условиях, применяя стратегию i.
Если бы игрок знал
заранее будущее состояние
Критерий Сэвиджа рекомендует в условиях неопределенности выбирать решение, обеспечивающее минимальное значение максимального риска:
vS = mini maxj rij = mini maxj (maxi aij - aij).
Для задачи “Поставщик” минимакс риска достигается сразу при двух стратегиях А2 и А3:
max |
min | ||
0 |
200 |
200 |
|
50 |
100 |
100 |
100 |
100 |
60 |
100 |
100 |
230 |
0 |
130 |
5. Критерий Лапласа.
В ряде случаев представляется правдоподобным следующее рассуждение: поскольку неизвестны будущие состояния природы, постольку можно считать их равновероятными. Этот подход к решению используется в критерии “недостаточного основания” Лапласа.
Для решения задачи для каждого решения подсчитывается математическое ожидание выигрыша (вероятности состояний природы полагаются равными yj = 1/n, j = 1:n), и выбирается то решение, при котором величина этого выигрыша максимальна.
vL = maxi å1/n aij = 1/n maxi å aij.
Решением игры “Поставщик” по критерию Лапласа является вторая стратегия:
max | |
-250 |
|
-225 |
-225 |
-230 |
|
-265 |
Гипотеза о равновероятности состояний природы является довольно искусственной, поэтому принципом Лапласа можно пользоваться лишь в ограниченных случаях. В более общем случае следует считать, что состояния природы не равновероятны и использовать для решения критерий Байеса-Лапласа.
6.Критерий Байеса-Лапласа.
Этот критерий отступает от условий полной неопределенности - он предполагает, что возможным состояниям природы можно приписать определенную вероятность их наступления и, определив математическое ожидание выигрыша для каждого решения, выбрать то, которое обеспечивает наибольшее значение выигрыша:
vBL = maxi å aij yj.
Этот метод предполагает
возможность использования
Возвращаясь к нашей игре “Поставщик” предположим, что руководители фирмы-потребителя, прежде чем принять решение, проанализировали, насколько точно поставщие ранее выполнял сроки поставок, и выяснили, что в 25 случаях из 100 сырье поступало с опозданием.
Исходя из этого, можно приписать вероятность наступления первого состояния природы вероятность yj = 0,75 = (1-0,25), второго - yj = 0,25. Тогда согласно критерию Байеса-Лапласа оптимальным является решение А1.
Стратегии |
å aij yj |
А1 |
- 175* |
А2 |
-187,5 |
А3 |
- 215 |
А4 |
- 297,5 |
Перечисленные критерии не исчерпывают всего многообразия критериев выбора решения в условиях неопределенности, в частности, критериев выбора наилучших смешанных стратегий, однако и этого достаточно, чтобы проблема выбора решения стала неоднозначной:
Решение |
Критерии | |||||
Стратегии |
Вальда |
maxmax |
Гурвица |
Сэвиджа |
Лапласа |
Байеса-Л |
А1 |
* |
* |
* | |||
А2 |
* |
* |
* |
|||
А3 |
* |
* |
* |
|||
А4 |
Из таблицы видно, что от выбранного критерия (а в конечном счете - от допущений) зависит и выбор оптимального решения.
Выбор критерия ( как и выбор принципа оптимальности) является наиболее трудной и ответственной задачей в теории принятия решений. Однако конкретная ситуация никогда не бывает настолько неопределенной, чтобы нельзя было получить хоты-бы частичной информации отностительно вероятностного распределения состояний природы. В этом случае, оценив распределение вероятностей состояний природы применяют метод Байеса-Лапласа, либо проводяд эксперимент, позволяющий уточнить поведение природы.
В заключение данной работы можно сделать вывод о необходимости использования теории игр в современных экономических условиях.
В условиях альтернативы
(выбора) очень часто нелегко принять
решение и выбрать ту или иную
стратегию. Исследование операций позволяет
с помощью использования
Информация о работе Теория статистических решений. Игры с природой