Автор работы: Пользователь скрыл имя, 07 Февраля 2014 в 19:10, шпаргалка
1. Предмет исследования и основные задачи теории принятия решений.
Теория принятия решений (ТПР) занимается разработкой общих методов анализа ситуа-ций принятия решений. С их помощью информация о проблеме используется для выбора наи-лучшего решения.
Основу ТПР составляет системный подход, рассматривающий объект управления как сложную систему с многообразными внутрисистемными связями между ее элементами и внешними связями с другими системами
Проиллюстрируем вышесказанное на двух простых примерах.
В антагонистических
играх принимают участие
В таких случаях говорят, что последствия решений зависят от состояний природы, а соответствующие модели называют играми с природой. Здесь осознанно действует только один игрок (I), а природа рассматривается как незаинтересованная инстанция, которая не выбирает для себя оптимальных стратегий. Состояния природы реализуются случайным образом. Теорию игр с природой называют теорией статистических решений.
Пусть игроку (ЛПР) необходимо принять решение в недостаточно известной обстановке. Предположения относительно состояний природы рассматриваются как стратегии природы, и формируются либо на основе опыта, либо на базе экспертного анализа. ЛПР может использовать m возможных стратегий - ; его выигрыши при каждой паре стратегий и предполагаются известными и образуют платежную матрицу.
Цель ЛПР - определение такой стратегии, которая обеспечила бы ему наибольший выигрыш.
В играх с природой часто требуется не только оценить выигрыш, но и определить разность между максимально возможным выигрышем при данном состоянии природы и выигрышем при применении стратегии в тех же условиях. Эта разность называется риском.
Максимальный выигрыш в j-м столбце обозначается через , ( ), и риск игрока при применении им стратегии в условиях определяется как , ( ). Матрица рисков иногда позволяет лучше охарактеризовать неопределенную ситуацию, чем матрица выигрышей.
Иногда
можно оценить вероятности
Пусть вероятности состояний природы известны:
и - среднее значение (математическое ожидание) выигрыша
.
В
качестве оптимальной выбирается стратегия,
которая соответствует
Другой критерий выбора оптимальной стратегии базируется на использовании показателя риска. Для этого определяется среднее значение риска
и в качестве оптимальной выбирается стратегия, обеспечивающая его минимум:
Критерии среднего выигрыша и среднего риска для одинаковых исходных данных приводит к одному и тому же результату, т.е. оптимальные стратегии, полученные при применении обоих критериев, совпадают.
В условиях полной неопределенности используются критерии, не требующие знания вероятностей состояний природы - критерии Вальда, Сэвиджа, Гурвица и ряд других.
Критерий Вальда (принцип гарантированного результата)
Этот критерий предлагает выбирать в качестве оптимальной стратегию, которая имеет наибольшее при наименее благоприятных состояниях природы значение функции полезности. Оптимальная по критерию Вальда альтернатива обеспечивает гарантированный выигрыш при наихудшем состоянии природы (максиминный критерий):
Пример. Рассматриваются альтернативные варианты использования товарных рынков. Ожидаемые прибыли для трех рынков приведены в платежной матрице
Возможные новые товарные рынки |
Экономическая ситуация | |||
стабильная |
стабильная |
нестабильная |
нестабильная | |
Степень конкуренции | ||||
слабая |
сильная |
слабая |
сильная | |
Рынок А1 |
530 |
460 |
240 |
220 |
Рынок А2 |
440 |
370 |
300 |
270 |
Рынок А3 |
560 |
400 |
280 |
190 |
По критерию Вальда оптимальной является вторая альтернатива - выход на рынок А2.
Критерий Сэвиджа (минимаксного риска).
Стратегия
выбора по критерию Сэвиджа характеризует потенциа
Критерий Гурвица.
Критерий Гурвица представляет комбинацию критериев Вальда и крайнего оптимизма. Вводятся некоторые весовые коэффициенты и , и предполагается, что природа может находиться в самом невыгодном для ЛПР состоянии с вероятностью и в самом выгодном – с вероятностью .
Функция, описывающая критерий Гурвица, имеет вид:
При критерий Гурвица превращается в пессимистический критерий Вальда, а при - в критерий крайнего оптимизма. Значение выбирается в зависимости от склонности ЛПР к пессимизму или оптимизму, а также на основании опыта или здравого смысла.
Следует иметь в виду, что не существует общих рекомендаций по выбору критерия принятия решений в условиях неопределенности. Он должен производиться с учетом конкретной специфики задачи, на основе опыта и интуиции ЛПР.
Для любой игровой модели может быть определено минимальное значение выигрыша, который можно получить в наихудшей ситуации. Определение более выгодных стратегий требует информации о будущих состояниях природы. Уровень информированности может быть повышен при обращении к консультационной службе, способной составить хорошо обоснованный прогноз развития ситуации. Можно рассматривать данное действие как эксперимент, проведение которого требует определенных затрат.
С экономической точки зрения эксперимент целесообразно проводить лишь тогда, когда затраты на его проведение не превышают потенциального выигрыша, связанного с информацией о состояниях природы.
Пусть для игры с природой известны матрица выигрышей, вероятности различных состояний природы и затраты на проведение эксперимента ( д.е.).
Средний выигрыш игрока в случае отказа от эксперимента равен:
Пусть эксперимент проведен, и выяснено действительное состояние природы. Если этим состоянием оказалось , то выигрыш первого игрока если , то , если , то .
На самом деле истинное состояние природы до эксперимента неизвестно, в связи с чем гипотетический средний выигрыш равен
(если бы мы знали, что реализуется, например , то вместо последнего выражения взяли бы ).
Таким образом, эксперимент имеет смысл проводить, если
Если это не так, то эксперимент неоправдан и для выбора стратегии можно использовать один из критериев, рассмотренных ранее.
Часто принятие решения представляет многоэтапный процесс из цепочки решений, каждое из которых зависит от предыдущего. Последовательность решений изображают графически с помощью деревьев решений, при этом моменты принятия решений обычно обозначают квадратами, моменты возникновения различных исходов – кружками, а альтернативные решения - линиями, называемыми ветвями.
Пример решения многоэтапной задачи.
На
предприятии рассматривается
Маркетинговые исследования позволяют уточнить эти вероятности. При этом если результат маркетингового исследования положительный, то вероятности высокого, среднего и низкого спроса равны 0,4; 0,4 и 0,2; в случае отрицательного результата маркетинговых исследований вероятности высокого, среднего и низкого спроса равны 0,1; 0,1 и 0,8.
Спрос |
Вероятность | ||
Без маркетингового исследования |
С проведением маркетингового исследования | ||
Результат положительный |
Результат отрицательный | ||
Высокий |
0,2 |
0,4 |
0,1 |
Средний |
0,4 |
0,4 |
0,1 |
Низкий |
0,4 |
0,2 |
0,8 |
Вероятность положительного результата маркетингового исследования равна 0,7, а отрицательного – 0,3. Прогнозы говорят о том, что высокий объем продаж принесет доход в 1.000.000 д.е., средний – 500.000 д.е., а низкий – 200.000 д.е.
Построим дерево решений.
Проведение МИ приводит к двум исходам: положительному с вероятностью 0,7 и отрицательному с вероятностью 0,3. Для ветви “продавать без МИ” имеется три исхода – высокий, средний и низкий спрос. Продолжая процесс, получим окончательный результат.
Далее, двигаясь справа налево, рассчитаем ожидаемый доход.
Ожидаемый доход в блоке 6
В блоке 4 запишем максимальный из двух ожидаемых доходов (640000 – 100000 = 540000 д.е.) и 250000 , то есть 540000 д.е.
Ожидаемое значение для блока 5:
Ожидаемое значение для блока 2:
Ожидаемое значение для блока 3:
Наконец, ожидаемое значение блока 1:
Дерево решений с
Для управления сложными проектами используются методы сетевого планирования и управления (СПУ). Среди них выделяют метод критического пути (Critical Path Method - СРМ) и метод оценки и обзора программ (Program Evaluation and Review Technique - PERT).
Метод СРМ применяется тогда, когда работы проекта имеют строго определенные продолжительности (являются детерминированными). Метод РЕRТ применяется при планировании проектов с неопределенными временами выполнения операций.
Методы СПУ используются при планировании сложных комплексных проектов, таких как