Автор работы: Пользователь скрыл имя, 07 Декабря 2014 в 14:42, контрольная работа
Что такое инструментальные переменные и параметры математической модели? В чем состоит их отличие?
Пусть имеются факторы Z, некоррелированые со случайными ошибками, количество которых равно количеству исходных факторов. Эти переменные называются инструментальными переменными.
(31)
Непрерывная модель может представляться как система дифференциальных уравнений 1-го порядка в явной форме Коши.
На каждом шаге необходимо определить два типа переменных - переменную состояния системы Sk, переменную управления xk. Переменная Sk определяет, в каких состояниях может оказаться система на рассматриваемом k-м шаге. В зависимости от состоянии S на этом шаге можно применить некоторые управления, которые характеризуются переменной xk которые удовлетворяют определенным ограничениям и называются допустимыми.
В задачах, решаемых методом динамического программирования, значение целевой функции (оптимизируемого критерия) для всего процесса получают простым суммированием частных значений fi(x) того же критерия на отдельных шагах, то есть
Идея проведения оптимизации поэтапно, анализируя последовательно каждый шаг процесса в поисках наилучших вариантов его продолжения, лежит в основе метода динамического программирования, реализующего принцип последовательной оптимизации. Следовательно, важным условием применимости рассматриваемого метода является возможность разбиения процесса принятия решений на ряд однотипных шагов или этапов, каждый из которых планируется отдельно, но с учетом результатов, полученных на других шагах.
Метод динамического программирования состоит в том что оптимальное управление строится постепенно. На каждом шаге оптимизируется управление только этого шага.
Управление на каждом шаге должно быть оптимальным с точки зрения процесса в целом. Это основное правило динамического программирования, сформулированное Беллманом, называется принципом оптимальности.
Уравнение Беллмана:
Задача, которая состоит в выборе из заданного допустимого множества значений ряда переменных, называемых средствами («инструментами») таких значений, при которых достигается максимум заданной целевой функции называется задачей математического программирования.
Задачи, в которых время рассматривается не как непрерывная, а как дискретная величина называются многошаговыми задачами оптимизации.
Состояние системы в момент времени t задается вектором xt, а управление в момент t задается вектором ut. Состояние в момент t+1 задается соотношением
, t= t0, t0+1, t0+2,…, t1, (34)
где ft(…) – вектор составленный из непрерывно дифференцируемых функций текущего состояния и текущих значений управляющих параметров. Предполагается, что фиксировано начальное состояние x0
Возьмем в качестве параметров многошаговой задачи оптимизации начальный момент времени и начальное состояние. Тогда функция оптимального поведения равна оптимальному значению целевой функции в задаче с начальным состоянием х и начальным моментом времени t:
Оптимальное значение целевой функции рассматриваемой задачи равно
Согласно принципу оптимальности Беллмана,
Это означает, что оптимальное значение целевой функции в задаче с начальным состоянием х и начальным временем t равно оптимальному значению суммы двух слагаемых: функции в момент t и оптимального значения функции в момент t.
Используя уравнение (34), можно представить рекуррентное соотношение в виде
Граничное условие
показывает, что оптимальное значение целевой функции в задаче с начальным состоянием xi в момент t1 просто совпадает со значением функции конечных параметров, рассчитанным при х = x1, t = t1.
Таким образом, получена задача математического программирования.
Информация о работе Контрольная работа по "Методам оптимальных решений"