Математическая теория оптимального управления

Автор работы: Пользователь скрыл имя, 03 Апреля 2014 в 19:00, реферат

Краткое описание

Рассмотрим динамический объект, состояние которого в каждый момент времени t описывается несколькими величинами , которые называются фазовыми координатами, т.е. имеем вектор . Пример, положение самолета как твердого тела в пространстве полностью определяет шестимерная вектор-функция времени. Три координаты определяют положение центра масс, а три – определяют вращение вокруг центра масс.

Содержание

1.Постановка задачи теории оптимального управления 3
2.Принцип максимума Понтрягина. 4
2.1Формулировка принципа максимума. 4
3.Теорема (принцип максимума Понтрягина). 5
4.Примеры применения принципа максимума. 6
4.1. Простейшая задача оптимального быстродействия. 6
5.О методах решения задач оптимального управления 9
Список литературы 12

Прикрепленные файлы: 1 файл

ehmm.docx

— 123.48 Кб (Скачать документ)

 

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Государственное образовательное учреждение высшего профессионального образования

«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ  
АЭРОКОСМИЧЕСКОГО ПРИБОРОСТРОЕНИЯ»

КАФЕДРА БУХГАЛТРЕСКОГО УЧЕТА, АНАИЗА И АУДИТА

 
ОЦЕНКА РЕФЕРАТА

РУКОВОДИТЕЛЬ

ассистент

     

Бердин А.Э

должность, уч. степень, звание

 

подпись, дата

 

инициалы, фамилия


 

 

МАТЕМАТИЧЕСКАЯ ТЕОРИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

по дисциплине: Методы оптимальных решений

 
 

ВЫПОЛНИЛА

СТУДЕНТКА ГР.

8161

     

Алышова С.А

     

подпись, дата

 

инициалы, фамилия


 

 

 

 

 

 

 

 

 

 

 

 

Санкт-Петербург 2014

 

Оглавление

 

 

1.Постановка задачи  теории оптимального управления

Предметом математической теории оптимального управления является методы решения задач, в которых учитываются изменения изучаемых объектов и систем во времени и пространстве при поиске оптимального управления.

Рассмотрим динамический объект, состояние которого в каждый момент времени t описывается несколькими величинами , которые называются фазовыми координатами, т.е. имеем вектор . Пример, положение самолета как твердого тела в пространстве полностью определяет шестимерная вектор-функция времени. Три координаты определяют положение центра масс, а три – определяют вращение вокруг центра масс.

Объектом можно управлять изменяя управляемые параметры ). Состояние объекта изменяется во времени по закону, который связывает функции и :

,                                                                        

где t- время;

      - вектор состояния;

      - вектор управления;

      - некоторая заданная функция, непрерывная вместе со своими частными производными.

Это система обыкновенных дифференциальных уравнений в векторной форме. Она описывает скорость изменения каждой фазовой координаты.

Управление объектом происходит за интервал времени , поэтому параметр .

На управление обычно накладываются условия

,

где - множество допустимых управлений;

       - функции кусочно-непрерывные, т.е. имеют конечное число разрывов первого рода.

Начальное состояние объекта задается функцией .

Критерий качества управления объектом имеет вид (задача Больца):

,

где и - заданные непрерывно – дифференцируемые функции.

Интегральная часть критерия качества (первое слагаемое) характеризует качество функционирования объекта за весь период управления . Терминальный член (второе слагаемое) характеризует только конечный результат воздействия управления.

Если в задаче моменты времени и известны, то она называется задачей с фиксированным временем. Иначе, это задача с нефиксированным моментом начала и окончания управления.

В задаче необходимо найти такое решение , что ,

где - оптимальный момент окончания процесса;

- оптимальная траектория;

                     - оптимальное управление.

Или

Задача Лагранже (интегральный критерий).

Рассмотрим ситуацию, когда функционал качества имеет вид

.

Пусть - новая переменная, тогда      (**).

Тогда задача нахождения минимума критерия качества становится задачей определения минимума фазовой координаты в момент времени расширенного векторного пространства по отношению к управлению u.

На конечное положение объекта могут накладываться ограничения вида:

,                                                                (***),

где - дифференцируемые функции.

Воспользуемся методом множителей Лагранжа и составим функцию:

,

где - неопределенные множители Лагранжа .

Итак, необходимо найти , при котором функционал будет оптимален.

 

2.Принцип максимума Понтрягина.

Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах.

2.1Формулировка принципа максимума.

Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше

(2.1)  
,  
где (2.2)  

При этом предполагается, что моменты to, Т фиксированы, т. е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют. Положим

,

где  -константа,

Функция Н называется функцией Гамильтона.  
Система линейных дифференциальных уравнений  относительно переменных называется сопряженной системой, соответствующей управлению и и траектории х. Здесь 

.

>В  более подробной покоординатной  записи сопряженная система принимает  вид 

, (2.3)

Система (2.3) имеет при любых начальных условиях единственное решение , определенное и непрерывное на всем отрезке  .

Следующая теорема выражает необходимые условия оптимальности в задаче

3.Теорема (принцип максимума Понтрягина).

Пусть функции и, Ф, g1, ..., gm имеют частные производные по переменным х1, ..., Хn и непрерывны вместе с этими производными по совокупности аргументов х , и  U, t [to. Т]. Предположим, что (и, х)-решение задачи (2.1). Тогда существует решение  сопряженной системы (2.3), соответствующей управлению и и траектории х, и константа  такие, что

|  | + ||  (t) || при t [to, Т], и выполняются следующие условия:

а) (условие максимума) при каждом t [to. Т] функция Гамильтона , достигает максимума по при v=u (t), т. е.

H(x(t), u(t), =max H(x(t), v(t), (2.4)

б)(условие трансверсальности на левом конце траектории) существуют числа , такие, что

(2.5)

в) (условие трансверсальности на правом конце траектории) существуют числа  такие, что

(2.6)

Центральным в теореме является условие максимума -(2.4).  
Если отказаться от предположения о том, что конечный момент времени Т фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие (2.6) заменим условием

и добавить еще одно условие трансверсальности на правом конце траектории:

4.Примеры применения принципа максимума.

4.1. Простейшая задача оптимального быстродействия.

Пусть точка движется по прямой в соответствии с законом

где х - координата. Требуется найти управление и, переводящее точку из начального положения в начало координат за минимальное время Т (задача оптимального быстродействия). При этом скорость точки в конце траектории должна быть нулевой, а управление - удовлетворять условию

.

Применим к сформулированной задаче принцип максимума Понтрягина . Введем фазовые переменные  . Тогда движение управляемого объекта описывается системой двух дифференциальных уравнений первого порядка:

 

Начальное положение

при t0=0 и конечное положение (0, 0) фиксированы, а конечный момент времени Т не фиксирован.

В обозначениях п.п. 1, 2 в данной задаче U ==[-1, 1], f0=1, Ф=0, а функция Гамильтона имеет вид

Общее решение сопряженной системы

легко выписывается в явном виде  

где С, D - постоянные.

Очевидно, что максимум функции Н по и U достигается при

Таким образом, оптимальное управление и может принимать лишь два значения +1 .

2.Определить управление u(t) , которое дает минимум интегралу

, в процессе, описываемом уравнением  (1).  
Решение.  
Введем дополнительную переменную

Для этой переменной имеем дифференциальное уравнение  (

с начальными условиями, получаемыми из (2), т.е. х2(0)=0. Минимизирующий функционал, можно записать в виде I[T]=x2(T).

Построим функцию Гамильтона

Запишем сопряженную систему 

Запишем 

Y1(Т)=0 (т.к. с1=0)

Y2(Т)=-1

Из  поэтому Y2(е)=-1. Теперь функция Гамильтона запишется в виде H=-aY1x1+Y1u-0,5x12-0,5u2 .

По принципу максимума функция Н при фиксированных х1 и и1 достигает максимума по u :  ,  , откуда  .

Осталось решить систему уравнений при условии  , и2(Т)=-1,

,  с граничными условиями 

Сведем данную систему к одному уравнению относительно U.

Добавим к этому уравнению граничные условия  и решим его. Составим характеристическое уравнение к2 - (а2+1) =0, к1,2=+(-)

Найдем С1 и С2.  С2=-с2е . Тогда 

Используя граничные условия найдем С2

Таким образом, определено оптимальное решение

5.О методах решения задач оптимального управления

Убедимся вначале, что необходимые условия оптимальности в форме принципа максимума дают, вообще говоря, достаточную информацию для решения задачи оптимального управления (2.1), (2.2).

Условие максимума (2.4) позволяет, в принципе, найти управление и как функцию параметров х, t, 

(2.7)

Рассмотрим систему дифференциальных уравнений

(2.8)

объединяющюю систему уравнений движения объекта и сопряженную систему.

Как известно, общее решение системы (2.8), состоящей из 2n обыкновенных дифференциальных уравнений первого порядка, зависит от 2п параметров. Кроме того, система необходимых условий оптимальности содержит т параметров и параметр y0. Таким образом, общее число неизвестных равно 2n+m+1.

Для их определения мы имеем 2п условий (2.5), (2.6) и т условий (2.2). Еще одно условие определяется из следующих соображений.

Легко понять, что, в силу линейности функции Н по переменным принцип максимума Понтрягина определяет вектор ( ) с точностью до положительного постоянного множителя. Поэтому если в конкретной задаче удается показать, что  , то полагают обычно  == - 1. В противном случае накладывают какое-либо условие нормировки, например, 

Таким образом, общее число условий равно 2n+m+1 и совпадает с числом неизвестных параметров, что, в принципе, позволяет определить эти параметры. Изложенные соображения дают возможность в простейших случаях решить задачу оптимального управления в явном виде.

Опишем численный метод, основанный на тех же соображениях. Для этого рассмотрим краевую задачу для системы дифференциальных уравнений (2.8) с краевыми условиями (2.5), (2.6), а также выписанными на основе (2.2) краевыми условиями

(2.9)

Эта задача называется краевой задачей принципа максимума.

Задав произвольные начальные условия и решив каким-либо численным методом задачу Коши для системы (2.8), можно найти х(Т), (Т). При этом на каждом шаге численного интегрирования значение  находится из решения вспомогательной оптимизационной задачи (2.7) (считаем, что параметр  задан и равен либо 0, либо -1).

Значения х (Г),  являются очевидно, некоторыми функциями от а и Ь:

). Решение краевой задачи принципа  максимума сводится, таким образом, к решению полученной из (2.9), (2.5), (2.6) системы уравнений 

Эта система содержит 2п+т неизвестных а, Ь, и состоит из 2п+т уравнений. Ее решение можно находить известными численными методами, например методом Ньютона.

Отметим, что вычисление значений  весьма трудоемко, так как требует при каждом (а, b) решения задачи Коши для системы дифференциальных уравнений (2.8). Именно в таких случаях особое значение приобретает изучение вопросов эффективности численных методов и построения оптимальных методов .

При реализации на ЭВМ методов решения задач оптимального управления, основанных на необходимых условиях экстремума, могут встретиться также значительные трудности, вызванные некорректностью постановки исходной и вспомогательных задач и некоторыми особенностями краевой задачи принципа максимума. Это приводит к необходимости применения методов регуляризации, учета специфики конкретной решаемой задачи, ее физического смысла и т. п.

Другие численные методы, не связанные непосредственно с принципом максимума, основаны на редукции исходной задачи к некоторой конечномерной задаче математического программирования. Их называют иногда прямыми методами (впрочем, разделение вычислительных методов на прямые и непрямые довольно условно).

Информация о работе Математическая теория оптимального управления