Имя материала: Оптимальное управление в экономике: теория и приложения

Автор: Лагоша Борис Александрович

4.5. применение достаточных условий оптимальности к решению задач

 

4.5.1.

Линейные по управлению процессы без ограничений на управление

Доказанные в разд. 4.2—4.4 теоремы могут использоваться не только для проверки оптимальности некоторого процесса (х*(0, u*(t)), но и при отыскании оптимального процесса. Здесь рассмотрим класс оптимизационных задач, в которых непосредственное применение достаточных условий позволяет эффективно и не очень сложно строить оптимальное решение.

Управляемый процесс описывается дифференциальным уравнением

— = P(t,x) + Q(t,x)u. <4-35) dt

Данный процесс (x(t), u(t)), где x(t) и u(t) — скалярные функции, протекает при te [0; 7], причем начальное состояние системы при t = 0 и конечное при t = Г, в которое ее требуется перевести, заданы:

х(0) = х0, х(Г) = *,. Функционал определяется соотношением

(4.36)

т

J = (P0(tyx) + Q°(tyx)u)dt-> min. (4-37) О

В формулах (4.35), (4.37) P(t,x), Q(t,x), P°(t,x), Q°(t,x) - заданные непрерывные функции, причем Q{t,x) * 0 при V t є [0; 7].

Рассматриваемый класс задач характеризуется линейной зависимостью от управления в правой части уравнения процесса (4.35) и в подынтегральной функции (4.37). Зависимость же их от / и х может быть, вообще говоря, произвольной.

Предположим, что в данных задачах отсутствуют ограничения на x(t) и u(t). Для нахождения оптимального процесса (х*(0, w*(0) применим к подобным задачам теорему 4.2.

С учетом формул (4.35) и (4.37) запишем функцию R (/, х, и) (4.10) следующим образом:

х. u)J-^fl + *^[Р(г,Л) + Є(гвХ)|І]-      (4 38)

-P°(r,jc)-Q°(r,jc)n, где ф (/, х) - некоторая функция, которую нужно определить.

Наша цель будет состоять в подборе функции ф (ґ, jc) таким образом, чтобы процесс (х*(ґ), w*(0) ПРИ каждом t, максимизирующем выражение (4.38), был допустимым. При таком подходе процесс (jc*(0, w*(0) является оптимальным. Действительно, условие 1 теоремы 4.2 будет выполнено для процесса (х*(0, «*(0)> а условие 2, как отмечалось в разд. 4.2, удовлетворяется тривиально, поскольку правый конец траектории зафиксирован: x(T) = xv

Зададим функцию ф (Г, х) так, чтобы функция R (ґ, х, и) не зависела от и. Из формулы (4.38) видно, что зависимость Rot и линейна, поэтому независимость от и означает равенство нулю коэффициента при и, т.е.

^Є(*.*)-0°(/.*) = 0.

ох

(4.39)

При таком задании ер (ґ, л:) функция R будет зависеть от двух переменных: R = R (t, х). Если теперь при каждом значении / найти max R (ґ, х) по х, получим некоторую траекторию x*(t). В случае допустимости х*(ґ), т.е. если она удовлетворяет условиям (4.36), эта траектория и будет искомым оптимальным решением. Соответствующее оптимальное управление u*(t) получим, подставляя x*(t) в уравнение процесса (4.35):

 

и * (г) = - Л     -           — (4.40)

Q(',**(0)

При этом управление w*(0 будет допустимым из-за отсутствия в задаче ограничений на управление.

Найденный процесс (x*(t), u*(t)) будет удовлетворять условию 1 теоремы 4.2. Условие 2 этой теоремы выполняется тривиально в силу требований (4.36). Следовательно, при выполнении условия 1 процесс (х*(ґ), и*(0) будет оптимальным.

Для реализации представленной идеи требуется найти функцию ф (/, х) из уравнения (4.39). Преобразуя его, получим

 

Эф(г,х) = Q°(r,x) Эх      Q(t,x) '

Данное уравнение — простейшее с частными производными. Его общее решение находится непосредственным интегрированием:

 

Ф(^Н^^ + С(г), (4.41)

 

где с    — произвольное число, которое можно, например, принять равным нулю; С(/) - произвольная функция времени.

Равенство (4.41) задает множество всех решений уравнения (4.35), любые два из которых отличаются друг от друга только на произвольную функцию времени. Чтобы с помощью найденной функции ф (t, х) составить функцию Л, вычислим слагае-

мые в выражении (4.38). Чтобы вычислить частную производ-Эср(г,х)

ную —-—, воспользуемся правилом дифференцирования инея

тегралов по параметру. Из равенства (4.41), где параметром в подынтегральной функции является ґ, будем иметь

 

Подставляя значения производных функций ср (ґ, х) в соотношение (4.38), получим

Я(^)=в°<'^^ (4.43)

Q(t,x)   [dt Q(t£)

 

'Формула (4.43) позволяет получать выражение для функции R (ґ, х) в любой задаче рассматриваемого в данном разделе класса. Отметим, что искомое значение х*(ґ), максимизирующее R (ґ, х), не зависит от вида функции Сх(і), так как последняя не зависит от х. Поэтому ее можно считать равной нулю (или любой другой константе или функции времени).

Все изложенное до сих пор справедливо, и траектория х*(0 является оптимальной, если выполняются краевые условия х*(0) = = х0, х*(7) = xv

В общем случае, когда краевые условия не выполнены (хотя бы любое одно из них), решение задачи может быть найдено в классе минимизирующих последовательностей. Для построения последовательности поступают следующим образом. Рассмотрим произвольную последовательность моментов времени Ту —> 0 и т'у -> Г (рис. 4.1).

Соединим начальную точку х0 прямой 1Х с точкой x*(ij), эту же точку х0 прямой /2 — с точкой х*(т2) и т.д. В результате получаем последовательность кривых xs(x)y каждая из которых состоит из трех участков:

 

/,,гє[0;т);

x*,te[Ts;x's);

/;,гє[<¥;Л.

Как видно из рис. 4.1, сходимость       к jc0 при / -> 0 и к х} при t —> Т вообще может не иметь места. Поэтому будем проверять условие 1 теоремы 4.4, сформулированное в виде соотношения (4.34). В соответствии с этим требуется проверить,

ЧТО При S -> оо

 

т т

JR«tx*(t))dt -+JR«yx*(t))dt. (4-45> о о

 

Для того чтобы установить справедливость условия (4.45), представим интеграл в левой части в виде трех слагаемых:

 

т тЛ JR(tyx*s(t))dt= j R(tyx*(t))dt + о о

t'v т

+ j *</,*;<0>*+J R(tys(*))dt. (4.46)

 

В связи с тем что функция /?(/,**(*)) ограничена, а длины промежутков интегрирования туиГ-т;у в первом и третьем слагаемых в формуле (4.46) стремятся к нулю, эти интегралы при s -»оо также стремятся к нулю. Аналогично согласно формуле (4.46) на промежутке [t¥,t'v] значение x*s(t) совпадает с **(/), и второе слагаемое будет равно

 

{ R(t,xs(t))dt= j R{t,x ))dt.

T.v T.v

Следовательно, при s -> оо оно стремится к значению правой части (4.45). Это и доказывает, что данное соотношение выполняется для последовательности траекторий x*(t). Поэтому последовательность (**(/), и*(О) является минимизирующей.

Перейдем теперь к случаю, когда в рассматриваемой оптимизационной задаче (4.35) — (4.37) имеются ограничения на состояние. Множество допустимых состояний V*x при каждом фиксированном / представляет собой некоторое множество на числовой прямой. Будем считать, что это множество — отрезок

a(t) < x{t) < b(t). (4.47)

Если по-прежнему считать, что на управление не наложено ограничений, то единственное изменение при решении данной задачи по сравнению с задачей без ограничений состоит в том, что траектория х(і) в ней строится из условия

 

tf(r,jt(0)-> max Д(г,х), xev'

где /?(/, x) задается соотношением (4.43).

Ранее /?(/, х) находилась исходя из необходимого условия безусловного максимума этой функции —^— = 0-

 

4.5.2.

Линейные по управлению процессы с ограничениями на управление

Рассмотрим теперь общий случай, когда имеются ограничения на состояние и на управление. Исследуем наиболее часто встречающийся в задачах случай, когда область допустимых управлений задается ограничением

!/,(/, х) <u<u2(t, х). (4.48)

Таким образом, к постановке задачи (4.35) — (4.37) добавлены ограничения (4.47), (4.48).

Решение сформулированной задачи начнем с определения области возможных состояний системы. Она определяется множеством всех траекторий, удовлетворяющих уравнению (4.35), краевым условиям (4.36) и ограничениям (4.47) и (4.48).

Для построения этого множества рассмотрим четыре траектории, отвечающие минимальному u{(t, х) и максимальному u2(t, х) значениям управления и краевым условиям (4.36). Пусть аД/), a2(0 — решения уравнений (траектории) — = P(f,*) + Q(f,*)M1(f,*); dt

^-=P(t,x) + Q(t,x)u2(t,x) dt

при начальном условии x(0) = x0, a p^/), P2(0 ~~ их решения при конечном условии х(Т) = xv Соответствующие функции этих решений изображены на рис. 4.2. Нетрудно заметить, что решение x(t) уравнения (4.35), начинающееся в точке х0 и оканчивающееся в точке Xj, не может выйти за пределы области, ограниченной кривыми а//), Р;(/), a(t), b(t), і = 1,2.

Проанализируем, например, некоторую траекторию xl(t) с начальной х1(0) = х0, отвергающую управление ul(t), и покажем, что она не может пересечь границу а;(/)- Так как по предположению (?(/, х) ф О, то пусть для определенности Q(t, х) > 0.

Рассмотрим кривую a{(f), отвечающую минимальному значению управления и = ux{t, х). Пусть некоторая траектория, отвечающая управлению u{(t), пересекает а{ в точке t = т (рис.

4.3). Тогда в данной точке производная ^<а,(т). Так как обе траектории xl(t) и а,(/) удовлетворяют уравнению (4.35) и Q(t, х) > О, то нетрудно установить, что в точке / = т

и{ (/) < I/, (т, х(т)),

что противоречит ограничению на управление (4.48).

Аналогично доказывается, что траектории не могут пересекать остальные кривые: а2(/), Р,(/) и (32(0-

Таким образом, мы сузили исходную область Недопустимых значений (/, х). Образовавшуюся область обозначим Vх, при этом У с У„

Перейдем к построению оптимальной траектории. Для этого рассмотрим траекторию **(/), максимизирующую при каждом / функцию R (/, х). Эта траектория изображена на рис. 4.3.

Если траектория х*(ґ) допустима, то она является оптимальной, так как удовлетворяет теореме 4.2. Действительно, условие 1 данной теоремы выполнено по построению траектории **(/) как раз из требования максимума функции R (/, х), которая не зависит от и*. Следовательно, максимум по и достигается автоматически. Условие же 2 превращается в тривиальное, так как в данной задаче значение х*(Т) зафиксировано.

Пусть управление u*(t) реализует траекторию x*(f). Оно определяется из уравнения процесса (4.40).

В конкретных задачах, как правило, оптимальная траектория состоит из трех участков, как показано на рис. 4.3. Два из них, примыкающих к граничным значениям xQ н х{, отвечают предельным значениям управлений Wj(/, х) и w2(/, л:), а средний участок соответствует некоторому промежуточному значению управления. Это наглядно будет показано в главе 5 на примере однопродуктовой макроэкономической модели.

 

Вопросы для самопроверки

В чем заключается логика теорем о достаточных условиях оптимальности?

Как формулируется теорема о достаточных условиях оптимальности для непрерывных процессов? Какой существенной особенностью она обладает и тем самым вызывает необходимость обращаться к обобщенной теореме?

Как формулируется теорема о достаточных условиях оптимальности для управляемых многошаговых процессов?

Каким образом формулируется обобщенная теорема о достаточных условиях оптимальности?

Какова типовая структура оптимального решения для задач, линейных по управлению, с ограничениями на управление?

Почему в задачах для непрерывных процессов, линейных по управлению, требуется (?(/, х) ф 0?

Может ли отсутствовать решение в задачах, линейных по управлению, с ограничениями на управление? Проанализируйте возможные случаи.

Как по формальному виду уравнений процесса в общей постановке задачи ТОУ определить векторы состояния и управления независимо от того, какими буквами они обозначены?

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 |