Имя материала: Оптимальное управление в экономике: теория и приложения

Автор: Лагоша Борис Александрович

4.3. достаточные условия оптимальности для многошаговых процессов

Для задач ТОУ в дискретных системах, так же как и в рассмотренных в разд. 4.2 непрерывных, может быть сформулирована и доказана теорема о достаточных условиях оптимальности. Используемые при этом математические конструкции аналогичны введенным выше и являются их качественным аналогом для многошаговых процессов.

Задача оптимального управления дискретной системой формулируется следующим образом. Пусть управляемый процесс описывается системой разностных уравнений

) = f(tfx(t)i «/(/)), / = 0,1,     T-U /= 1,2,     /і, (4.21)

с начальным условием

х (0) = х0. (4.22)

На возможные значения состояния системы x(f) и управления u(i) наложены ограничения

WO, u(t)) є Vі.

(4.23)

 

Ф(х) = Ф(Г,х) + Дх).

(4.26)

Если считать аналогом производной в дискретном процессе для функции / (0 выражение А/(/) =/(/ + 1) -/(0> то первые два слагаемых в (4.25) могут рассматриваться как «производная» Дф(/, x(t)) функции ф(ґ, х(/)), если x(t) является решением системы (4.21), т.е. траекторией рассматриваемого процесса.

Если это так, то в выражении ф (/ +      х, и)) после под-

становки х = х(/), и = u(t) можно, учитывая уравнение процесса (4.21),/(/, х(/), u(t)) заменить на x(t + 1). В результате получим, что на траектории x(t) первые два слагаемых в формуле (4.25) будут равны:

Аф (t, x(t)) = Ф(/ + 1, x(t + 1)) - ф (f, *(/)).

(4.27)

Для дискретного процесса имеет место теорема о достаточных условиях оптимальности, формулировка которой почти дословно совпадает с формулировкой теоремы 4.2 для непрерывных систем.

Теорема 4.3 (достаточные условия оптимальности для многошаговых процессов). Пусть допустимый процесс и* = = (x*(t), u*(t)) є Ми некоторая функция ф (г, х) удовлетворяют условиям:

/?(r,jc*(r),m*(r))=  max R(t,x9u), f = 0, 1     

Ф(х*(Т))= min <*>(*).

xeVt

Тогда процесс (x*(t)y u*(t)) является оптимальным. Доказательство. Теорема 4.3 доказывается аналогично теореме 4.2.

Рассмотрим вспомогательный функционал L (х, и, ф) с помощью соотношения

 

7-1

Ц*,и,ф) = - 2 Л(Г,*(0, "(О) + Ф(х(Т))-ф(0,jc0). <4-28) t=0

Как и раньше, оба функционала L и / будем рассматривать на множестве D процессов x(t), и (/)), удовлетворяющих ограничению (4.23) и множеству допустимых процессов М a D.

Лемма 4.3. Для любой функции ф (/, х) значения функционалов L и / на множестве М допустимых процессов совпадают, т.е.

L (*(/), w(/), Ф(/, х)) = /(*(/), и(0), v*(0, u(t)) є Л/. (4.29)

Доказательство. Проведем преобразование выражения (4.28) для функционала L, учитывая, что процесс (x(t), u(t)) является допустимым.

Соотношение (4.28), подставляя в него (x(t), и(і)) є М с учетом формулы (4.25), можно привести к виду

 

(4.30)

 

Выражения в первом слагаемом формулы (4.30) с учетом соотношения (4.27) при значениях / = 0, 1,     7М будут равны:

Ф(1,дг(1)) -ф(0,х(0)) приг = 0; ф(2,х(2)) -ф(1,х(1))приг = 1; ф(3, х(3)) -ф(2,д:(2))приг = 2;

 

ф(Г-1, дг(Г -1)) - ф(7* - 2, х(Г - 2)) при t = Т - 2; ф(7 дг(Г)) - ф(Г -1, х(Т -1)) при t = Г -1.

 

Складывая эти выражения, видим, что после попарных сокращений их сумма будет равна ф (Т, х(Т)) — ф (0, х(0)). После ее подстановки в формулу (4.30) с учетом х (0) = х0 и равенства Ф (х) = ф (Т,х) + F(x) получим

Подпись:
что совпадает с равенством (4.29), которое и требовалось установить.

Лемма 4.4. При выполнении условий 1 и 2 теоремы 4.3 функционал L (х, w, ф) достигает минимального значения на множестве D при х = **(/), w = т.е.

Цх * (г),и * (г),ф(Г,х)) =     min     L (х, и,ф).

(дс(/),и(г))єО

(4.31)

Доказательство. Рассмотрим каждое из трех слагаемых в выражении (4.28) для функционала L.

По условию 1 теоремы 4.3 стоящая под знаком суммы в первом слагаемом в соотношении (4.28) функция R (/, х (/), и (/)) достигает при всех t = О, 1, Г—1 своего максимального значения на процессе (x*(t), и*(/))• Вследствие теоремы 4.1 это является достаточным условием того, что максимальной будет и вся

7-І

сумма значений £ R(t,x(t),u(t)). Так как знак перед этой сум-

мой отрицателен, то первое слагаемое в выражении (4.28) достигает на процессе (x*(r), u*(t)) своего минимального значения.

Второе слагаемое в соотношении (4.28) также будет минимально при х = х*(Т) по условию 2 теоремы 4.3, а третье слагаемое — постоянная величина. Таким образом, все три слагаемых одновременно достигают минимального значения на процессе (**(/), u*(t)). Следовательно, минимальной будет и их сумма, равная L (х* (Г), и* (/), ср (г, х)).

Лемма 4.4 доказана.

Если теперь обозначим

/ =    min L(jc,w,cp), <Р (x(t)Mt))eD

то, повторяя рассуждения для непрерывного процесса, получим с учетом леммы 4.4 соотношения (4.17) и (4.18). Применяя лемму 4.4, получим оценку (4.19) функционала L (х, и), откуда с учетом допустимости процесса (**(/), и* (і)) вытекает его оптимальность.

В дискретном процессе остаются справедливыми и сделанные в конце разд. 4.2 замечания, относящиеся к случаю х(Т) = xv

 

4.4.

Обобщенная теорема о достаточных условиях оптимальности

В главе 1 при изучении свойств операторов max и min, sup и inf были установлены различия между ними. Они на качественном уровне относятся и к ТОУ для классов задач отыскания экстремумов функционалов. В разд. 4.2 и 4.3 шла речь об условиях, гарантирующих оптимальность данного процесса (х* (t), u*(t)). Здесь установим, при каких условиях последовательность допустимых процессов {jc*(f),w*(r)} будет минимизирующей последовательностью в данной задаче оптимального управления.

Рассмотрим сначала задачу оптимального управления для непрерывных систем, когда ограничения, определяющие множество допустимых процессов, задаются соотношениями (4.8) и (4.9), а функционал / имеет вид (4.7). В задаче ТОУ для непрерывных систем достаточные условия оптимальности указанной последовательности могут быть сформулированы в виде следующей теоремы.

Теорема 4.4 (обобщенная теорема о достаточных условиях оптимальности для непрерывных процессов). Пусть имеется последовательность допустимых процессов {xs(t),us(t)}, принадлежащих М при Vs = 1, 2, ... Предположим, что существует непрерывно дифференцируемая функция ф (t, х) (т.е. имеющая по крайней мере вторые частные производные по всем своим переменным), которая при s —> ©о удовлетворяет условиям:

/?(r,jc*(r),w*(r)) —>  sup  /?(r,jc,w), равномерно по г є [0; Г];

U,m)gv'

Ф(х*(Г))-> inf.Ф(х).

 

Тогда последовательность {xs(t),us(t)} является минимизирующей для функционала /.

Доказательство. Оно проводится с помощью тех же вспомогательных конструкций, что и в разд. 4.1.

Область М допустимых процессов расширяется с помощью таких процессов (x(t)y u(t))y которые удовлетворяют условию (x(r), u{t)) є Vі при We [0, 7], но не обязательно удовлетворяют уравнению процесса. Эти процессы составляют множество Д и М является его подмножеством.

Введем определенный на множестве D (следовательно, и на множестве М) функционал L (х, w, ф) с помощью соотношения (4.12). О функционале L {ху w, ф) известно {см. лемму 4.1), что на множестве М его значение совпадает со значениями функционала J (соотношение (4.13)).

Обозначим / аналогично тому, как было сделано в формуле (4.18):

/  =   inf Цх,м,ф). ф (jc,h)eD

Поскольку М есть подмножество D (М с D), то

 

inf   L(jc,w,cp)<   inf L(jc,M,cp), (дг,и)єО (*,и)єЛ/

откуда

 

inf   J(x,u)>l . <4-32)

 

С другой стороны, из условия 1 настоящей теоремы для первого слагаемого в правой его части получаем

 

т т JR(tys(t),us(t))dt->  sup JR(t,x,(t),u(t))dt.

О         (xm^D о

Следовательно, взятое с обратным знаком это слагаемое стремится к

т

inf (-R(t,x,(t)Mt))dt).

 

Из условия 2 теоремы 4.4 сразу получаем, что второе слагаемое в правой части функционала (4.12) также стремится к своей нижней грани.

Последнее слагаемое в правой части формулы (4.12) — постоянная величина, не влияющая на предельный переход, поэтому можно сделать вывод, что при s -> оо

 

Ц*>),и>),Ф)->/ф. (433)

Сравнивая соотношения (4.32), (4.33) и пользуясь определением точной нижней грани (inf) функционала, можно написать

J(x* w*)->   inf  J(x,u), т.е. последовательность (x*At),uAt)) яв-

(x,u)em

ляется минимизирующей для функционала / на множестве Л/, что и утверждается в теореме 4.4.

Эта теорема остается справедливой, если несколько видоизменить ее условия.

Как отмечалось выше, иногда бывает удобно в условиях теоремы предполагать, что верхняя грань R (г, х, и) рассматривается при данном значении г только на множестве (x(t), u{t)) є Му являющемся подмножеством множества V. При таком изменении формулировка теоремы остается справедливой.

Условие 1 теоремы 4.4 может быть ослаблено, если сформулировать ее в виде

 

т т

J R(t,x*s(t),us(t))dt =  sup  J R(t,x(t),u(t))dt.

0 U,w)gDo

Если при v/є [0; 7] существует max R (г, x, и) при (x, u) є Vі', то утверждение теоремы остается верным при замене условия 1 также более слабым условием

 

т т

J R(t,x*s(t),us(t))dt -> J R{t,x,u)dt, V(jc,w)g Vі. (4.34) 0 0

Использованное в формулировке теоремы 4.4 условие 1 является достаточным для выполнения соотношения (4.34), так как равномерная сходимость подынтегральных функций обеспечивает и сходимость интеграла, однако диапазон применимости этого условия шире, чем условия 1 теоремы 4.4. Например, условие (4.34) можно применять для таких процессов, где управление u(t) или состояние x(t) не является ограниченным на отрезке [0; 7]. В этом случае даже если верхняя грань функции Ли не существует при V г є [0; 7], то для применения соотношения (4.34) требуются лишь существование и конечность интегралов в этом соотношении.

Перейдем теперь к обобщенной теореме о достаточных условиях оптимальности для многошаговых процессов в дискретных системах.

Постановка задачи оптимального управления определяется функционалом (4.24), который требуется минимизировать на множестве М допустимых процессов, задаваемом ограничениями (4.21) - (4.23).

Теорема 4.5 (обобщенная теорема о достаточных условиях оптимальности для многошаговых процессов). Пусть

имеется последовательность {х*(0,м*(г)}є М при Vs = 1, 2, Т. Предположим, существует функция ф (ґ, х), которая при s -> «з удовлетворяет условиям:

/?(Г,х*(0,и*(0)->   sup  Я(Г,х,и) для V/ = 0,1,..., Г -1;

(a",m)6v/

Ф(**(7))-> inf Ф(*).

 

Тогда последовательность U.y(0» wy(r)} является минимизирующей для функционала У.

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 |