Имя материала: Оптимальное управление в экономике: теория и приложения

Автор: Лагоша Борис Александрович

Метод лагранжа для многошаговых процессов управления

 

7.1.

Уравнения метода. Условия оптимальности для многошагового процесса с неограниченным управлением

Выше отмечалось, что для дискретных (многошаговых) процессов не вполне корректно применение термина «принцип максимума» (хотя на практике его с известной долей условности используют [12]). Мы будем называть его методом Лагранжа, поскольку последнему принадлежат соответствующие идеи.

Конкретизируем общую постановку задачи без ограничений на управление.

Пусть заданы уравнения процесса

1) = /(>,*(», «(0), '=0, 1,..., Г-1, /= 1,2,.(7.1) краевые условия

jc'"(0) = 4,/ = 1,2        к, х1{Т) = хЛ = к + ....,п,      (72)

и ограничения

 

u*(t)eVi,          (73)

 

причем м*(0 - внутренняя точка множества vj при всех t = 0, 1,..., Т-.

Обозначим через М множество допустимых пар v = (х(0, «(0), т.е. пар, удовлетворяющих условиям (7.1) и (7.2). Поставим задачу об отыскании пары v = (х(0, u(t)) є М, на которой

 

J= Y< f (t,x(tu(t)) + F(x(T))^mm. (7.4) /=о

Выведем уравнения метода Лагранжа аналогично непрерывному варианту, опираясь на достаточные условия оптимальности. Согласно последним (см. главу 4), если допустимый процесс (х*(0, u*(t)) и функция ф(/, х) такие, что выполняются условия

 

Я(г,**(0,и*(г))=  max R(t9x (f),w (г)), Vr = 0,1        Г -1; (7.5)

U,ii)6V'

ф(х*(Т))= тіпФ(х)при* = 7 (7.6)

 

то процесс x*(t), u*(t) оптимален, т.е.

 

У(х*,и*) =   min J(x,u).

 

Для задачи с закрепленным правым концом условие (7.6) удовлетворяется тривиально, так как при t = Т множество Ух состоит только из одной точки.

Согласно формуле (4.25) для задачи (7.1) — (7.4) функция R(t, х, и) имеет следующий вид:

R(tyx,u) = y(t + lf(t,x,u))-(p(t,x)-f0(tyxyu) ^

/(r,jc,M) = {/4r,jc,M)}, / = 1     #1-

Так как в модели (7.1)—(7.4) других ограничений, кроме краевых условий на состояние, нет, то множество vlx совпадает со всем пространством X. Пусть функция ф(/, х) дифференцируема по х, функции /'(/, х, «), /=1,...,л,/^, х, w), дифференцируемы по х, и в точках х*(0, u*(t). Тогда необходимыми условиями максимума функции R (/, х, и) по х (поскольку на х нет ограничений) и и являются следующие:

dR        n    ■ 1 dx

 

— Um*=0'   7 = 1-а-.

(7.8) (7.9)

 

 

dR I -У

OUJ i=iL

— ф(* + 1,/(Г,*,и))

Эх

I = 1,...,г,

Э/Ч/.^и*), Э/°,

эм> L*

или

Э/? і              /   пЭ/1',            Э/°,

т-f Lc*,ii* - 2г Vi V +1; —7 Lc*f и*  "тук«*

aV           /=і           сиг           oV

7 = l,...,r.

 

(7.12)

А с учетом соотношений (7.11) и (7.12) окончательно получаем л

dR Э

у І™,«по =T7H(t'x*{t)Mt+1}'и !«*(')=°'

 

(7.13)

У = 1....,г.

Теперь расшифруем другое необходимое условие (7.8). Учитывая выражение (7.7), найдем

 

x*(t),u*(t)

= 0,

 

— 1*чо.иЧО =-jH(uxMt + lU*(t))x4t) -|/ДО = 0, ох ох

(7.15)

 

откуда выводим сопряженную систему конечно-разностных уравнений:

Э

V/(0 = —jH(t,xMt + 1).и * (0)

(7.16)

/ = 1.....п.

Итак, в результате представленных преобразований получены необходимые условия оптимальности (7.13) и (7.16) многошаговых управляемых процессов. Неизвестными здесь являются «-мерный вектор оптимального состояния лс*(/), г-мерный вектор оптимального управления u*(t) и сопряженная «-мерная вектор-функция |/(/). Таким образом, число неизвестных будет равно 2п + г, а условия (7.13) и (7.16) задают всего п + /-уравнений. Недостающие п условий дают уравнения процесса (7.1) с учетом краевых условий (7.2). Следовательно, система уравнений для определения 2п + г неизвестных полностью определена.

Необходимые условия оптимальности воплощаются в следующей системе уравнений метода Лагранжа. Последовательность действий:

решаем систему г уравнений относительно компонент вектора u*(f) при фиксированных значениях остальных компонент:

 

|- H(t, х * (t)Mt +1),"*) L*(0=°>

в результате получаем u*(t) с параметрами x*(f), |/(/ + 1), где #(/, х, у, и) — функция Гамильтона (гамильтониан);

составляем и решаем сопряженную систему и систему уравнений процесса:

dH(t,xMt + lU*(t))u .

W)       g£        ) Иг).

х*(/ + 1) = /(г,л*(0,и*(0); 3) удовлетворяем краевым условиям

х*(0) = х0>     = *i

или, если правый конец свободен, применяем условие трансверсальности

 

Пример 7.1. Рассмотрим управляемую систему с квадратичным функционалом и линейными ограничениями. Решение, как следует из разд. 6.3, будет оптимальным. Сформулируем задачу оптимального управления следующим образом:

J = i[xf(0 + j|(0 + «|2(0 + «2W]->min;

х,(г + 1) = .х,(0+дсг(')+«2('); дс2(/ + і) = де, (/)+«, (0;

*,(0) = -l; *2(0) = 1; x,(4) = 4; x2(4) = 0.

(7.17)

Решение

Составляем функцию Гамильтона:

H(t,x,\f,u) = \t{(x{ +Х2 + и2) + у2(х +их)-х-х-и}-и.

Вычисляем ее частные производные по их и и2:

f^(,+.),,m^=V2^ (718)

^U^l).m^0=V,(' + l)-2^(0 = 0=>^(0-^^. (7Л9)

Строим сопряженную систему уравнений:

 

¥l      —           Эх,      =Vi С +1) + V2С +1)" 2*i (0;

ОХ'у

Э//(г,дг,|/(г + 1),и(0), «2

4. К заданной выше системе присоединяем уравнения процесса:

 

х1(; + 1) = *1(0 + *2(0+чм, ;

*2(f + l) = *,(*) +

2

М/2(' + 1) 2

Для удобства последующих расчетов в системе уравнений (п. 3 и 4) проведем некоторые преобразования, так чтобы в конечном счете в уравнениях слева иметь зависимости от t9 а справа - от t + 1 (или наоборот) Получаем:

 

х*(Г) = х*(Г + 1)-^1/2(Г + 1);

х* (0 = x*(t +1) - x2(t +1) - і vi (г +1)+^ v2u +1);

Vl (0 = Vi (r + l) + 2|/2(r + l)-2x2(r + l);

|/2 (r) = 2|fi (f +1) - 2x*(r +1) + 2x2(r +1) -|/2 (/ +1).

Это позволяет удобным образом вести итеративный процесс, последовательно понижая значения / от 4 до 0.

Исходя из последних четырех формул, с учетом граничных условий (7.17) получаем

при t = 3:

 

^(3) = -|v2(4);

**(3)=4-||/,(4) + ||/2(4);

Vl (3) = Vi (4) + 2v2(4); щ (3)=2|f, (4)-8-|/2 (4);

при t = 2:

 

(2) = де* (3) - ^ |/2 (3) = 4 - ^ v, (4) + ^ |f2 (4) -

1          z       2 2 2

-Vi (4) + 4 +1 v, (4) = 8 -1V, (4) + |/2 (4);

 

**(2) = x*(3)-jr2(3)-^|/,(3) + ^V2(3) = -|v2(4)-4 + +      (4) + |vi (4)-|v2(4)-|vi(4)-V2(4) = 4-2|/2(4);

V, (2)=|/i (3) + 2V2 (3)-2x^(3) =

= |f, (4) + 2|/2 (4) + 4|f, (4)-16-2v2 (4) = -16 + 5|f, (4);

 

|/2(2) = 2y, (3) - 2x,*(3) + 2x2(3) - V2(3) = 2|/, (4) + 4y2(4) + |/2(4) + +8-|f, (4) + y2 (4)-2|/1(4) + 8 + |f2(4) = 8-|/1(4) + 7|/2(4);

яри r = 1:

x*(l) = -x* (2) -1 V2(2) = - 4 - 2|f2(4) - 4 +1 |/, (4) -1 Mf2 (4) = = -8 + |vi(4)-yV2(4);

х (1) = х*(2) - х (2) -1 у2(2) + і |f2(2) = 8 -1V, (4) + + V2(4) + 4 + 2V2(4) + 8-||/,(4) + 4-||f,(4) + ||/2(4) = = 24-4i|/,(4) + yV|/2(4);

 

|f, (1) = v, (2) + 2V2(2) - 2x2(2) = -16 + 5ч/, (4) +16 -- 2|/, (4) + 14v|/2 (4) + 8 + 4|/2(4) = 8 + 3|/, (4) +18|/2(4);

V2 (1) = 2 Vi (2) - 2x,*(2) + 2д:2 (2) - Y|/2 (2) =

= -32 + 10y, (4)-16 + 3|f, (4)-v2(4)-8-4|/2(4)-8 +

+|/, (4) - 7|/2(4) = -64 + 14y, (4) - 12|/2(4);

я/ю f = 0 с учетом начальных условий (7.17) jc,(0) = — 1; х^О) = 1:

х|(0) = х (0) - Uf2(1) = 24 -Щ (4) + у ¥2 (4) - 4 --1 Vi (4) - 9|/2 (4) = 20 - у v, (4) -1 |/2 (4) = -1;

 

x2 (0) = x* (1) - x (1) - Ufx (1) +1у 2 (1) =

= -8 + yX|T, (4) - у v2 (4) - 24 + 4|/, (4) - у |/2(4) - 4 -1 V, (4) --9i|/2 (4) - 32 + 7i|/, (4) - 6|/2 (4) = -68 + 10v, (4) - 27|/2 (4) = 1.

На последней, нулевой итерации значения |/,(0) и ¥2(0) даже не обязательно вычислять, так как уже имеется возможность удовлетворить начальным условиям (7.17). Последняя итерация приводит к двум линейным алгебраическим уравнениям с двумя неизвестными:

 

HV,(4) + 5|/2(4) = 42; 1       (7 20)

10v|/,(4)-27v|/2 (4) = 69.}

Решая эти уравнения, получаем: |/,(4) = 4,262; у2(4) = = —0,9769. Если теперь подставить найденные значения |/j(4) и |/2(4) в правые части проведенных выше итераций, то можно вычислить искомые функции оптимального состояния x](t),x2(t), сопряженные функции |/,(0, У2(0 и согласно формулам^. 18) и (7.19) — функции оптимального управления щ (г), u2(t). Обоснованность оптимального решения обсуждалась в разд. 6.3.

В рассмотренном случае решение краевой задачи и точное оптимальное решение задачи ТОУ удалось получить в аналитической форме. Это следствие ее относительной простоты: выпуклый квадратичный функционал и линейные ограничения. В результате система конечно-разностных уравнений оказалась линейной, что позволило в аналитическом виде «протащить» до конца (до нулевой итерации) неизвестные значения |/,(4) и |/2(4), а затем точно определить их, решая систему (7.20). В более сложных случаях аналитические прогонки затруднительны, а порой и просто невозможны. Нужно сразу задавать конечные значения у{(4) и |/2(4) в числовом виде, а дойдя до конца итераций, менять их, если не выполняются условия типа (7.20). Такие прогонки необходимо повторить многократного, и реализация процедуры итеративных расчетов до приемлемой точности возможна только с применением ЭВМ. Эта проблема уже обсуждалась в разд. 1.6. На практике мы столкнемся с ней в главе 8.

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 |