Имя материала: Оптимальное управление в экономике: теория и приложения

Автор: Лагоша Борис Александрович

Применение необходимых условий оптимальности в форме лагранжа -понтрягина

 

8.1.

Цели исследования. Оптимальное управление движущимся объектом

Рассмотрим постановки и решения ряда задач оптимального управления для непрерывных и многошаговых (дискретных) процессов. Необходимые условия оптимизации в форме Лаг-ранжа—Понтрягина являются аппаратом оптимизации процесса. В соответствии с теоремой 6.2 дополнительного доказательства оптимальности во всех рассматриваемых случаях не требуется, так как в разд. 8.1 решается линейная задача, а в разд. 8.2 и 8.3 — две содержательно сходные задачи соответственно для многошаговых и непрерывных процессов с выпуклыми функционалами и линейными ограничениями.

Для линейной задачи краевая задача решается точно и оказывается возможным провести некоторый качественный анализ еще до получения решения; для многошаговых и непрерывных процессов краевые задачи решаются приближенно численным методом прямой прогонки (см. разд. 1.6).

Две последние задачи, содержательно между собой очень близкие, приводятся вместе для сопоставления техники математических выкладок и расчетных схем. Это дает возможность увидеть сходство и различие в однотипных постановках задач и подходах к их решению.

Последний разд. 8.4 этой главы можно рассматривать как завершение магистральной теории(сл*. разд. 5.2).

На представленных в данной главе примерах имеется возможность убедиться в инвариантном характере методов ТОУ. Первый пример относится к механике как разделу физики, остальные три - к экономике. Последнее неслучайно, так как учебное пособие ориентировано прежде всего на экономистов. Важно, чтобы они знали об универсальности методов изучаемой ими теории.

Пример 8.1. Рассмотрим прямолинейное движение некоторого объекта с двигателем (например, автомобиля). Объект имеет массу /г?, а двигатель обеспечивает воздействие на него силы F, не превышающей по абсолютной величине значения у, И ^ Y-Если приложенная сила разгоняет объект, то ее значение принимается положительным, если тормозит — отрицательным.

Пусть в момент / = 0 начальные путь и скорость нулевые, т.е. объект находится в покое: s(0) = ^(0) = 0; s(t) и v(t) — соответственно пройденный путь и скорость в произвольный момент /.

Требуется найти такой оптимальный режим управления (разгона и торможения), чтобы объект прошел заданный путь L в минимальное время и остановился.

Построим математическую модель движения объекта. Для этого воспользуемся вторым законом Ньютона, в соответствии с которым произведение массы объекта на ускорение его движения равно приложенной силе F. Ускорение равно производной от скорости по времени. Скорость движения — это, в свою очередь, производная от пройденного пути по времени.

На основе сказанного запишем дифференциальные уравнения

т

dv _ F ds

dt     ' dt

(8.1)

ограничения для рассматриваемого процесса

F|<y;

(8.2)

 

5(0)= 0,1/(0) = 0;

(8.3)

s(T) = L,u(T) = 0

(8.4)

и функционал

Т —> min,

(8.5)

который отражает достижение конечной цели (8.4) за минимальное время.

Итак, математическая модель движения управляемого объекта построена. Дифференциальные уравнения (8.1) - это уравнения процесса, причем скорость v и путь s — компоненты вектора состояния, сила F — параметр управления. Это вытекает из общей постановки задач оптимального управления и отвечает формальным признакам, позволяющим отличить параметры состояния системы (входят в уравнения процесса как сами по себе, так и со своими производными) от параметра управления (сила F входит в одно из уравнений процесса (8.1) только сама по себе, без производной).

Неравенство (8.2) задает ограничение на управление, условия (8.3) и (8.4) — соответственно начальное и конечное состояния системы, (8.5) — функционал, характеризующий задачу о быстродействии. Так называют задачи ТОУ, в которых функционал отражает цель оптимизации управления — достижение некоторого предусмотренного результата за минимальное время.

До сих пор рассматривались управляемые процессы, для которых время Г считалось заданным. При этом система дифференциальных уравнений метода Лагранжа—Понтрягина включала 2п уравнений с 2п искомыми функциями. Соответственно было 2п граничных условий, включая, если необходимо, условия трансверсальности (6.18). В данном случае при тех же 2п дифференциальных уравнениях и 2п искомых функциях появляется еще одна неизвестная — величина Г. Для однозначного решения системы с 2п + 1 уравнениями и с таким же количеством неизвестных требуется дополнительное условие трансверсальности. Оно имеет вид

Н(Т,х*(Т)МТ), и*(Т)) =

dF(x) дТ

 

х*(Т) >

(8.6)

вывод приведен в [12, с. 190, формула (8.30)]. Условием трансверсальности (8.6) воспользуемся ниже в процессе решения задачи.

Последовательность решения задачи (8.1) - (8.5) в целом соответствует процедуре реализации принципа максимума, только лишь следует дополнительно использовать формулу (8.6) для определения времени движения объекта Т. В рассматриваемой задаче, учитывая, что в функционале (8.5) подынтегральная функция /°(/, х, и) = 0, а терминальный член F(x(t)) = Г, на основе формулы (8.6) получаем

 

Н(Т,х*(Т),у(Т)9и*(Т)) = . <8-7)

В соответствии с постановкой задачи (8.1) - (8.5) функция Гамильтона будет иметь вид

 

Я(/ х, |/, и) = |/, — + |/2*л <8-8) m

где х — (v, s) и = F.

Максимизация функции (8.8) по управлению /"дает

 

F(yx) = arg max Я (t,x, |/,w) = |F|<y

у, у|/,>0;

-у,        у! < 0;

VFe[-Y;y], Vl=0.

 

(8.9)

 

Теперь составим систему уравнений принципа максимума:

m =р(щ) at

ds

(8.10)

 

Подпись: = 0.dyx(t) _  дН _

dt rfy2(0

эя

" ds

 

(8.11)

Здесь краевые условия задаются равенствами (8.3) и (8.4).

Сопряженные уравнения (8.11), как и должно быть в линейных задачах, интегрируются независимо от исходных уравнений процесса (8.10). Решение второго уравнений (8.11) сразу дает |/2 = = Сх. Интегрируя затем первое уравнение (8.11), получаем

щ=-СхГ + С2, (8.12) где С, и С2 - произвольные постоянные.

Из формул (8.9) и (8.12) еще до получения оптимального решения можно сделать вывод: так как линейная функция (8.12) может иметь не более одной перемены знака, то оптимальный режим управления будет заключаться не более чем в одном переключении двигателя рассматриваемого объекта.

При этом одно переключение двигателя должно быть обязательным, ибо в противном случае функция \fx(t) не будет менять при t є [0; Т знака. Следовательно, согласно формуле (8.9) действующая сила будет максимальной по абсолютной величине и равной ±у, т.е. объект будет двигаться под действием максимальной силы тяги двигателя в нужном или противоположном направлении и никогда не остановится. Переключение двигателя может иметь место, но при этом величина \f{(t) при W є [0; 7] не будет менять знак. Этот случай, по существу, оказывается аналогичным предыдущему, и его также следует исключить из рассмотрения. Если при изменении знака функции vj/^O при te [0; 7] она сначала будет отрицательной, а после переключения знака — положительной, то объект вначале поедет в противоположную от необходимого направления сторону, а затем — в нужную. Ясно, что при этом длина общего проезда увеличится, и минимальным время движения Т быть не может. Остается один вариант: сначала объект разгоняется под действием силы тяги двигателя у, а затем тормозится с силой торможения —у и в результате останавливается, пройдя путь s за минимальное время. Итак, выбрав на качественном уровне стратегию управления (сначала разгон, затем торможение), продолжим необходимые расчеты. В этом случае на первом этапе разгона получаем систему уравнений

dv ds dt   1 dt

(8.13)

5(0)=0;р(0)=0;/є[0;т], (8.14) где т < Т — момент переключения двигателя с разгона на торможение. Уравнения (8.13) без труда интегрируются:

 

m

s(t) = 1— + CV + C4, m 2

где C3 и C4 — произвольные постоянные.

Учитывая начальные условия (8.14), получаем С3 = С4 = 0. В результате решение дифференциальных уравнений (8.13), удовлетворяющее начальным условиям (8.14), имеет вид

 

V(t) = l-ts(t) = — t2. (8Л5) m 2m

Момент t = т, соответствующий переключению двигателя с разгона на торможение, с учетом формулы (8.12), отвечает условию

|/1(т) = -С1т + С2 =0,

откуда

T = £l .(8.16)

 

На временном отрезке Г є [т; 7] функция |/j(7) < 0, F= -у и уравнения (8.1) примут вид

 

m^ = -r^ = ^ (8.17) dt dt

Начальным условием для уравнений (8.17) будет состояние системы в момент t = т, отвечающее формулам (8.15) и (8.16). С учетом этого для двух дифференциальных уравнений (8.17) получаем начальные условия

"(*)=^;Ф) = -Ч£)2.

m C[    2m C,

(8.18)

Интегрируя уравнения (8.17) с учетом начальных условий (8.18), получим при ґє [т; 7]

Подпись: 2 {СПодпись: 4-І Jр(0 =

 

5(0 =

 

t

— + 2

-1( + ^2 т

 

т

 

/и С,

 

(8.19)

 

Чтобы определить произвольные постоянные Cj и С2, необходимо удовлетворить в решении (8.19) двум граничным условиям (8.4). Но при этом появится третья неизвестная величина Т. Для определения трех искомых величин Ср С2, Г воспользуемся, кроме двух соотношений (8.19), третьим условием трансверсальности (8.7).

Итак, получены три алгебраических уравнения:

 

,(Л = -ХгЗ^=0; т     т Сх

Подпись: тs(T) = -

 

V   1 J

т С,

(8.20)

(-ClT + C2)(-j-) + Civ(T) = l.

 

Решение системы уравнений (8.20) имеет следующий вид:

С      &С2=^;Г = 2& <8-21) Ly        у        V У

 

С Т

При этом оказывается, что Т = 2-рг или т = —» т.е. переклю-

Ч 2

чение двигателя с разгона на торможение в оптимальном режи-152 ме должно осуществляться посередине интервала движения. Пройденный путь с учетом второй формулы (8.15) и третьей (8.21) также будет равен половине необходимого для прохождения пути:

 

s(x) = s- = -. 2 2

Итак, рассмотрен режим, удовлетворяющий необходимым условиям оптимальности, при этом поставленную краевую задачу (8.10), (8.11), (8.3), (8.4) удалось решить в аналитической форме.

Вследствие линейности задачи доказательства оптимальности полученного решения не требуется (см. разд. 6.3).

 

Страница: | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 |