Исследование свойств регулярных экстремалей в задачах оптимального управления с фазовыми ограничениями тема диссертации и автореферата по ВАК РФ 01.01.02, кандидат наук Горбачева, Анна Викторовна

  • Горбачева, Анна Викторовна
  • кандидат науккандидат наук
  • 2016, Москва
  • Специальность ВАК РФ01.01.02
  • Количество страниц 85
Горбачева, Анна Викторовна. Исследование свойств регулярных экстремалей в задачах оптимального управления с фазовыми ограничениями: дис. кандидат наук: 01.01.02 - Дифференциальные уравнения. Москва. 2016. 85 с.

Оглавление диссертации кандидат наук Горбачева, Анна Викторовна

Содержание

Введение

1 Исследование регулярных экстремалей в задачах оптимального управления с фазовыми ограничениями

1.1 Постановка задачи и основные определения

1.2 Гельдеровость д2(£)

1.3 Ослабление условий регулярности

1.4 Липшицевость ц2(Ь)

2 О некоторых свойствах кратчайшей кривой в сложной области

2.1 Вспомогательный материал

2.2 Уравнение кратчайшей для сложной области

3 Исследование вариационных систем общего вида

3.1 Критерий метрической регулярности и модифицированный вариационный принцип Экланда

3.2 Приложения

Заключение

Список условных обозначений

Литература

Рекомендованный список диссертаций по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК

Введение диссертации (часть автореферата) на тему «Исследование свойств регулярных экстремалей в задачах оптимального управления с фазовыми ограничениями»

Введение

Настоящая диссертационная работа посвящена изучению задач оптимального управления с различными типами ограничений, включая фазовые ограничения типа равенств и неравенств. Задача оптимального управления по своей постановке является дальнейшим развитием и обобщением классической задачи вариационного исчисления. Приведем некоторые аспекты истории развития теории вариационного исчисления и оптимального управления.

Вариационное исчисление как научная дисциплина начала развиваться в конце XVII века. В 1687 году Иссак Ньютон сформулировал и опубликовал одну из первых задач вариационного исчисления. Ньютон поставил следующий вопрос: "тело, образующееся при вращении кривой вокруг оси при движении в упомянутой среде [...] будет испытывать меньшее сопротивление, нежели всякое иное тело вращения при той же высоте и наибольшей ширине." [48]. Еще три задачи, такие как задача о брахистохроне, задача о геодезических линиях, изопериметрическая задача, оказали большое влияние на развитие вариационного исчисления. В 1696 И. Бернулли сформулировал задачу о брахистохроне, т. е. задачу о нахождении кривой в вертикальной плоскости, по которой под действием силы тяжести из заданной точки с заданной начальной скоростью в заданную конечную точку движующееся тело приходит за кратчайшее время. Эту задачу пытались решить многие математики XVII века - Галилео, Лейбниц, Лопиталь, Ньютон, братья Якоб и Иоанн Бернулли, но впервые данная задача была решена Я. Бернулли. В работах Эйлера и Лагранжа был дан общий метод решения задач такого типа. Общие методы решения изопериметрических задач, т. е. в которых длина кривой фиксирована, разработал Эйлер. В развитие вариационного исчисления внесли большой вклад Вейерштрасс, Гамильтон, Лагранж, Лежандр, Эйлер, Якоби, Гаусс, Остроградский, Пуассон, Больц, Кне-зер, Блисс, Морс и другие (см., например, [30] - [32], [50]).

Однако, в середине двадцатого века было замечено, что многие задачи техники (в частности, задача Ньютона), экономики и других прикладных областей, использующих математические средства, не укладываются в рамки вариационного исчисления. Поэтому в двадцатом веке вариационное исчисление получает дальнейшее развитие в рамках оптимального управления. Задачи оптимального управления рассматривались на семинарах Л. С. Понтрягина в пятидесятые годы прошлого века. Понтрягин вместе со своими учениками сформулировал и доказал принцип максимума (соотношения, выражающие необходимые условия сильного экстремума для неклассической вариационной задачи или задачи оптимального управления), который в дальнейшем получил название "принцип максимума Понтрягина" (см. [49]).

Впоследствии были изучены необходимые условия оптимальности в задачах управления с фазовыми ограничениями в форме Понтрягина. В 1959 году для таких задач необходимые условия были впервые получены Р. В. Гамкре-лидзе (см. [17], [18]) и затем опубликованы в классической монографии [49]. Р. В. Гамкрелидзе доказал принцип максимума при некоторых предположениях регулярности оптимальной траектории. Позднее, А. Я. Дубовицким и А. А. Милютиным был доказан другой принцип максимума для задач с фазовыми ограничениями (см. [33]). В этой работе необходимые условия оптимальности были получены без условий регулярности оптимальной траектории. Позже в работе А. В. Арутюнова и Н. Т. Тынянского (см. [4]) было показано, что принцип максимума в форме А. Я. Дубовицкого и А. А. Милютина может вырождаться, и были предложены условия, которые гарантировали его невырожденность. Это теория получила дальнейшее развитие в работах (см. [5] - [7], [35], [38], [76]). В целом по теории задач с фазовыми ограничениями имеется огромный массив публикаций (см. [1], [4], [8] - [11], [17] - [19], [29], [36], [40] - [46], [52] -[57], [61], [65], [66], [70] - [75], [77] - [78].)

Большой вклад в развитие теории задач управления с фазовыми ограничениями внесли Арутюнов А. В., Асеев С. М., Благодатских В. И., Гамкрелидзе Р. В., Дубовицкий А. Я., Дубовицкий В. А., Зеликин М. И., Куржанский А. Б., Матвеев А. С., Милютин А. А., Осипов Ю. С., Половинкин Е. С., Тынянский Н. Т., Clarke F., Ferreira M. M., Pereira F. L., Russak I. B., Vinter R. V. и другие.

Объектом исследования диссертационной работы являются задачи оптимального управления с фазовыми ограничениями типа равенств и неравенств, кратчайшая кривая, вариационная система.

Предметом исследования являются необходимые условия оптимальности в задачах оптимального управления с фазовыми ограничениями типа равенств и неравенств; свойства функции распределения меры-множителя Лагран-жа; свойства кратчайшей кривой в сложной области; вариационные принципы; свойства вариационных систем.

В первой главе исследуется свойство непрерывности меры-множителя Лаг-ранжа из принципа максимума для задач оптимального управления с фазовыми ограничениями типа равенств и неравенств. При определенных предположениях регулярности, наложенных на экстремальную траекторию, доказано, что функция распределения меры-множителя Лагранжа гельдерова. Если вдобавок к условиям регулярности предполагается выполненным усиленное условие Лежандра, то мера оказывается уже абсолютно непрерывной, а ее функция распределения даже липшицевой. Основные результаты первой главы опубликованы в [23] - [27].

Во второй главе некоторые результаты Главы 1 получают дальнейшее развитие и приложение к исследованию свойств кратчайшей кривой в сложной области. Под сложной областью понимается область, задаваемая регулярной системой ограничений типа равенств и неравенств. Основные результаты второй главы опубликованы в [20], [21], [28].

В третьей главе исследуются вариационные системы общего типа, доказывается некоторый модифицированный вариационный принцип Экланда, и с его помощью критерий метрической регулярности. Рассматриваются приложения к исследованию свойств управляемости дифференциальных управляемых систем с ограничениями. Основные результаты третьей главы опубликованы в [22].

Методы исследования.

Для решения поставленных задач использовались методы функционального анализа, вариационного анализа, многозначного анализа, выпуклого анализа, математического анализа, нелинейного анализа, теории функций вещественной переменной, теории экстремума.

Актуальность работы.

Актуальность диссертационного исследования прежде всего обусловлена тем, что теория задач оптимального управления с фазовыми ограничениями является современным и широко исследуемым разделом математики. Значимым вопросом теории задач оптимального управления с фазовыми ограничениями является исследование экстремалей принципа максимума Понтрягина. Задачи оптимального управления с фазовыми ограничениями имеют широкий спектр различных инженерных приложений. Данная диссертационная работа посвящена исследованию свойств регулярных экстремалей в задачах с фазовыми ограничениями.

Цель диссертационной работы.

Основной целью диссертационной работы является исследование необходимых условий оптимальности в задачах оптимального управления с фазовыми ограничениями типа равенств и неравенств, свойств функции распределения меры-множителя Лагранжа и приложений полученных результатов к изучению свойств кратчайшей кривой.

Задачи диссертационной работы.

• Исследование достаточных условий непрерывности функции распределения меры-множителя Лагранжа из принципа максимума Понтрягина для задач оптимального управления с фазовыми ограничениями типа равенств и неравенств.

• Исследование достаточных условий липшицевости функции распределения меры-множителя Лагранжа из принципа максимума Понтрягина для задач оптимального управления с фазовыми ограничениями типа равенств и неравенств.

• Исследование свойств кратчайшей кривой в сложной области.

• Исследование вариационных систем общего вида.

Научная новизна.

Все результаты, полученные в работе, являются новыми. В диссертационной работе получены новые результаты, касающиеся свойств регулярных экстремалей Понтрягина в задачах с фазовыми ограничениями типа равенств и неравенств, и свойств кратчайших кривых в сложной области. Получены новые результаты, касающиеся исследования вариационных систем общего вида.

Теоретическая и практическая значимость.

Диссертационная работа носит в основном теоретический характер. В работе исследуются свойства функции распределения меры-множителя Лагранжа из принципа максимума Понтрягина для задач оптимального управления в виде равенств и неравенств. Вопрос о непрерывности и абсолютной непрерывности меры-множителя Лагранжа является важным для различных приложений, в частности для некоторых проблем механики и задач кинематического управления (см., например, [51, 59, 60]). Скорость в таких задачах рассматривается как фазовая переменная. Если модуль скорости ограничен сверху какой-то константой (что вполне естественно для задач кинематического управления), то это

приводит к фазовым ограничениям и к мере-множителю Лагранжа в необходимых условиях оптимальности. Методы, которые обычно используются для решения таких задач, как правило, подразумевают абсолютную непрерывность или даже гладкость этой меры. Поэтому предлагаемое направление исследования может представлять интерес не только с чисто теоретической точки зрения, но и оказаться полезным для инженерных приложений.

Положения, выносимые на защиту.

• Получены достаточные условия непрерывности функции распределения меры-множителя Лагранжа из принципа максимума Понтрягина для задач оптимального управления с фазовыми ограничениями типа равенств и неравенств.

• Получены достаточные условия липшицевости функции распределения меры-множителя Лагранжа из принципа максимума Понтрягина для задач оптимального управления с фазовыми ограничениями типа равенств и неравенств.

• Изучены свойства кратчайшей кривой в сложной области, и в частности доказано, что кратчайшая кривая в сложной области является функцией класса Получено уравнение кратчайшей кривой для сложной области в общем случае.

• Доказан модифицированный вариационный принцип Экланда, и исследованы его применения к изучению свойств метрической регулярности отображения банахова пространства в евклидово пространство относительно замкнутого подмножества евклидового пространства. Изучены приложения к теории задач оптимального управления с ограничениями.

Степень достоверности.

Достоверность обусловлена строгостью математических доказательств и использованием апробированных научных методов.

Апробация работы.

Основные результаты диссертации докладывались автором на следующих семинарах и конференциях:

• научный семинар "Численные методы в оптимизации и теории управления" отдела методов нелинейного анализа ФИЦ ИУ РАН под руководством

В. А. Березнева,

• научный семинар "Методы оптимизации" кафедры оптимального управления ВМК МГУ под руководством профессора Ф. П. Васильева,

• научный семинар "Экстремальные задачи и нелинейный анализ" кафедры нелинейного анализа и оптимизации факультета физико-математических наук РУДН под руководством профессора А. В. Арутюнова,

• международная конференция "Воронежская зимняя школа С.Г. Крейна -2016" (г. Воронеж, 2016),

• международная научная конференция "Ломоносов - 2016" (г. Москва, 2016),

• научная конференция "Ломоносовские чтения" (г. Москва, 2016). Публикации.

Основные результаты, полученные в диссертации, опубликованы в 9 печатных работах (см. [20] - [28]), 5 из которых изданы в журналах, рекомендованных ВАК (см. [21] - [24], [26]). Все результаты, выносимые на защиту, получены автором самостоятельно.

Структура и объем диссертации.

Диссертация, изложена на 85 страницах, состоит из введения, трех глав, разбитых на параграфы, списка условных обозначений и списка литературы, содержащего 78 наименований.

Благодарность.

Автор выражает искреннюю благодарность профессору Российского университета дружбы народов Араму Владимировичу Арутюнову и старшему научному сотруднику ФИЦ ИУ РАН Дмитрию Юрьевичу Карамзину за постановку задачи, постоянное внимание к работе, ценные замечания и поддержку.

1 Исследование регулярных экстремалей в задачах оптимального управления с фазовыми ограничениями

В главе исследуется свойства непрерывности и абсолютной непрерывности меры-множителя Лагранжа, возникающей в принципе максимума Понтрягина для задачи с фазовыми ограничениями типа равенств и неравенств. Ниже показано, что при определенных условиях регулярности функция распределения этой меры является гельдеровой, а если же вдобавок выполняется усиленное условие Лежандра, то даже липшицевой. Также рассматриваются примеры задач управления с фазовыми ограничениями, для которых можно гарантировать a priori (то есть без вычисления экстремального процесса), что соответствующая мера непрерывна.

Результаты этой главы развивают некоторые результаты работы [56] на более общий, чем рассмотренный в [56], случай задачи оптимального управления с фазовыми ограничениями типа равенств и неравенств. В главе активно используется аппарат теории функций действительного переменного и в частности такое понятие, как замыкание функции по мере.

Вопросом непрерывности меры-множителя интересовались многие исследователи как у нас в стране, так и за рубежом. Отметим работы [9], [10], [12], [58], [63], [64], [67]. Свойства непрерывности меры-множителя имеют важное значение для приложений и методов численного решения задач оптимального управления с фазовыми ограничениями (см., например, [59], [60]). Эти свойства необходимо учитывать при построении новых оптимизационных методов решения таких задач. Численным методам решения задач оптимального управления в целом посвящено большое число работ (см., например, [13] - [16] и библиографию там).

1.1 Постановка задачи и основные определения

Рассмотрим следующую задачу оптимального управления

rt2

, u(-)) := e0(p) + / ^>0(x,u,t)dt ^ min,

Jti

x = ^>(x,u,t), t G [t1,t2], t1 < t2, gl(x,t) = 0, g2(x,t) < 0, r(x, u, t) < 0, ei(p) = 0, 62 (p) < 0, p = (xi, X2,ti,t2).

Будем считать, что вектор-функции r, 6j, gj принимают значения в евклидовых пространствах размерности d(r), d(ej), d(gj) соответственно, функции 6o, ^о, ^ являются скалярными, x = , t G [t1 ,t2] - время (концы времени t1 и t2 не предполагаются фиксированными), x есть фазовая переменная из n-мерного евклидового пространства Rn, и u G Rm - переменная управления. Вектор p G Rn х Rn х R1 х R1 называется концевым. Управляющая функция, или просто управление, есть измеримая существенно ограниченная функция u(-), т.е. элемент пространства LTO([t1,t2]).

Предположим, что функции e0, 6j, ^ непрерывно дифференцируемы, функции gj дважды непрерывно дифференцируемы, а функции ^>0, r дважды непрерывно дифференцируемы по u для всех x, t.

Определение 1 Пусть u(t), t G [t1,t2] - управление, а x(t), t G [t1,t2] - соответствующая этому управлению траектория, то есть x = ^(x(t),u(t), t), и p - соответствующий концевой вектор. Допустимым процессом будем называть тройку (p, x,u), если она удовлетворяет . концевым ограничениям: e1 (p) = 0, e2(p) < 0,

. смешанным ограничениям: r(x(t), u(t), t) < 0 для п.в. t G [t1,t2], и . фазовым ограничениям: g1(x(t),t) = 0, g2(x(t),t) < 0 Vt G [t1,t2].

Как видно, фазовые ограничения накладываются лишь на фазовую переменную х, а смешанные ограничения и на фазовую переменную х, и на переменную управления и. Оказывается, что естественные предположения регулярности (см. ниже Определение 4) уже заведомо гарантируют абсолютную непрерывность соответствующей меры-множителя Лагранжа, отвечающей смешанному ограничению в силу принципа максимума. Более того, ее функция распределения принадлежит классу Эти предположения регулярности,

к сожалению, не выполнены для фазовых ограничений, что влечет определенные сложности при исследовании свойств соответствующей меры-множителя Лагранжа. Поэтому, несмотря на то, что смешанные ограничения формально представляют собой более широкий класс ограничений по сравнению с фазовыми ограничениями, они тем не менее, благодаря условию регулярности, классифицируются в другой тип ограничений. Именно исследованию свойств меры-множителя Лагранжа, отвечающей фазовым ограничениям, и посвящена эта глава.

Определение 2 Будем говорить, что допустимый процесс оптимален, если значение функционала Ф является наименьшим на множестве всех допустимых процессов.

Определение 3 Концевые ограничения называются регулярными в точке р = (х1,х2,^1,^2): ег(р) = 0, е2(р) < 0, если

(Верхние индексы означают координаты вектора или вектор-функции).

Определение 4 Смешанные ограничения называются регулярными, если для любых (х,и,Ь): г(х,и,Ь) < 0 существует вектор д = д(х,и,Ь) такой, что

гапк ^(р)= Фг), 34 е кет^(р) :

др др

Определение 5 Фазовые ограничения называются регулярными, если для любых (x,t): gi(x,t) = 0, g2(x,t) < 0, имеет место

rank dg-(x,t) = d(gi), 3 z = z(x,t) £ ker dg1 (x,t) :

(^(x,t),z) > 0 Vj : g2(x,t) = 0.

Определение 6 Фазовые ограничения называются согласованными с концевыми ограничениями в точке p*, если существует число е > 0 такое, что

{p £ R2n+2 : |p* - p| < е, ei(p) = 0, e2(p) < 0} С

{p : gi(xi,ti) = 0, g2(xi,ti) < 0, gi(x2M) = 0, g2(x2,t2) < 0}.

Определение 7 Будем говорить, что в концевых точках выполнены условия управляемости относительно фазовых ограничений, если для s = 1, 2

3£ convip(x*s,U(x*,t*),t*) :

(-1)s

(x* ,ts* + dg2 (x* ,ts*)

> 0 V j £ J (xs* ,t s).

Пусть (р*,х*,и*) допустимый процесс в задаче (1). Здесьр* = (х\,х22,г\,г21). Введем необходимые обозначения:

J(х,г) = {] : (х,г) = 0}, I(х,и,г) = {г : тг(х,и,г) = 0},

Гг(х,и,г) = дх(х,г)у(х,и,г) + ^(х,г), г = 1, 2, и(х,г) = {и е Кт : г(х,и,г) < 0, Гг(х,и,г) = 0},

Т =[11А1 Г = (Г1,Г2), 9 = (91,92). Пусть £(г) : К ^ Кт заданная измеримая ограниченная функция.

Определение 8 Замыканием справа по мере функции £ (г) в точке т называется множество Е+(т) таких векторов и е Кт что

^{г е [т,т + е] : £(г) е Б£(и)}) > 0 Vе > 0.

Здесь, Be(u) = {v G Rm : |v — u| < e}, и £ - мера Лебега на R. Соответственно, замыкание слева - это множество S-(т) таких векторов u G Rm что

£({t G [т — e, т] : £(t) G B£(u)}) > 0 Ve > 0.

Многозначное отображение S(t) := (t) U S+(t), где t G R, называется замыканием £(t) по мере Лебега1

Рассмотрим некоторые свойства замыкания по мере. Обозначим через U(t) замыкание по мере функции u*(t). Будем считать, что U— (t1) = U +(t1), U +(t2) =

и-(t2).

Предложение 1 Справедливы следующие свойства:

a) U—(t) = 0, U+(t) = 0 Vt G T;

b) U(t) С U(t) V t G T;

c) отображение U(t) полунепрерывно сверху;

d) u*(t) G U(t) для п. в. t G T.

Доказательство. Свойства a), b) и c) легко вывести из определения. Свойство d) следует из теоремы Данжуа2 и следующего утверждения. □

Предложение 2 Пусть т G (t1,t2). Вектор u* G Rm принадлежит множеству U + (т) тогда и только тогда, когда существует измеримое множество E + : E + П [^,т] = 0, такое что

i) £(E+ П [т,т + e]) > 0 Ve> 0;

ii) lim u*(t) = u.3

t—>T

Аналогично, u* G U—(т) ^ 3 E— : E— П [т,t2] = 0, £(E— П [т — е,т]) > 0

V e > 0, и lim u*(t) = u

tT

1 Термин "замыкание по мере" был впервые введен А. Я. Дубовицким и А. А. Милютиным в [34].

2Измеримая конечная функция аппроксимативно непрерывна почти всюду, [47].

3Символ lim означает, что предел берется только по точкам из S. t-S+r

Доказательство. Ясно, что из 1) и 11) следует, что и* € Ы + (т) в силу определения замыкания по мере. В обратную сторону: пусть и* € Ы +(т), докажем 1) и 11). Обозначим

Е+ = (£ € [т,$ : |и*(£) - и*| < П

* | <

п

Выберем строго монотонно убывающую и стремящуюся к нулю последовательность положительных чисел ап, такую что

£(£+ П [ап+1,ап]) > 0 V п.

Такой выбор осуществим в силу замыкания по мере и того факта, что Е+ С Е+ V к > п.

Рассмотрим множество

то

Е+ = и Е+ П [т + ап+1, т + ап].

П=1

Множество Е+, очевидно, измеримо и удовлетворяет 1) и 11) по построению. Аналогичные рассуждения могут быть проведены и слева от точки т. □ Будем использовать эти свойства ниже. Введем определение регулярного процесса.

Определение 9 Допустимый процесс (р*,ж*,и*) называется регулярным, если для любых £ € Т, и € Ы(£), векторы --Ц(ж*(£), и, £), ^ = 1,..., —ц(ж*(£), и, £), г € I(ж*(£),и,£) линейно независимы, и существует вектор й = й(и,£) € Кт такой, что й € кег-Ц(ж*(£),и,£) Vг € I(ж*(£),и,£), й € кег(ж*(£),и,£),

- Г

(ж*(£),и,£),й ) > 0 V; € 7(ж*(£),£). (3)

Наряду с определением регулярного процесса ниже нам также понадобится понятие регулярной точки множества и(ж,£). В отличие от регулярности процесса это понятие никак не связано с фазовыми ограничениями типа неравенств.

Определение 10 Назовем точку u £ U(x,t) регулярной, если rank ЩЦ(x,u,t) = d(gi) и существует вектор q £ ker (x,u,t) такой, что

/ 3r% \

(—(x,u,t),q)> 0 Vi £ I(x,u,t). (4)

Подмножество всех регулярных точек множества U(x,t) обозначим через UR(x,t). Положим Q(x,t) := clUR(x,t). Отметим, что если процесс регулярен, то U(t) С UR(x*(t),t) Vt £ T, и значит все близкие точки из некоторой его окрестности регулярны. В частности смешанные ограничения будут регулярными в некоторой окрестности регулярного процесса. Отсюда, поскольку U(t) = 0 Vt £ T, также следует, что Q(x*(t),t) = 0 Vt £ T. Будем неявно (т.е. не ссылаясь на них каждый раз) использовать эти факты ниже. Рассмотрим расширенную функцию Гамильтона-Понтрягина

H(x, u,ф,д, X0, t) = (ф, ip(x, u, t)) — (д, r(x, u, t)) — X0i0(x, u, t),

где д = (pi,^2), и малый Лагранжиан

l(p,X) = X°e0(p) + (Xi,ei(p)) + (Х2,в2(р)), X = (X°,Xi,X2).

Определение 11 Будем говорить, что допустимый процесс (p*,x*,u*) в задаче (1) удовлетворяет принципу максимума Понтрягина, если существует вектор X = (X0,Xi,X2) : X0 £ R, Xi £ Rd(e;), X2 £ Rd(e2), X0 > 0, X2 > 0, (.X2,e2(p*)) = 0, абсолютно непрерывная функция ф : T ^ Rn, функция д = (д-1,д2) : T ^ Rd(g) и измеримая ограниченная функция v: T ^ Rd(r) такие,

—о*

либо Л° + Ы£;)| > о, либо € (£) V € Т, (5)

—ж

—Н —г

^ = -^(£) + V(£)—ж(£) п.в. £ (6)

■^(О = (-1У+1 —Ж-(р*,Л) + —|(О, « = 1,2, (7)

тах Н"(и,£) = Н"(£) п.в. £, (8) —Н —г

Л = —(4) - V(4)—(£) п.в. (9)

Л((*) = (-1)'—(р*,Л) - №(0—¡г2(4*), « = 1, 2, (10)

—Н —г

-(£) =.(£)-(£) ..а£, (11)

(V(£),г(£)) = 0, V(£) > 0 п.в. £, (12)

где ВД := тахм€^) Я(и,£).

Более того, функция абсолютно непрерывна на Т, а вектор-функция д = (д1,д2) удовлетворяет следующим свойствам:

а) каждая из функций постоянна на каждом отрезке времени [а,Ь], на котором траектория ж*(£) целиком лежит во внутренности фазового множества, задаваемого ]-ым фазовым ограничением-неравенством, т.е. когда о2(£) < 0 V£ € [а, Ь];

б) вектор-функция д2 непрерывна слева на интервале (£!,£*), и М2(£2) = 0;

в) каждая из функций Д (нестрого) убывает;

г) вектор-функция измерима и ограничена на Т.

Процесс (р*,ж*,и*), удовлетворяющий принципу максимума называется экстремалью, а набор (Л,^,д, V) - множителями Лагранжа, отвечающими процессу (р*,ж*,и*) в силу принципа максимума.

Здесь и везде далее в работе приняты следующие соглашения относительно обозначений. Во-первых, если у отображений Н, о, г, и т.п., или их про-

изводных какие-нибудь из аргументов опущены, то вместо них подставлены значения х * (г), и * (г) или множители Лагранжа ф(г),ц(г), X. Во-вторых, все множители Лагранжа или элементы сопряженных пространств рассматриваются как вектор-строки, в то время как вектор-функции или векторы, такие как р,х,и, рассматриваются как вектор-столбцы. Градиенты функций считаются элементами сопряженных пространств. Элементы матрицы Якоби Е(х) : ^ имеют вид (х), и ее строками являются градиенты координатных функций Ег.

В работе [55] была получена следующая теорема.

Теорема 1 Пусть процесс (р*,х*,и*) оптимален в задаче (1). Предположим, что и (г) С ик(х * (г), г) V г е Т, концевые ограничения регулярны, фазовые ограничения регулярны и согласованы с концевыми в точке р*. Тогда процесс (р , х , и ) удовлетворяет принципу максимума.

1.2 Гельдеровость д2(г)

В этом разделе будут рассмотрены различные условия, гарантирующие непрерывность меры-множителя Лагранжа Д2(г) из принципа максимума.

Пусть г * е (г\,г2). Обозначим через Т>+(г *) множество всевозможных пределов справа траектории х в точке г :

„+{г.*^^р ^ + ^ - х*(г-)

Таким образом, множество Т>+(г*) - это, в определенном смысле, обобщенная производная справа х * (г) в точке г *. Если производная справа существует в классическом смысле, то это множество состоит только из одного элемента -значения производной.

Аналогично, множество

■р-{г.*)=1Лт,ир х '(г* + - х*(г->

является обобщенной производной траектории слева.

Введем следующие понятия. Будем говорить, что траектория выходит гладким образом на границу ]-ого фазового ограничения в точке £*, ] € 7(£*), если

( —Ж(£*), V) + —о2(£*) = 0 VV € Р-(£*).

В противном случае будем говорить, что траектория выходит на границу негладко.

Аналогично, когда

( —Ж(£*),") + —I2(£*) = 0 VV €Р+(£*),

будем говорить, что траектория гладко сходит с границы. Заметим, что справедливы неравенства

(—I2(£*), V) + —о2(£*) > 0 VV € Р-(£*) V; € 7(£*), (§¡2(£*),+ II2(£*) - 0 VV € Р+(£*) V; € 7(£*),

которые следуют из допустимости траектории.

Таким образом, выход на границу ]-ого фазового ограничения будет негладким, если существует вектор V € Р-(£*) такой, что (£*),^) + (£*) > 0. Точно также негладкий сход с границы ]-ого фазового ограничения эквивалентен существованию вектора V € Р+(£*) такого, что (^Х(£*),^ + тГ(£*) < 0. Будем использовать это ниже.

Следующее утверждение раскрывает важную связь между обобщенными производными (справа и слева) и замыканием по мере. Предложение 3 Справедливы следующие условия:

£>+(£*) с оопу ^(и+(£*),£*), £>-(£*) с оопу ^-(£*), £*). Доказательство. См. Предложение 2 в [10].

В случае, когда управление кусочно-непрерывная функция, проверка условий регулярности сводится к проверке условия (3) для всех и*(£) в точках непрерывности, и для и*(£-),и*(£+) в точках разрыва управления. Действительно,

и+(г) = {и* (г+)}, и-(г) = {и* (г-)}, и (г) = {и* (г)} в точках непрерывности и * (г), и и (г) = {и * (г-), и * (г+)} в точках разрыва.

Будем говорить, что функция в : Т ^ имеет корневой рост слева в точке г * е Т, если существует число с > 0 такое, что 1в(г) — в(г * )| < с\] \г — г * | Vг е [г*,г*] и корневой рост справа, если это неравенство выполняется для любого г е [г *,г2]. Рост называется линейным справа/слева, если у/\г - г * \ в оценке выше заменить на \Ь - г * |.

Теорема 2 Предположим, что допустимый процесс (р*,х*,и*) является экстремальным. Пусть концевые ограничения регулярны в точке р*, фазовые ограничения согласованы с концевыми в р*, и процесс (р*,х*,и*) регулярен. Тогда для любых множителей Лагранжа Х,'ф,ц,и, отвечающих (р*,х*,и*) в силу принципа максимума, выполняется: 1) условие нетривиальности

Похожие диссертационные работы по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК

Список литературы диссертационного исследования кандидат наук Горбачева, Анна Викторовна, 2016 год

Список литературы

[1] Аграчев А. А., Сачков Ю. Л. Геометрическая теория управления. - М.: Физмалит, 2005. - 392 с.

[2] Алексеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное управление.-М.: Физматлит, 2007. - 408 с.

[3] Арнольд В. И. Теория катастроф. - М. : Наука, 1990. - 128 с.

[4] Арутюнов А. В., Тынянский Н. Т. О принципе максимума в задаче с фазовыми ограничениями // Изв. АН СССР. Техн. кибернетика. - 1984. - N 4. - С. 60 - 68.

[5] Арутюнов А. В. К необходимым условиям оптимальности в задаче с фазовыми ограничениями // Докл. АН СССР. - 1985. - Т. 280, N 5. - С. 1033 -1037.

[6] Арутюнов А. В. К теории принципа максимума в задачах оптимального управления с фазовыми ограничениями // Докл. АН СССР. - 1989. - Т. 304, N 1. - С. 11 - 14.

[7] Арутюнов А. В. Условия экстремума. Анормальные и вырожденные задачи. - М.: Факториал, 1997.

[8] Арутюнов А. В., Карамзин Д. Ю., Перейра Ф. Принцип максимума для задач оптимального управления при ограниченных фазовых координатах в форме Р.В. Гамкрелидзе и его связь с другими условиями оптимальности // Доклады Академии наук. - 2011. - Т. 436, N 6.- 0. 738 - 742.

[9] Арутюнов А. В. Свойства множителя Лагранжа в принципе максимума Понтрягина для задач оптимального управления с фазовыми ограничениями // Дифференциальные уравнения. - 2012. - Т. 48, N 12. - С. 1621 -1630.

[10] Арутюнов А. В., Карамзин Д. Ю., Перейра Ф. Л. Условия отсутствия скачка решения сопряженной системы принципа максимума в задачах оптимального управления с фазовыми ограничениями // Тр. ИММ УрО РАН.

- 2014. - Т. 20, N 4. - С. 29 - 37.

[11] Арутюнов А. В., Карамзин Д. Ю. Принцип максимума в задаче оптмаль-ного управления с фазовыми ограничениями типа равенств // Дифференциальные уравнения. - 2015. - Т. 51, N 1. - С. 34 - 47.

[12] Афанасьев А. П., Дикусар В. В., Милютин А. А., Чуканов С. А. Необходимое условие в оптимальном управлении. - М.: Наука, 1990. - 320 с.

[13] Васильев Ф. П., Ишмухаметов А. З., Потапов М. М. Обобщенный метод моментов в задачах оптимального управления. - М.: Изд-во МГУ, 1989. -142 с.

[14] Васильев Ф. П., Осипов Ю. С., Потапов М. М. Основы метода динамической регуляризации. - М.: Изд-во МГУ, 1999. - 237 с.

[15] Васильев Ф.П., Куржанский М.А., Потапов М.М., Разгулин А.В. Приближенное решение двойственных задач управления и наблюдения. - М.: МАКС Пресс, МГУ, 2010. - 384 с.

[16] Васильев Ф. П. Методы оптимизации. Кн. 2. - М.: МЦНМО, 2011. - 433 с.

[17] Гамкрелидзе Р. В. Оптимальные по быстродействию процессы при ограниченных фазовых координатах // Докл. АН СССР. - 1959. - Т. 125, N 3. -С. 475 - 478.

[18] Гамкрелидзе Р. В. Оптимальные процессы управления при ограниченных фазовых координатах // Изв. АН СССР. Сер. матем. - 1960. - Т. 24, N 3.

- С. 315 - 356.

[19] Гончарова Е. В., Старицын М. В. Задача оптимального импульсного управления с фазовыми и смешанными ограничениями // Доклады академии наук. - 2011. - Т. 441, N 1. - С. 29 - 32.

[20] Горбачева (Давыдова) А. В., Карамзин Д. Ю. Уравнение геодезической кривой как приложение теории принципа максимума// Теоретические и прикладные задачи нелинейного анализа. - М.: ВЦ РАН, 2014. - 0. 138 -147.

[21] Горбачева (Давыдова) А. В., Карамзин Д. Ю. О некоторых свойствах кратчайшей кривой в сложной области // Дифференциальные уравнения. -2015. - Т. 51, N 12. - 0. 1647 - 1657.

[22] Горбачева (Давыдова) А. В., Карамзин Д. Ю. Исследование вариационных систем общего вида // Вестник ТГУ. - 2015. - Т.20, Вып.6. - 0. 1755 - 1759.

[23] Горбачева А. В., Карамзин Д. Ю. Уточнение условий оптимальности в задачах управления с фазовыми ограничениями типа равенств и неравенств // Вестник Тамбовского университета. Серия: Естественные и технические науки. - 2016 - Т. 21, Вып. 1. - С. 40 - 55.

[24] Горбачева А. В. Непрерывность меры-множителя Лагранжа из принципа максимума для задачи оптимального управления с фазовыми ограничениями типа равенств и неравенств в условиях слабой регулярности экстремального процесса // Вестник Тамбовского университета. Серия: Естественные и технические науки. - 2016. -Т. 21, Вып. 1. - 0. 28 - 39.

[25] Горбачева А. В. Некоторые примеры задач управления с фазовыми ограничениями // Материалы международной конференции "Воронежская зимняя математическая школа С.Г. Крейна - 2016" / под ред. В.А. Костина -Воронеж, 2016. - С. 131 - 133.

[26] Горбачева А. В., Карамзин Д. Ю. О некоторых классах задач управления с фазовыми ограничениями // Вестник РУДН, Серия: Математика, Информатика. Физика. - 2016. - N 1. - С. 11 - 18.

[27] Горбачева А. В. Уточнение условий оптимальности в задачах управления с фазовыми ограничениями // Сборник тезисов XXIII Международной научной конференции студентов, аспирантов и молодых ученых "Ломоносов-2016" секция "Вычислительная математика и кибернетика", Москва, МГУ имени М. В. Ломоносова, 11-15 апреля 2016 г. - М.: Издательский отдел факультета ВМиК МГУ; МАКС Пресс, 2016. - С. 105 - 107.

[28] Горбачева А. В., Карамзин Д. Ю. Некоторые свойства кратчайшей кривой в сложной области // Научная конференция "Ломоносовские чтения". Тезисы докладов, 18-27 апреля 2016 г. - М.: Издательский отдел факультета ВМиК МГУ; МАКС Пресс, 2016. - С. 66 - 67.

[29] Гусев М. И. Об оптимальном управлении обобщенными процессами при невыпуклых фазовых ограничениях //В кн.: Дифференциальные игры и задачи управления. Свердловск: УНЦ АН СССР, 1975.

[30] Дорофеева А.В. Развитие вариационного исчисления как исчисления вариаций // Историко-математические исследования. - 1961. - Т. 14. - С. 101 -181.

[31] Дорофеева А.В. Вариационное исчисление во второй половине XIX века // Историко-математические исследования. - 1963. - Т. 15. - С. 99 - 128.

[32] Дорофеева А. В., Тихомиров В. М. От множителей Лагранжа до принципа максимума Понтрягина // Историко-математические исследования. - 1980. - Т. 25. - С. 104 - 128.

[33] Дубовицкий А. Я., Милютин А. А. Задачи на экстремум при наличии ограничений // Докл. АН СССР. - 1963. - Т. 149, N 4. - С. 759 - 762.

[34] Дубовицкий А. Я., Милютин А. А. Необходимые условия слабого экстремума в задачах оптимального управления со смешанными ограничениями типа неравенства // Ж. вычисл. математематики и матем. физизики. -1968. - Т 8., N 4. - С. 725 - 779.

[35] Дубовицкий А. Я., Дубовицкий В. А. Необходимые условия сильного минимума в задачах оптимального управления с вырождением концевых и фазовых ограничений // Успехи матем. наук. - 1985. - Т. 40, Вып. 2. - С. 175 - 176.

[36] Дыхта В. А., Самсонюк О. Н. Принцип максимума для гладких задач оптимального импульсного управления с многоточечными фазоограничениями // Ж. вычисл. матем. и матем. физ. - 2009. - Т. 49, N 6.- 0. 981 - 997.

[37] Захаров Е. В., Карамзин Д. Ю. К исследованию условий непрерывности меры-множителя Лагранжа в задачах с фазовыми ограничениями // Дифференциальные уравнения. - 2015. - Т. 51. N 3. - С. 395 - 401.

[38] Иоффе А. Д., Тихомиров В. М. Теория экстремальных задач. - М.: Наука, 1974. - 481 с.

[39] Иоффе А. Д., Тихомиров В. М. Несколько замечаний о вариационных принципах // Мат. заметки. - 1997. - Т.61, N 2. - С. 305 - 311.

[40] Карамзин Д. Ю. К теории принципа максимума в задачах с фазовыми ограничениями // Вестник МГУ, ВМиК. - 2002. - 0ер.15, N 4. - 0. 23 - 31.

[41] Карамзин Д. Ю. Необходимые условия экстремума в задаче управления с фазовыми ограничениями // Ж. вычислит. математики и матем. физики. - 2007. - Т.47, N 7. - С. 1123 - 1150.

[42] Карамзин Д. Ю. Принцип максимума в задаче управления при ограниченных фазовых координатах // Автоматика и телемеханика. - 2007. - N 2. -С. 26 - 38.

[43] Куржанский А. Б., Осипов Ю. С. К задаче об управлении с ограниченными фазовыми координатами // Прикл. математика и механика. - 1968. - T. 32, N 2. - C. 194 - 202.

[44] Куржанский А. Б. Управление и наблюдение в условиях неопределенности.

- М.: Физматлит, 1977. - 392 с.

[45] Куржанский А. Б. Об аналитическом описании пучка выживающих траекторий дифференциальной системы // Докл. АН СССР. - 1986. - Т. 287, -N 5. -С. 1047 - 1050.

[46] Милютин А. А. Принцип максимума в общей задаче оптимального управления. - М.: Физмалит, 2001. - 303 с.

[47] Натансон И. П. Теория функций вещественной переменной. - М.: Наука, 1974. - 480 с.

[48] Ньютон И. Математические начала натуральной философии. В собр. сочин. акад. А.Н. Крылова, т. 5 - М.: Изд-во АН СССР, 1936.

[49] Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. - М.: Наука, 1983. - 393 с.

[50] Смольяков Э. Р. Неизвестные страницы оптимального управления. - М.: Едиториал УРСС, 2002. - 104 с.

[51] Alexandrov V. V., Budninskiy M.A. On Kinematic Control Extremals // European Control Conference (ECC), Zurich, Switzerland. - 2013. - P. 210

- 214.

[52] Arutyunov A. V., Aseev S. M., Blagodatskikh V. I. First-order necessary conditions in the problem of optimal control of a differential inclusion with phase constraints // Mat. Sb. - 1993. - V. 184, N 6. - P. 3 - 32.

[53] Arutyunov A. V., Aseev A. M. State constraints in optimal control. The degeneracy phenomenon // Systems & Control Let. - 1995. - V. 26. - P. 267 -273.

[54] Arutyunov A. V., Karamzin D. Yu., Pereira F. L. The Maximum Principle for Optimal Control Problems with State Constraints by R.V. Gamkrelidze: Revisited //J. Optim. Theory Appl. - 2011. - V. 149. - P. 474 - 493.

[55] Arutyunov A. V., Karamzin D. Yu. Non-degenerate necessary optimality conditions for the optimal control problem with equality-type state constraints // J Glob Optim. - 2015.

[56] Arutyunov A. V., Karamzin D. Yu. On some continuity properties of the measure Lagrange multiplier from the maximum principle for state constrained problems // SIAM J. Control Optim. - 2015. - V. 53, N 4. - P. 2514 - 2540.

[57] Arutyunov A. V., Karamzin D. Yu., Pereira F.L. . State Constraints in Impulsive Control Problems: Gamkrelidze-Like Conditions of Optimality // Journal of Optimization Theory and Applications. - 2015. -V. 166, N 2. -P. 440 - 459.

[58] Bonnans J. F., Hermant A. Revisiting the Analysis of Optimal Control Problems with Several State Constraints // Control and Cybernetics. - 2009. - V. 38, N 4. - P. 1021 - 1052.

[59] Bryson E. R. , Yu-Chi Ho. Applied optimal control, 1969. - 481 p.

[60] Buskens C., Maurer H. SQP-methods for solving optimal control problems with control and state constraints: adjoint variables, sensitivity analysis and real-time control // Journal of Computational and Applied Mathematics. - 2000. - V. 120. - P. 85 - 108.

[61] Clarke F. H. Optimization and Nonsmooth Analysis, Wiley-Interscience, New York, 1983; reprinted as vol. 5 of Classics in Applied Mathematics, SIAM, Philadelphia, PA, 1990.

[62] Ekeland I. On the variation principle. //J. Math. Anal. Appl. - 1974. - V. 47.

- P. 324 - 353.

[63] Galbraith G. N., Vinter R. B. Lipschitz continuity of optimal controls for state constrained problems // SIAM J. Control and Optim. - 2003. - V. 42, N 5. -P. 1727 - 1744.

[64] Hager W. W. Lipschitz continuity for constrained processes // SIAM J. Control and Optim. - 1979. - V. 17. - P. 321 - 338.

[65] Hartl R. F., Sethi S.P., Vickson R. G. A survey of the maximum principle for optimal control problems with state constraints //SIAM Rev. - 1995. - V.37, N 2. - P. 181 - 218.

[66] Karamzin D. Yu., de Oliveira V. A., Pereira F. L., Silva G. N. On some extension of optimal control theory // European Journal of Control. - 2014. - V. 20, N 6. - P. 284 - 291.

[67] Maurer H. Differential stability in optimal control problems // Applied Mathematics and Optimization. - 1979. - 5 - P. 283 - 295.

[68] Mordukhovich B. S. Maximum principle in problems of time optimal control with nonsmooth constraints // Appl. Math. Mech. - 1976. - V. 40. - P. 960 -969.

[69] Mordukhovich B. S. Variational Analysis and Generalized Differentiation. (Vol. 1, 2) - Springer, 2006.

[70] Neustadt L. W. An abstract variational theory with applications to a broad class of optimization problems. I. General theory // SIAM J. Control. - 1966.

- V. 4. - P. 505 - 527.

[71] Neustadt L. W. An abstract variational theory with applications to a broad class of optimization problems. II. Applications // SIAM J. Control. - 1967. -V. 5. - P. 90 - 137.

[72] Pereira F. L. A maximum principle for impulsive control problems with state constraints // Comput. Math. Appl. - 2000. - V. 19, N. 2. - P. 137 - 155.

[73] Pereira F. L., Silva G. N. Stability for impulsive control systems // Dynam. Syst. - 2002. - V. 17. - P. 421 - 434.

[74] Rampazzo F., Motta M. Nonlinear systems with unbounded controls and state constraints: a problem of proper extension // Nonlinear Differential Equations and Applications. - 1996. - V. 3, I. 2. - P. 191 - 216.

[75] Russak I. B. On general problems with bounded state variables // Journal of Optimization Theory and Applications. - 1970. - V. 6, N. 6. - P. 424 - 452.

[76] Vinter R. V., Ferreira M. A. When in the maximum principle for state constrained problems nondegenerate? //J. Math. Anal. and Appl. - 1994. - V. 187. - P. 438 - 467.

[77] Vinter R. V. Optimal control. - Modern Birkhauser Classics, 2010.

[78] Warga J. Optimal control of differential and functional equations. - New-York: Academic Press, 1972.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.