Задачи многократной коррекции управляемых систем тема диссертации и автореферата по ВАК РФ 01.01.02, кандидат физико-математических наук Гредасова, Надежда Викторовна

  • Гредасова, Надежда Викторовна
  • кандидат физико-математических науккандидат физико-математических наук
  • 2012, Екатеринбург
  • Специальность ВАК РФ01.01.02
  • Количество страниц 114
Гредасова, Надежда Викторовна. Задачи многократной коррекции управляемых систем: дис. кандидат физико-математических наук: 01.01.02 - Дифференциальные уравнения. Екатеринбург. 2012. 114 с.

Оглавление диссертации кандидат физико-математических наук Гредасова, Надежда Викторовна

Содержание

Введение

Предыстория и актуальность темы

Актуальность работы и научная новизна

Краткое содержание работы

Апробация работы

Глава 1. Непрерывные линейные системы с квадратичными ограничениями

1.1. Оценивание состояний управляемых систем

1.1.1. Оценивание при вырожденной матрице Ро

1.2. Управление по неполным данным

1.3. Коррекция движения системы

1.4. Примеры

Глава 2. Линейные системы с геометрическими ограничениями и многошаговые системы

2.1. Оценивание состояний управляемых систем

2.2. Задача программного управления по неполным данным

2.3. Задача многократной коррекции

2.3.1. Алгоритм пошаговой многократной коррекции

2.3.2. Алгоритм коррекции с уменьшенным количеством проверок

2.3.3. Алгоритм коррекции с прогнозом на один шаг

2.4. Основные результаты для линейных систем

2.5. Примеры

2.6. Оценивание состояний нелинейных многошаговых систем

2.7. Управление по неполным данным

2.8. Задача многократной коррекции

2.9. Основные результаты для многошаговых систем

2.10. Задача коррекции для линейно-квадратичного случая

2.11. Примеры

Глава 3. Квазилинейные системы при дискретных наблюдениях

3.1. Оценивание состояний квазилинейных систем

3.2. Аппроксимация информационного множества

3.3. Минимаксное управление по неполным данным

3.4. Многократная коррекция минимаксного управления

3.5. Пример

Глава 4. Задачи выставки инерциальных систем и влияние коммуникационных ограничений на параметры коррекции движения

4.1. Постановка задачи, уравнения состояния и вектор измерения

4.2. Простейшая модель процесса выставки

4.3. Результаты численного моделирования

минимаксных алгоритмов

4.4. Коррекция движения и коммуникационные ограничения

4.4.1. Влияние коммуникационных ограничений на оценивание

4.4.2. Влияние коммуникационных ограничений на формирование управления

4.5. Пример

Заключение

Литература

Рекомендованный список диссертаций по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК

Введение диссертации (часть автореферата) на тему «Задачи многократной коррекции управляемых систем»

Введение

Предыстория и актуальность темы. Диссертационная работа посвящена разработке эффективных методов коррекции движения управляемых систем, описываемых обыкновенными дифференциальными или многошаговыми уравнениями. Предполагается, что система находится под воздействием неопределенного детерминированного возмущения. Начальное состояние системы также предполагается неизвестным. Кроме того, фазовый вектор объекта может быть не доступен для измерения. Однако по ходу движения измеряется некоторый сигнал, несущий информацию о фазовом состоянии системы. На основании доступной информации требуется сформировать управление, минимизирующее терминальный функционал в расчете на худший случай реализации начальных состояний и неопределенных возмущений.

Таким образом, в работе рассматриваются задачи, которые можно отнести к проблемам управления детерминированными системами с неполной информацией. Данное направление в теории управления имеет довольно длинную историю и достаточно разработанные результаты. Вместе с тем исследования в данной области далеко не закончены и активно продолжаются в настоящее время. Они стимулируются новыми требованиями к качеству управления, развитием технических измерительных средств, новыми задачами создания распределенных систем управления.

Единый подход к решению указанных проблем изложен в монографии H.H. Красовского и А.И. Субботина [60], где в главе 15 рассмотрены методы решения весьма общей информационной игровой задачи. В этом подходе предполагается, что по ходу процесса становится известной некоторая выпуклая компактная область, содержащая истинный вектор системы. Способы построения области не уточняются. В этом факте заключаются возможные варианты уточнения постановки задачи. Так, например, в работе H.H. Красовского [59] область представляется в виде n-мерного прямоугольника со сторонами, параллельными осям координат. В монографии A.B. Куржанского [67] изложены методы, связанные с

построением в фазовом пространстве т.н. "информационного множества" (далее часто используем сокращение ИМ). Именно эти методы положены в основу решения задач настоящей диссертации. Методы "информационных множеств" использовались в работах Б.И. Ананьева, А.Б. Куржан-ского, Г.С. Шелементьева, А.Г. Кремлёва [5,6,62-64,67,94,95].

Следуя [5,6,59,67] уточним постановку задачи, которую будем называть "задачей однократной коррекции". Пусть задана управляемая система вида

где х Е Яп — фазовый вектор системы, не доступный для измерения, и Е В? — управление, V Е В? — неопределенное детерминированное возмущение. По ходу процесса измеряется вектор

Вектор-функции /(£, •, •), •, •) при фиксированном £ предполагаются непрерывными. При фиксированных х, и, V функции /, д считаются кусочно-непрерывными по ¿. Заданы априорные ограничения (хо,у(-)) Е "Уо, и(-) Е и, где Уо,и, — слабо компактные множества [51,87,97] в пространствах Яп х и Ь\[¿о, Т] соответственно. Для существова-

ния и продолжимости решений уравнения (1) примем стандартные усло-

вия [3,24,58,80]:

\\f(t,Xi,u(t),v(t)) - f(t,X2,u{t),v(t))\\ < Ас,и,г,- Х2\\,

||/(*,ж,и,г;)|| <*(! + ||z|| + IHI + IHI), xeRn, и Е Rq, veRP,

где и(-) Е U, v(-) Е proj^P^ ^ Vq, (t, xi) E G, i = 1,2. Здесь G — компактное подмножество в [io, T] x Rn, Ag,u,v> h — константы, || • || — евклидова норма.

Введем ряд обозначений. Сужение измеримой вектор-функции :r(s), s Е [¿о? Т], на отрезок [i0,£] будет обозначаться через хь{-), а сужение на отрезок [t,T] — через xt(-).

Определение 1 (Куржанский A.B., [61]). Информационным множеством (ИМ) X{t,y,u) системы (1), (2), где и Е U, называется совокупность всех таких векторов {ж(£)}, которые могут реализоваться в системе при некоторой паре (жо,г>(-)) Е V0 при условии, что выход уравнения (2) на отрезке [¿о, t] почти всюду совпадает с измеренным сигналом

х = f(t,x,u,v), te[to,T]

(1)

y = g(t,x,v), у Е Rm.

(2)

Ясно, что область формально зависящая от сужений уь{-),

ut(•), зависит также и от ограничений Vq. Характер этой зависимости будет уточняться ниже с учетом вида ограничений (интегральные, мгновенные и т.д.). Чтобы подчеркнуть указанную зависимость будем иногда писать Af(t, у, и | Vq). В начальный момент имеем X(to, у, и) = proj^«Vo, где проекция будет компактом в силу сделанных предположений.

Определение 2. Совместимым множеством Y(t,y,u) системы

(1), (2), где и 6 U, назовем совокупность всех пар {(x(t), vt(-))}, для которых найдется элемент (xo,v(-)) Е Vo такой, что выход уравнения

(2) на отрезке [¿о, t] почти всюду совпадает с измеренным сигналом у*(-), причем функция vt{-) есть сужение v(-) на отрезке [i, Т].

Для подчеркивания зависимости совместимого множества от Vo будем иногда писать V(£, у, и | Vo). Связь информационного и совместимого множеств выражается равенством X{t, у, и) — proji?„V(i, у, и). Совместимые множества обладают полугрупповым свойством: V(s, yf(•), ut(') I Y(t,y,u)) = V(s,y,u | Vo), где to ^ t < s < Т. В качестве следствия имеем равенство ИМ: <Y(s, у® (•), wf(-) | V(t,y,u)) = X{s,y,u | Vq). Отметим, что информационные множества также обладают полугрупповым свойством [67] при мгновенных ограничениях на возмущения.

Продолжим формулировку задачи коррекции. Первоначальная цель управления состоит в минимизации функционала Ф(Х(Т,у,и)) в конечный момент времени, где Ф(-) — некоторый функционал, заданный на компактных подмножествах Rn. Функционал предполагается ограниченным снизу и монотонным: Ф(Хх) < Ф(Х2), если Х\ С Хч- Область до-, стижимости системы (1) в момент t по всем параметрам Vq обозначим через Xt(u | Vo). Множество Vo будет опускаться, если это не приводит к недоразумениям. В начальный момент времени назначается управление щ, решающее программную задачу

Ф(Хт(и)) min. (4)

ие U

Такое управление в общем случае определяется неоднозначно. Будем считать, что минимум в задаче (4) существует, и выбрано какое-то управление щ G Arg min Ф(Яг(и)). Далее назначается некоторый момент времени s Е [to,T], вплоть до которого в системе (1) сохраняется управление Uq(-) и проводится наблюдение согласно уравнению (2). В момент s наблюдение прекращается, формируется область достижимости

Xt{us{-) I V(s,y,uo)) и решается вспомогательная программная задача Ф(*т(щ(-) I V(s,y,u0))) -> min =r3(y,uo). (5)

us(-)eU(ug)

Здесь и далее множество \]{и*) состоит из всех функций которые

вместе с начальным отрезком и1 составляют некоторую функцию и £ U.

Выберем какое-то решение задачи (5) и обозначим его usо(-). В силу свойств функционала Ф значение оптимального функционала в задаче (5) не больше аналогичного значения задачи (4). Вопрос заключается в том, как выбрать момент окончания наблюдения s. Для этого выбора в цитированных выше работах А.Б. Куржанского и его школы предлагалась следующая конструкция.

Пусть Y(s, t I V(t,y,u)) означает множество всех продолжений {yt{-)} сигнала у*(-) на отрезок [io,s], где t < s, при назначенном управлении и Е U. Определяются величины

n{s,y,uo)= sup rs(y,u0),

yt{-)eY(s,t\V{t,y,u0)) ^

n(t,y,u0)= min rt(s, у, щ).

se[t,T}

Теперь задачу однократной коррекции можно сформулировать так.

Задача 1 (Однократной коррекции). Найти наименьший корень s уравнения

r*(t,y,u0) =rt(y,uo). (7)

Этот наименьший корень s называется моментом коррекции исходного управления щ, которое изменяется на usо(-) на оставшемся отрезке управления [s, Т].

Отметим, что имеются иные постановки задачи, представленные в работах Ф.Л. Черноусько, В.Б. Колмановского, H.A. Парусникова, В.М. Морозова, В.И. Борзова, В.Н. Афанасьева и др. [26,35,78,91-93]. В частности, класс управлений может быть не из пространства L2, а из пространства обобщенных функций первого или более высокого порядка, как в [5,91,92]. Многие постановки допускают присутствие стохастических или смешанных возмущений, см. работы В.В. Александрова, Б.И. Ананьева, В.Н. Афанасьева, И.А. Богуславского, И.А. Дигайловой, Д.М. Климова [3,7,9,26,31,35,45,55].

Практически решение представленной выше задачи 1 достигается при использовании следующей дискретной схемы.

Дискретная пошаговая процедура. Пусть

Л : ¿0 < ¿1 < • • • < ¿ЛГ = т (8)

— разбиение отрезка [¿о,Т], и |А| = тах{^ — ¿¿-1 : 1 ^ г ^ А^}. Тогда:

(а) До начала процесса решается задача (4) и находится оптимальное управление щ, которое сохраняется на начальном отрезке [¿0^1]-

(б) В момент ¿1 и в последующие моменты и проверяется равенство (7). Если г*(и,у,щ) < г^(у,щ), то управление на следующий отрезок [и,и+1] не меняется. В противном случае на весь оставшийся отрезок [и,Т] назначается новое управление а момент ^ объявляется моментом коррекции.

Вообще говоря, как отмечалось выше, начальное управление щ может определяться неоднозначно, и момент коррекции может зависеть от этого управления. Однако (особенно в линейных задачах) весьма часто имеем г^о = 0. Как видно из построения, управление на отрезке [и,Т] вычисляется позиционно, на основе информации {?/*(•), (•)}.

Актуальность работы и научная новизна. В данной работе мы несколько обобщаем задачу 1. Если процесс наблюдения не является затратной процедурой, то его следует продолжить после нахождения первого момента коррекции. Таким образом, возникает

Задача 2 (Многократной коррекции). В соответствии с разбиением (8) до начала процесса вычисляется управление щ (решение задачи (4)), которое сохраняется на начальном отрезке [¿о5 ¿1]• Ни отрезке [¿1,^2] выбирается управление щ^-), совпадающее с если < гЬ1(у,щ). В противном случае иы(-) = щ^-), где

— одно из решений задачи (5) при в = ¿1. В последующие моменты и процедура повторяется.

В результате решения задачи 2 возникает управление ид 6 и, которое корректируется, вообще говоря, более чем в одной точке. В конце процесса подсчитывается результат гт(у, ид), который по построению не хуже, чем аналогичный результат решения задачи 1. Задача 2 впервые рассмотрена в работе [13]. Помимо сформулированной задачи ниже рассматриваются некоторые её модификации. В частности, в том случае, когда допустимо изменение управления в каждый момент разбиения (8), получается наилучший результат.

Сформулированные задачи предполагают эффективное вычисление величин (6), умение строить информационные множества и множества

достижимости для рассматриваемых систем. В связи с этим укажем один весьма общий способ определения информационных множеств, основанный на методе динамического программирования и предложенный в работах А.Б. Куржанского и П. Варайи [68,69,109,110]. Пусть уравнение (2) имеет вид

y = g(t,x) + w, yeRm, (9)

где возмущение w(-) вместе с начальным состоянием хо и возмущением v(-) из (1) стеснены ограничением

г

F(xq) + J f0(t,v,w)dt^l. (10)

¿0

Введём функцию Беллмана

V(t, х) = min J(t, х, v),

v(-)

где функционал J определяется формулой

t

J(t, X, V) = F(xо) + J /о(г, V, у(т) - д(т, x))dr, x(t) = х.

to

Уравнение Беллмана для V(t, х) имеет следующий вид:

Vt = mm{-f'(t,x,u,v)Vx + fo(t,v,y(t) - g(t,x))} ,

(И)

V(t0,x) = F(x),

где символ ' означает транспонирование.

За последние десятилетия методы решения уравнений типа (11) дополнились новыми результатами в случае негладких функций F, /о (см. монографии Ф. Кларка, А.И. Субботина [102,116]). Если решение уравнения (И) в каком-то смысле найдено, то ИМ запишется в виде неравенства X(t,y,u) = {х : V(t,x) < 1}.

Отметим еще, что задачи управления по неполным данным типа (4), (5) изучались в работах Т.Ф. Филипповой (см. [89]).

В настоящей диссертации разработаны методы решения задач многократной коррекции движения управляемых систем, описываемых обыкновенными дифференциальными уравнениями или многошаговыми уравнениями в условиях неполной информации о фазовом векторе. Предложены алгоритмы коррекции, установлены их свойства. Рассмотрено

приложение к задаче выставки инерциальных систем и исследовано влияние информационных ограничений на параметры коррекции движения.

Краткое содержание работы. В диссертации разрабатываются методы решения задач многократной коррекции движения механических систем, описываемых обыкновенными дифференциальными или многошаговыми уравнениями с неполной информацией при непрерывных и дискретных наблюдениях.

Диссертация состоит из введения, 4-х глав, заключения и списка литературы из 116 наименований. В тексте содержится 24 рисунка.

В первой главе работы рассмотрено решение задачи многократной коррекции для линейных непрерывных систем с квадратичными ограничениями. Для полноты изложения приведены решения всех необходимых вспомогательных задач (4) - (6) для терминального функционала Ф(Хт(и)) = тах где || • || — евклидова норма ий- некоторая

матрица. В пункте 1.1 главы изложены основные результаты по оцениванию линейных систем с детерминированными возмущениями, стесненными квадратичными ограничениями. Большинство результатов получено ранее в работах А.Б. Куржанского, И.Я. Пищулиной [66,67] и Б.И. Ананьева [6]. Однако использование метода динамического программирования позволило охватить также случай вырожденной матрицы Ро в ограничениях

где ЦяЦр = х'Рх, символ ' означает транспонирование, для системы с наблюдением

х = А(г)х + в(г)и + С{г)у, и^г^т, у = с(г)х + т(г). (13)

В предположении, что однородная система (13) вполне наблюдаема [33, 58] на любом подотрезке [г, в] С [¿о в подпункте 1.1.1 установлен вид ИМ:

Х(1,у,и) = {х\У(1,х)^1}, У(1,х) = \\х\\2Р{1)-2x^(1)+д(1), (14)

где У(Ь,х) — решение уравнения Беллмана вида (11). Для параметров множества (14) выписаны дифференциальные уравнения с известными

хЕ Хт{и)

Т

(12)

начальными условиями, причем для вектора d(t) и скаляра g(t) эти условия нулевые. В силу полной наблюдаемости матрица P(t) будет невырожденной и ИМ будет ограниченным эллипсоидом. В пункте 1.2 приведено выражение для совместимого множества в соответствии с определением 2

V(t,y,u) = j(W-)) : J \\vt(T)\\2Q{T)dT + V(t,x) < 1

и формула для минимума rt(y, и) во вспомогательной задаче управления

V г ^fnru ^ 11^11 "" = гЖу>и(15)

x€XT{ut{-)\V(t,y,u)) ut(-)

установленная в работах [6,67] при квадратичных ограничениях на управление

т

J 1М*)11я(0<** < 1-

to

В пункте 1.3 использована структура множества Y(0, t | V(i, у, и)) всех возможных продолжений сигнала у1{-) и формула для величины наихудшего прогноза rt(s,y,u) (см. (6)), также установленные в указанных работах. На основании приведенных формул сделано следующее замечание.

Если в данной позиции {£,?/(•)} выполнено равенство (7), где и*0 — управление, найденное на предыдущем этапе, и величина h(t) = g(t) — d! P~ld < 1, то следующий момент корректировки может наступить через сколь угодно малый промежуток времени. Действительно, пусть мы находимся в точке x(t) — центре информационного множества X(t, у, и).

t+ô

Выбирая функцию fi(t) = y(t) — G(t)x(t) так, чтобы I \\fi(T)\\2R,T)dT

ад1

t

1 — /¿(£), получаем продолжение сигнала, при котором ИМ + у, и) состоит из одной точки, и ресурс помех к моменту Ь + 5 уже исчерпан. Но тогда приходим к управляемой системе (13), где V = 0, с полной информацией, и на отрезке [Ь + Т] оптимальное управление уже не корректируется.

Для рассматриваемого случая в силу симметрии ограничений можно считать, что начальное управление щ = 0. Если зафиксировать некоторую реализацию помех, то за гарантированный результат управления с

помощью пошаговой процедуры из начальной позиции {¿,2/(-)}> £ > ¿о> где г^(-) =0, естественно принять величину

r*(T) = lim max гт(у,ип\),

|Л|->0 y(-)&Y(T,t\V{t,y,uox))

где |Л| — диаметр разбиения (8) и ^ол — некоторое управление, построенное согласно пошаговой процедуре. Поскольку величина гт(у, и) в нашем случае слабо непрерывно зависит от функции и(-) € L^T], то верно следующее. Для любого е > 0 существует S > 0 такое, что для любого разбиения Л отрезка [t,T] с диаметром |А| < ö и любого продолжения yt{-) сигнала уь{-) при управлении иь{-) = 0 пошаговая процедура приводит к результату управления гт(у,Щ\) < г*{Т) + е. Если обновляющая

т

функция /i(i) = у(t) - G(t)x(t), J ||/i(r)||^T)dr ^ 1 фиксирована, то

to

существует последовательность управлений uoajv, соответствующая разбиениям Адг, j Аtv" ! —» 0, которая слабо сходится к некоторому управлению т

щ, причём J \\щ(т)\\2нс1т < 1 и гт(у,щ) ^ г*(Т). В заключение главы, в t

пункте 1.4 приведены два примера, иллюстрирующих процедуру многократной коррекции.

Во второй главе рассмотрена задача коррекции для линейных систем с геометрическими ограничениями и многошаговых нелинейных систем. В пункте 2.1 рассмотрены вопросы оценивания для систем вида (13), где to = 0, с дискретными наблюдениями

yk = Gkx{tk)+wk, k = l,...,N, tN+1 = T. (16)

Неизвестные параметры стеснены здесь геометрическими ограничениями хо 6 Xq, v(t) 6 V, wk £ W с выпуклыми и компактными ограничивающими множествами. Приведены рекуррентные формулы для информационного множества и отмечено, что компактнозначная мультифунк-ция ИМ Х(-,у,и) непрерывна по Хаусдорфу на полуинтервале [tk,tk+1) и предел слева X{tk — 0, у, и) существует для всех к — 1,..., iV + 1. Выписаны также опорные функции информационных множеств. В пункте 2.2 решается вспомогательная задача управления по неполным данным. С использованием методики теории управления в условиях неопределенности получена формула для величины минимакса rt(y,u) терминального функционала ф(х(Т)). Отмечен частный случай, в котором при

ф[х) =| q'x | формула для rt(y,u) принимает достаточно простой вид. Пункт 2.3 посвящен собственно задаче коррекции. Здесь определяется множество Y(r,t,y,u) всевозможных продолжений сигнала, которое в силу дискретности измерений является конечномерным выпуклым компактом, и наихудший прогноз гарантированного результата управления по формуле

п(т,у,и)= тах гт(у,и). (17)

yeY{T,t,y,u)

Утверждается, что лишь последующие за tk измерения в моменты tk+i, tk+2, • • • могут обеспечить уменьшение прогноза гарантированного результата (17) при t — tk- В подпунктах 2.3.1 - 2.3.3 приведено описание 3-х возможных алгоритмов коррекции.

Алгоритм пошаговой многократной коррекции. Изменяем будущее управление Uk = щк лишь в некоторые моменты tk поступления информации по формуле (16). Для краткости полагаем, что Гк(у,и) = rtk(y,u), г*(к,у,и) = r*(ifc, у, и), где последняя величина определена в формуле (6). Если в позиции X(tk,y,u) имеем неравенство

гк(у,и) > г*(к,у,и), (18)

то управление щ, найденное на предыдущих шагах, не корректируется. В противном случае, если управление щ к тому же неоптимально, переходим к оптимальному управлению йк в задаче

rt{y^u) — min max тахф(х(Т)). (19)

Щ х€ X(t,y,u) vt

В конце процесса получаем величину гт{у,и) как максимум целевой функции </>(•), вычисленной на конечной позиции Х(Т,у,и), а также управление и — и(-,у). Это управление зависит от реализации сигнала yN. Моменты коррекции обозначим {71,72,..., tr-}, где ц = Un 1 ^ Ч < Н < • • • < i>K ^ N. В частности, совокупность моментов коррекции может быть пустой, что означает удачный выбор начального управления щ(-) и пошаговое уменьшение наихудшего терминального критерия независимо от реализующегося сигнала. Другой крайний случай состоит в совпадении моментов коррекции со всем множеством ..., ¿дг}. Минимум для г*(&, у, и) можно подсчитать по конечному множеству {tk+1,...,

М-

Алгоритм коррекции с уменьшенным количеством проверок. С целью уменьшения проверок неравенства (18) в позиции X(tk,y, и), где неравенство выполняется и не надо корректировать будущее управление Uk,

сохраняем это управление вплоть до момента

1 = arg min гк(т, у, и).

Если же в момент неравенство (18) не выполняется, то полагаем *&k+i — tk+i- В момент $k+i повторяем процедуру.

Алгоритм коррекции с прогнозом на один шаг. Алгоритм аналогичен первому, но вместо неравенства (18) проверяем более простое неравенство гь(у,и) > rk{tk+i,y,u). В принципе, количество коррекций управления здесь может оказаться больше, чем в первом алгоритме. Однако далее показано, что эти алгоритмы по-существу эквивалентны.

Основные результаты для линейных систем собраны в пункте 2.4. Все указанные алгоритмы предваряются подсчетом числа го и определением начального оптимального управления щ. Отмечается, что построение ИМ X(t,y,u) с помощью опорных функций — достаточно сложная задача. Поэтому часто прибегают к аппроксимации сверху указанных множеств эллипсоидами или прямоугольниками [56,103,108]. Аппроксимация приводит к оценкам сверху для величин rt(y, и) и (17). Установлен следующий результат.

Пусть в системе (13), (16) при и = 0 реализуется некоторый сигнал yN, и зафиксировано начальное оптимальное управление щ. Тогда указанные алгоритмы однозначно определяют последовательность {Ть т2? • • • 5 Тйг}5 тг = Uk, 1 ^ Ч < h < ■ ■ • < i>K ^ AT, моментов изменения управления. При этом управление ит, формируемое алгоритмом на отрезке [r«,ri+i], совпадает с оптимальным управлением йт. в задаче (19), г = 1,..., К — 1. Гарантированные значения Г{ — rTi(y, и) критерия качества образуют невозрастающую последовательность:

го > П ^ ... ^ гК.

Здесь имеют место строгие неравенства Т{ > Гг+1 тогда и только тогда, когда реализуется не самый худший сигнал из множества У(т{+1, ц, у, и).

В пункте 2.5 приведены примеры. Во втором примере рассмотрен частный случай простейшего варианта процесса выставки. Здесь в двумерном случае построено точное решение задачи коррекции (ИМ строятся без аппроксимации), приводящее к одному моменту коррекции в середине процесса. Для сравнения дано решение с коррекцией управления на каждой секунде. В последующих пунктах главы рассматриваются

нелинейные многошаговые системы. В пункте 2.6 методами динамического программирования дано решение задачи оценивания для систем вида

xt = ft(xt-i,ut,vt), yt = 9t(xt-i,ut) + wt, teT = {l,...N}, (20)

где xt E Rn — фазовый вектор, yt G Rm — наблюдаемый вектор, vtw wt — помехи, щ — управление. Предполагается, что управляемая система обратима по времени. Начальное состояние и помехи стеснены суммарными ограничениями. Установлено, что информационное множество имеет вид Xt{y, и) = {х | Wt(x, у1, и1) ^ 1}, где Wt{x, уг, и*) — соответствующая функция Беллмана. В пункте 2.7 введены множества

Vt{x) = {«!,<!) : ^ hiiv^Wi) ^ 1 - WtixrfM)} , (21)

l i=t+1 J

где hi — замкнутые функции, определяющие ограничения на помехи, и множества Уц(х) = {г^,: (v^w^) G Vt(x)} , служащие про-

екциями множеств (21). Функции hi, в частности, могут быть индикаторными, что соответствует случаю геометрических ограничений. По введенным множествам определяем минимакс терминального функционала

rt(y,u) — min max max ф(х^). (22)

xeXt{y,u) v?+1€Vu(x)

Данная функция определена для всех моментов t = 0,..., N. В пункте

2.8 определены множество продолжений сигнала Ут^(у*,ит) = {у\+1 : х в Xt(y,u), {vf+1,wj*+1) G Vt(x)}, где 0 < t < т ^ N, и наихудший прогноз гарантированного результата управления (22) по формуле п(т,у\ит) = max гт(у,и). Здесь rt{t,y\uT) = rt(y,u). При

yl+leYr,t{y\uT)

геометрических ограничениях с компактными множествами можем записать функцию (22) по методу Беллмана. Действительно, определим рекуррентно функции Беллмана на компактных множествах:

SN(X) = тахф(х), S^X) = тшЗД(Х, и, Щ,

хех ueUi

где fi(X,u,V) = U{fi{x,u,v) : х G X, v G V}. Тогда функция rt(y,u) = St(Xt(y,u)). После введения величины r*(t,y,u) = min г^т,уь,иТ), мо-

t^r^N

жем обратиться к неравенству (18) и рассмотреть описанный выше алгоритм пошаговой многократной коррекции. Основные результаты пункта

2.9 состоят в следующем.

Теорема 2.6. Для любой допустимой тройки {хо,vN,wN} неопределенных элементов в системе (20) алгоритм пошаговой многократной коррекции и алгоритм коррекции с прогнозом на один шаг приводят к

n n

одинаковому сигналу у и управлению и , а также к одинаковым моментам коррекции управления. Здесь считаем, что в обоих случаях при прочих равных условиях управление назначается одинаково.

Теорема 2.7. Для всякой допустимой тройки {хо, vN, wN} в системе (20) алгоритм коррекции теоремы 2.6 однозначно определяет последовательность 0 = то < т\ < 72 < ... < т& < N = Tk+i моментов изменения управления. При этом управление uN, формируемое алгоритмом на отрезке ц + 1,..., Tj+i, совпадает с оптимальным управлением в задаче (22), г = 0,..., к. Гарантированные значения г« = гп(у, и) критерия качества образуют невозрастающую последовательность

го > П > ... > гк ^ гк+1 = rN(y, и).

Здесь имеют место строгие неравенства Г{ > 1, если т^+i — Т{ ^ 2. В случае r^+i — Т{ = 1 строгое неравенство Г{ > Гг+i будет справедливо тогда и только тогда, когда реализуется не самый худший сигнал уп+1.

В пункте 2.10 полученные результаты конкретизируются для линейных систем (20) и квадратичных функций ht{-,-). Полученные здесь формулы способы их получения во многом аналогичны приведенным в 1-ой главе. В пункте 2.11 содержатся примеры.

В третьей главе рассмотрены методы решения задач коррекции для квазилинейных непрерывных систем с дискретными измерениями. Задачи управления и оценивания, в том числе и задачи коррекции движения, для квазилинейных систем изучались в докторской диссертации А. Г. Кремлева [64]. Включение излагаемого ниже материала в настоящую диссертацию прежде всего обусловлено новым способом получения оценок фазового вектора состояния системы. Рассматривается система

х = ef(t, х) + B{t)u + C(t)v, 0 < t < Т, ж(0) = ж0, (23)

где вектор-функция f(t,x) удовлетворяет условиям теоремы существования, единственности и продолжимости решения типа (3). Если правая часть уравнения содержит линейные слагаемые A(t)x, то оно сводится к виду (23) с помощью невырожденного преобразования координат. Здесь г — малый параметр. Уравнения измерения имеют вид (16). Предполагается, что возмущения стеснены совместными квадратичными интегральными и суммарными ограничениями. Предполагается, что любое

решение системы (23) не выходит на отрезке [О, Т] за пределы некоторой ограниченной области V. Размеры области Т> и величина константы в (3) согласованы. Показано, что если ввести обобщенную матричную функцию #(£) = ]Г) — где 6(£) — функция Дирака, то дискретные к= 1

наблюдения эквивалентны непрерывным наблюдениям с матрицей и непрерывными возмущениями ъи^) при наличии ограничений (12). В пункте 3.1 записано уравнение Беллмана (11), имеющее здесь вид

(24)

ъ

У(^) = |Ы1р0 + / (-(1/4КСН-1С'Ух-(е/(з,х)+Ви)'Ух+

о

+ V = (1/2)Н~1С'Ух.

Здесь V — оптимальный элемент в задаче на минимум. Предполагается, что при всех достаточно малых £ уравнение (24) имеет единственное решение х), гладкое в областях (^,^+1) х г = 0,..., ./V, кусочно непрерывное по £ и такое, что его градиент Ух(Ь,х) удовлетворяет условиям типа (3). При сделанном предположении имеем Х(Ь,у,и) = {х : У(Ь,х) ^ 1}. Уравнение (24) разрешается с помощью ряда

оо

= (25)

з=о

приравниванием коэффициентов при одинаковых степенях е. Для нуле-

ь

вого приближения получим уравнение У°(Ь,х) = ||ж||2Р +/ ( — и'В'Ух —

0 о

(1/4)Уж0'СН~1С'УХ + ||у - Сх\\Ъ)(1з; V0 = (1/2)Н~1С'У°. Здесь V0 - нулевое приближение к оптимальному элементу V. Решение этого уравнения имеет вид = \\х — х\\2Р + /г, где параметры удовлетворяют системе дифференциальных уравнений, как в 1-ой главе. Система имеет единственное решение, зависящее только от дискретных измерений у к, матриц йк и управления и(-). Для коэффициентов при более высоких степенях е получаем уравнения + /'(£,#) + и'В'УЦ. + (1/4)Е$=о У1СН-1С'У*-з = 0; г > 1, У1{0, ж) = 0. Эти уравнения имеют первый порядок по частным производным и линейны относительно неизвестной функции Уг(1;,х). Они также не содержат никаких обобщённых функций. Данные факты позволяет использовать мег

тод характеристик для их интегрирования. Положим ]¥г = ^ е3Уэ,

з=о

V1 = (1/2)Н~1С'*\¥1. Эти функции служат г-ым приближением соответственно к и г>(£, х). Предположим также, что при всех достаточно малых е > 0 система уравнений имеет единственное решение Уг(£, ж), % — 1,2,..., градиент х) которого удовлетворяет условиям типа (3). Последнее предположение оправдывает разложение (25), что даёт возможность построить приближённые решения в пункте 3.2.

Теорема 3.2. Существуют константы с®, не зависящие от е и такие, что выполняются включения Х(Ь,у,и) С {х : У°{Ь,х) — £с%(1 + 1М12) < 1}, {ж : х) + £с?(1 + 1М12) < 1} С У, и).

Для получения аппроксимаций более высокого порядка вводится вспомогательный критерий </?(£, ж, г>), минимум которого на решениях уравнения (23) равен функции ТУг(£,а;), а минимизирующим элементом является функция г;г(£, х). Для оптимальных значений исходного и вспомогательного функционалов выполняются некоторые неравенства с константами е1+1. Следовательно, справедлива

Теорема 3.3. Существуют константы сгъ с\-, не зависящие от £ и такие, что выполняются включения Х(1,у,и) С {х : ]¥г(1;,х) — £г+1сг2(1 + И2) < 1}, {х : +£тс*(1 + ||ж||2) < 1} С Х$,у,и).

В пункте 3.3 рассматривается минимаксное управление по неполным данным, а именно, решается задача (15) для £ = к = 1,..., N при ограничениях и(Ь) £ и. Решение задачи (15) строится на основе итерационной процедуры, заимствованной из работ А.Г. Кремлева [62-64]. На начальном этапе рассматривается задача для системы нулевого приближения (23) при е — 0. Записано минимаксное значение гк(у,и) функционала для линейного приближения. Затем находятся выражения для итерационных значений ггк(у,и). В условиях регулярности и при некоторых дополнительных предположениях о локальной сильной выпуклости ИМ Хк в точке х\ и множества II в точке и°(Ь) в [63,64] доказана сходимость критериев ггк(у,и) —> гк(у,и) и управлений и%{£) —> й(£ | почти всюду, где | — какое-то оптимальное управление при ненулевом е. Указанная сходимость выполняется равномерно по малому параметру 0 < £ ^ £о- В пункте 3.4 приводятся основные построения для решения задачи многократной коррекции. Основные выводы аналогичны полученным в предыдущих главах. Здесь так же, как и в главе 2, определяются множество У^{у,и) всех возможных продолжений сигнала ук и величина прогноза Гк(1,у,и). Для подсчета этих величин использован следующий факт. Для любого ¡1 > 0 существует со > 0 такое, что любое допустимое продолжение для системы нулевого приближения, получае-

мое по формулам yi = Gix(U) + gi, где

i ^ x{U)= Y^ p~1(tj)G'jRj9j+ / Buds + x{tk), i=k+1 l

^ 1 - h(tk) - /I,

одновременно является допустимым продолжением и для исходной нелинейной системы, у которой 0 < е ^ во. Параметры в (26) находятся из решения импульсных систем х = P~1G'R(y — Gx) + Ви, х(0) = 0; h = \\у — Gx\\\; /г(0) = 0. В пункте 3.5 приведен иллюстрирующий пример, в котором функция V(t, х) вычисляется явным образом.

В четвертой главе диссертации изучаются задачи выставки инерци-альных систем и влияние коммуникационных ограничений на параметры коррекции движения. В пункте 4.1 рассматривается задача математического согласования систем координат двухступенчатой транспортной системы, состоящей из корабля и стартующего с него самолета. Данная задача рассматривалась в [31,34,72] чисто статистическими методами.В то же время в [29,31] отмечается, что статистика возмущений, действующих в инерциальных системах навигации, часто бывает неполной или вообще отсутствует. Поэтому многие вопросы естественно изучать в минимаксной постановке. Упомянутая задача исследуется здесь в детерминированной постановке. На корабле расположена гироплатформа, оси которой образуют базовую систему (правую) координат (БСК), cl h£l cct~ молете имеется другая гироплатформа с осями, образующими зависимую систему (правую) координат (ЗСК). Перед стартом самолета надо совместить оси ЗСК с соответствующими осями БСК, или же оценить углы отклонения и их дрейфы (проекции вектора относительной угловой скорости) с тем, чтобы учесть эти углы при дальнейшем автономном функционировании навигационной системы самолета. Ориентация ЗСК относительно БСК задается тремя углами Крылова, как это обычно принято в морской навигации. Пусть оси ЗСК обозначаются 1,2,3, а оси БСК — соответственно li,2i,3i. Можно считать, что эти системы имеют общее начало, совпадающее с центром масс транспортной системы корабль-самолет. Совмещение ЗСК с БСК производится путем последовательных поворотов по часовой стрелке. Считается, что БСК 1-ой ступени выставлена правильно, т.е. ось 2\ направлена по местной вертикали, ось 3i имеет направление по меридиану на север, а ось Ii — по параллели на запад. При перемещении корабля по поверхности земли

Е

j=k+1

ы\ъ

указанное направление осей сохраняется. Вдоль каждой из осей ЗСК и БСК установлены акселерометры. В работе приведена нелинейная система дифференциальных уравнений относительно шести переменных 9\ ег с нелинейными уравнениями измерения. Здесь вг — углы отклонения ЗСК и БСК, ег — проекции вектора неопределённого дрейфа, возникающего из-за неточности аппаратуры. Если принять, что в результате грубой выставки, предшествующей, как правило, этапу точной выставки, углы вг лежат в пределах нескольких градусов, то нелинейную систему для углов вг можно заменить линейным приближением. Для измерения используется разность показаний акселерометров в ЗСК и БСК. Пусть а1 — показания акселерометров в ЗСК и а\ — выходы акселерометров в БСК. Тогда имеем

аг = тиа\ + т2{а\ + т^аХ + и)\ уг = а1 — а\, г = 1,2,3. (27)

где и? — неопределённые уходы нуля акселерометров, тц — элементы ортогональной матрицы направляющих косинусов ЗСК относительно БСК. Помехи Vг в уравнениях для дрейфов и помехи тг стеснены интегральными ограничениями. В пункте 4.2 приведены уравнения для простейшей модели процесса выставки. В этом случае движение происходит по экватору, и во все время этого движения имеем в1 — в2 = 0. Тогда отклонение осей ЗСК от БСК описывается одним углом в = В качестве уравнения измерения берется выход 1-го акселерометра. В пункте 4.3 приведены результаты численного моделирования минимаксных алгоритмов. Предполагается, что корабль совершает определенный, достаточно информативный маневр. Если он стоит на месте, то оценивание происходит хуже, т.к. выпадает вторая компонента вектора измерений в (27). Для простейшей модели это несущественно. Расчеты проводились как для двумерной линеаризованной модели, так и для 6-ти мерной линейной модели с 3-х мерным вектором измерений. Для двумерной модели начальное нулевое управление корректируется два раза в конце процесса. Отметим, что такое же значение минимаксного функционала получается, если корректировать управление на каждом шаге. Коррекция первоначального нулевого управления для 6-ти мерного случая также происходит 2 раза в конце процесса: на 193-ем и 199-ом шаге из 200-от. Последнее значение функционала 77 при данных значениях помех равно 34.6197 град., в то время как реальное значение Ц^Ц = 5.1920 град., что находится в пределах гарантированного результата. На примере показано, что количество коррекций управления может зависеть от выбора

минимаксных управлений, решающих задачу типа (19), хотя значение финального функционала при этом не меняется.

Пункт 4.4 посвящен задаче коррекции при коммуникационных ограничениях. За последнее время возрос интерес к задачам оценивания и управления при коммуникационных ограничениях, что является следствием развития распределённых сетей управления с единым центром обработки информации, возможно находящимся на значительном удалении от объектов наблюдения и управления. Поэтому ограничение мощности канала передачи данных должно приниматься во внимание. Подобные задачи могут возникнуть при исследовании различных режимов поведения удалённых летательных объектов, при корректировке их движения, в частности, при управлении процессом выставки навигационных приборов в момент старта одного летательного аппарата с другого. Упомянем работу [113], посвящённую оцениванию, где можно найти дальнейшие ссылки. Предполагается, что на объекте имеется вычислительный комплекс, позволяющий запоминать измеряемую информацию, обрабатывать её с высокой степенью точности, передавать и принимать закодированные сигналы по каналам связи. Сигналы в центр управления и обработки информации (ЦУиОИ) поступают в дискретные моменты времени словами ограниченной длины, состоящими из целых чисел. Для простоты канал связи предполагается бесшумным и не имеющим запаздывания. Кодирующее устройство в канале связи используется для передачи информации о параметрах ИМ объекта в ЦУиОИ и управляющего воздействия из ЦУиОИ на объект. В ЦУиОИ информация о параметрах ИМ декодируется и используется для расчета моментов коррекции и оптимального управления.

В подпункте 4.1.1 изучается влияние ограничений на оценивание. Задача оценивания рассматривается в постановке пунктов 1.1, 1.2. Из результатов этих пунктов следует, что для построения ИМ X*(t) в ЦУиОИ следует передать параметр h(t) и вектор х(t). Все остальные параметры, в том числе матрицы Р(£), в ЦУиОИ известны. Однако удобнее передать величины <p(t) = Х(Т, t)x{t) и = (1 - ВД)1/2, где Х(Т, t) -фундаментальная матрица однородной системы (13). Пусть имеют место оценки

*)lloo < a, WmC'm^ < с, \\G\t)R(t)G(t)\\oo < д\ , HP-^lloo^d, ||P(i)||oo ^ dx Vi е [0,Т], 1 ;

где || • ||оо — sup-норма в Rn, и пусть А — шаг разбиения отрезка [О, Г].

Теорема 4.1. Для всякого числа е > 0 найдём параметры N, q и а из условий n^^dgaA1^2/{q — 1) < er, q > 1, а = e + r^^dgaÄ1/2, где А = T/N. Тогда a/q ^ er, выполняются неравенства ||<у2(&Д) — ^||оо ^ е, к = 0,..., iV, и <^(А;Д) - z(kA-) е Ва для всех /с = 0,..., N.

Здесь Ва — {х : ||:е||оо ^ а} - шар с центром в нуле радиуса а в sup-норме. Этот шар Ва разбивается на qn подшаров вида х • • • х где индексы ji независимо пробегают множество {1,... ,д}. Вектор х е Ва кодируется последовательностью г](х) = (ji,..., jn), если х € /¿Х...Х . Наоборот, каждому набору (ji,..., jn) натуральных чисел, независимо пробегающих множество {1,... ,q}, ставится в соответствие вектор 7(ji,..., jn) — геометрический центр множества х • • • х Цп. На полуинтервале [(/г — 1)А, к А), к > 0, решаем уравнение z = X(T,t)B(t)u с начальным условием z((k — 1)Д) = Фк-i- В момент кА кодирование-декодирование задаётся формулами

Оъ • • •, jn) = r)(v(kA) - z(kA-)), если ср(кА) - z(kA-) е Ва\

4>к = l(jii ■ ■ • ,jn) + z(kA-),

где z(kA~) - предел слева соответствующей функции в точке кА.

Аналогично, при выборе параметра q из условия 1 /(2q) < £ выполняются неравенства | ф(кА) — фк |< е, к = 0,..., N, каково бы ни было число А. Здесь отрезок [0,1] делим на q частей Ij. В момент к А определим кодирование-декодирование как j = r](ip(kA)), фк = 7(j). Здесь rj(x) = ji, если х Е Ij. Величина 7(j) = (2j — 1)/(2q) совпадает с центром множества Ij при j > 0.

Полученные результаты позволяют оценить точность г декодируемых величин в зависимости от длины передаваемого слова (определяется параметром q) и частоты передачи (определяется параметром N). Так, например, при р — 1 < log2 q < р требуется р бит информации о величине ф за один такт передачи. Будем решать задачу коррекции по декодированным наблюдаемым данным Трк и фк, удовлетворяющим приведенным неравенствам. Подставим эти данные в формулы вместо ср(кА) и ф(кА) соответственно. Новые значения формул при t = к А обозначим через гк(и) и гк(0, и) соответственно.

Теорема 4.3. Пусть выполнены оценки (28), условия теоремы 4.1, а также 1/(2q) < е. Тогда для всех к = 0,... ,iV будем иметь | гк{и) —

г* (кА, и) |< e(nl/2\\D\\+n(kA))-, \ fk($,u) - г*(кА,в,и) |< e(nll2\\D\\

Указанные неравенства выполняются равномерно

для всех сигналов с условием h{T) < 1.

В силу неравенства | mmg—minf |< max | g—f | в качестве следствия

из теоремы 4.3 получаем соотношение | г*(/сА, и) — пппбфдд^] гк(0, и) |< г {nl/2\\D\\ + (7г2(А;А) + тах^фдд^ тг2(0))1//2) . Это соотношение и неравенства теоремы 4.3 показывают, насколько могут отличаться параметры коррекции движения на объекте (реальные значения) и величины (оценки) этих параметров в ЦУпОИ, если оптимальное управление под-считывается на объекте.

В подпункте 4.4.2 исследуется задача управления. Пусть t\ = к\А

- момент времени, когда выполняется равенство fkl(u) — min fkl(9, и).

ti

В этот момент на объект передаётся сигнал о корректировке управления. Если вычислитель на объекте позволяет решать программную задачу управления (15), то функция ЦУиОИ завершена. Если же не позволяет, то управление должно вычисляться в ЦУиОИ и передаваться на объект. Предполагается, что управление постоянно на полуинтервалах [(к — 1)Д, к А), к = 1,..., N. Для кодирования-декодирования управления применяется тот же прием, что и выше.

Теорема 4.4 Пусть выполнены условия теорем 4.1, 4.3 и справедливо неравенство b/q ^ е, где ||«|| < Ъ = (<5Д)~1//2, H(t) > 51р. Тогда критерии управления на объекте и в ЦУпОИ при использовании кусочно-постоянного управления связаны неравенством

| г*{к,и)-г*{к,и) г (П1/2||£>|| (amaxllß^llooCT - кА) + l) +

+тг(/еД)).

Поскольку величины (р и ф на объекте известны, после передачи и раскодирования оптимального управления значение критерия на объекте будет равно г*(к:и). С другой стороны, символ г* (к, и) означает минимаксное значение функционала в ЦУпОИ при использовании кусочно-постоянного управления и переданных величин !рк, фк. Приведены формулы для указанных значений функционала.

Теорема 4.4 показывает, насколько могут отличаться значение критерия управления на объекте (реальное значение) и величина (оценка) критерия с точки зрения ЦУпОИ, если там вычисляется кусочно-постоянное управление и передаётся на объект. Разность значений возникает вследствие кодирования и передачи данных. Здесь следует иметь в виду, что при ошибках в канале связи и запаздывании информации различие зна-

чений может возрасти. В пункте 4.5 содержится иллюстрирующий пример.

В заключении приведены основные результаты диссертации, вынесенные на защиту.

Основные положения, выносимые на защиту.

Следующие результаты составляют основу личного вклада диссертанта в работы, выполненные в соавторстве:

- вывод формул для оценивания непрерывных линейных систем с совместными квадратичными интегральными ограничениями и вырожденной матрицей Р0;

- разработка алгоритмов многократной коррекции и установление их свойств для многошаговых нелинейных систем;

- разработка методов оценивания для непрерывных квазилинейных систем при дискретных измерениях;

- приложение изложенных методов коррекции движения к задаче выставки инерциальных систем;

- исследование влияния информационных ограничений на параметры коррекции движения.

Методы исследования. В работе использованы методы теории управления и оценивания для механических систем в условиях неопределенности, методы динамического программирования, функционального анализа, выпуклого и нелинейного анализа, теории экстремальных задач.

Практическая значимость результатов. Диссертация носит в основном теоретический характер. Рассмотренные примеры и приложение к задаче выставки имеют иллюстративный смысл. При определенной доработке и уточнении исходных данных алгоритмы могут представить интерес для специалистов в области навигации и управления движущимися объектами. Кроме того, полученные результаты могут быть использованы в учебном процессе при чтении спецкурсов для студентов и аспирантов.

Апробация работы. Основные результаты диссертации опубликованы в работах [13-22], [41,42] и докладывались на областной научно-практической конференции "Информационно - математические технологии в экономике, технике и образовании" (Екатеринбург: ГОУ ВПО

УГТУ-УПИ, 2005 г.), на 36-й и 38-й региональных молодежных конференциях (Екатеринбург, 2005, 2007 гг.), на IX всероссийском съезде по теоретической и прикладной механике (Нижний Новгород, 2006 г.), на международной конференции "Динамические системы: устойчивость, управление, оптимизация" (БЭЗСО 08) (Минск, Беларусь, 2008 г.), на IV международной конференции "Математика, ее приложения и математическое образование" (МПМО"11) (Улан-Удэ, 2011 г.), а также на семинарах кафедры "Прикладная математика" института УралЭНИН Уральского федерального университета.

Похожие диссертационные работы по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК

Заключение диссертации по теме «Дифференциальные уравнения», Гредасова, Надежда Викторовна

Заключение

В настоящей диссертации разработаны методы коррекции движения управляемых систем, описываемых обыкновенными дифференциальными или многошаговыми уравнениями в условиях неполной информации о фазовом векторе. Предложены алгоритмы коррекции, установлены их свойства. При разработке методов коррекции использованы теории управления и оценивания для механических систем в условиях неопределенности, методы динамического программирования, функционального анализа, выпуклого и нелинейного анализа, теории экстремальных задач. По ходу решения основных задач получены новые результаты по оцениванию для непрерывных квазилинейных и многошаговых нелинейных систем.

Рассмотрено приложение методов коррекции движения управляемых систем с неполной информацией к задаче выставки двухступенчатой транспортной системы. Рассмотрена общая нелинейная система уравнений и её линейная аппроксимация при малых отклонениях углов. Проведено моделирование процесса выставки для случая простейшей модели. Экспериментально показано, что в линеаризованной модели оптимальное значение минимаксного функционала качества достигается при малом числе коррекций (2 раза) управления. Исследовано влияние информационных ограничений на параметры коррекции движения. Эти ограничения могут возникнуть вследствие того, что сигналы в центр управления и обработки информации, возможно находящийся на значительном удалении от объектов наблюдения и управления, поступают в дискретные моменты времени словами ограниченной длины, состоящими из целых чисел.

К основным результатам, полученным в диссертации, относятся следующие:

1. Вывод формул для оценивания непрерывных линейных систем с совместными квадратичными интегральными ограничениями и вырожденной матрицей Ро

2. Разработка алгоритмов многократной коррекции и установление их свойств для многошаговых нелинейных систем.

3. Разработка методов оценивания для непрерывных квазилинейных систем при дискретных измерениях.

Список литературы диссертационного исследования кандидат физико-математических наук Гредасова, Надежда Викторовна, 2012 год

Литература

[1] Адыйуллина Е.С., Ананьев Б.И. Линейное оценивание статистически неопределённых систем // Тр. ин-та матем. и мех. УрО РАН. Т. 11. № 1. 2005. С. 3-16.

[2] Алберт А. Регрессия, псевдоинверсия и рекуррентное оценивание. М.: Наука, 1977.

[3] Александров В.В., Болтянский В.Г., Лемак С. С. и др. Оптимальное управление движением. М.: Физматлит, 2005.

[4] Алексеев В.М., Тихомиров В.М., Фомин С. В. Оптимальное управление. М.: Наука, 1979.

[5] Ананьев Б.И., Куржанский А.Б., Шелементьев Г.С. Минимаксный синтез в задачах наведения и коррекции движения // Прикл. матем. и мех. 1976. Т. 40, вып. 1. С. 3-13.

[6] Ананьев Б.И. Минимаксная квадратичная задача коррекции движения // Прикл. матем. и мех. 1977. Т. 41, вып. 3. С. 436-445.

[7] Ананьев Б.И. О коррекции движения при стохастически неопределенных возмущениях // Сборник "Эволюционные системы в задачах оценивания", ред. A.B. Куржанский и Т.Ф. Филиппова. Свердловск, Издательство УНЦ: 1985, с. 3 - 14.

[8] Ананьев Б.И. Минимаксная линейная фильтрация многошаговых процессов с неопределенными распределениями возмущений // Автоматика и телемеханика. 1993. № 10. С. 131-139.

[9] Ананьев Б.И. Многократная коррекция движения статистически неопределённых систем // Труды междунар. конф. "Проблемы управления и приложения". Минск, 16-20 мая 2005 г. Т. 1. Минск: Изд-во Ин-та математики HAH Беларуси. 2005. С. 97-102.

[10] Ананьев Б. И. Коррекция движения статистически неопределенной системы при коммуникационных ограничениях // Тр. ин-та матем. и мех. УрО РАН. 2009. Т. 15, № 4. С. 20-31.

[11] Ананьев Б. И. Оценивание случайных информационных множеств многошаговых систем // Изв. РАН. Теория и системы управления. 2009. № 4. С. 35-41.

[12] Ананьев Б. И. О коррекции движения при коммуникационных ограничениях // Автоматика и телемеханика. № 3, 2010. С. 3-15.

[13] Ананьев Б.И., Гредасова И.В. Многократная коррекция движения линейно-квадратичной управляемой системы // Вестник УГТУ-УПИ. 2005. № 4(56). С. 280-288.

[14] Ананьев Б.И., Гредасова Н.В. Коррекция решения многошаговой системы в условиях неопределённости // Тезисы докладов конференции "Информационно-математические технологии в экономике, технике и образовании", Екатеринбург, 11-12 ноября 2005 г. Екатеринбург: Изд-во УГТУ-УПИ. 2005. С. 5.

[15] Ананьев Б.И., Гредасова Н.В. Коррекция решения многошаговой системы в условиях неопределённости // Информационно - математические технологии в экономике, технике и образовании: сб. материалов областной научно-практической конференции. Екатеринбург: ГОУ ВПО УГТУ-УПИ, 2006. Ч. 1. С.3-11.

[16] Ананьев Б.И., Гредасова Н.В. Методы коррекции движения в задачах навигации. IX Всероссийский съезд по теоретической и прикладной механике. Нижний Новгород. 22-28 августа 2006 г. Аннотации докладов. Изд-во Нижегородского государственного ун-та, 2006. Т. 1. С. 13.

[17] Ананьев Б.И., Гредасова Н.В. Многократная коррекция квазилинейных систем при дискретных наблюдениях // Тр. ин-та матем. и мех. УрО РАН. 2007. Т. 13. № 4. С. 3-13.

[18] Ананьев Б.И., Гредасова Н.В. Задача многократной коррекции при геометрических ограничениях на возмущения // Дифференциальные уравнения и процессы управления. Электронный журнал, № 1, 2007. С.63-73. http://www.neva.ru/journal.

[19] Ананьев Б.И., Гредасова Н.В. Задачи коррекции движения при коммуникационных ограничениях // Международная конференция "Динамические системы: устойчивость, управление, оптимизация" (DSSCO 08). Минск, 29 сентября - 4 октября 2008 г. Тезисы докладов. Институт математики HAH Беларуси, 2008. С. 54-55.

[20] Ананьев Б.И., Гредасова Н.В. Задача выставки инерциальных систем и процедура коррекции движения // Вестник Бурятского государственного университета. Математика и информатика. № 9, 2011. Улан-Удэ:Изд-во Бурятского университета. С. 203-208.

[21] Ананьев Б.И., Гредасова Н.В. Использование моментов остановки в задачах коррекции движения // Материалы IV международной конференции "Математика, ее приложения и математическое образование", МПМО"11, 27 июня - 1 июля 2011 г. Часть 2. Улан-Удэ: Изд-во ВСГТУ. С. 5-9.

[22] Ананьев Б.И., Гредасова Н.В. Использование моментов остановки в задачах коррекции движения // Аннотации докладов IV международной конференции "Математика, ее приложения и математическое образование", МПМО"11, 27 июня - 1 июля 2011 г. Улан-Удэ: Изд-во ВСГТУ. С. 7.

[23] Андреев Ю.Н. Управление конечномерными линейными объектами. М.: Наука, 1976.

[24] Арнольд В.И. Обыкновенные дифференциальные уравнения. Ижевск: Ижевская республиканская типография, 2000.

[25] Арутюнов A.B. Условия экстремума. Анормальные и вырожденные задачи. М.: Факториал, 1997.

[26] Афанасьев В.Н., Колмановский В.Б., Носов В.Р. Математическая теория конструирования систем управления. М.: Высшая школа, 2003.

[27] Баклицкий В.К., Бочкарев A.M., Мусьяков М.П. Методы фильтрации сигналов в корреляционно-экстремальных системах навигации. М.: Радио и связь, 1986.

[28] Бахвалов Н.С. Численные методы, Т.1. М.: Наука, 1973.

[29] Бахшиян Б.Ц., Назиров P.P., Эльясберг П.Е. Определение и коррекция движения. М.: Наука, 1980.

[30] Беллман Р. Динамическое программирование. М.: ИЛ, 1960.

[31] Богуславский И.А. Прикладные задачи фильтрации и управления. М.: Наука, 1983.

[32] Болтянский В.Г. Оптимальное управление дискретными системами. М.: Наука, 1973.

[33] Брайсон А., Хо Ю-Ши Прикладная теория оптимального управления. М.: Мир, 1972.

[34] Бромберг П.В. Теория инерциальных систем навигации. М.: Наука, 1979.

[35] Варавва В.Г., Голован A.A., Парусников H.A. О стохастической мере оцениваемости // Коррекция в навигационных системах и системах ориентации. М.: Изд-во МГУ, 1987.

[36] Васильев Ф.П. Численные методы решения экстремальных задач. М.: Наука, 1980.

[37] Васильев Ф.П. Методы решения экстремальных задач. М.: Наука, 1981.

[38] Воеводин В.В., Воеводин Вл.В. Параллельные вычисления. СПб.: БХВ-Петербург, 2002.

[39] Габасов Р., Кириллова Ф.М. Качественная теория оптимальных процессов. М.: Наука, 1971.

[40] Гантмахер Ф.Р. Теория матриц. М.: Наука, 1966.

[41] Гредасова П.В. Примеры решения задач многократной коррекции движения // Проблемы теоретической и прикладной математики. Труды 36-ой Региональной молодёжной конференции. НИСО УрО РАН. Екатеринбург. 2005. С. 258-262.

[42] Гредасова П.В. Многократная коррекция квазилинейной системы по дискретным наблюдениям // Проблемы теоретической и прикладной математики. Труды 38-ой Региональной молодёжной конференции. НИСО УрО РАН. Екатеринбург. 2007. С. 286-290.

[43] Демьянов В.Ф., Васильев Л.В. Недифференцируемая оптимизация. М.: Наука, 1981.

[44] Демьянов В. Ф. Условия экстремума и вариационное исчисление. М.: Высш. школа, 2005.

[45] Дигайлова И.А. Задача фильтрации со смешанной неопределенностью // Изв. РАН. Теория и системы управления. 2001. № 5. С. 16-24.

[46] Дмитриев В.И. Прикладная теория информации. М.: Высшая школа, 1989.

[47] Дончев А. Системы оптимального управления: возмущения, приближения и анализ чувствительности. М.: Мир, 1987.

[48] Дьяконов В.П. MATLAB 6/6.1/6.5 + Simulink 4/5. Основы применения. М.: СОЛОН-Пресс, 2004.

[49] Егоров А.И. Основы теории управления. М.: Физматлит, 2004.

[50] Жолен Л., Кифер М., Дидри О., Вальтер Э. Прикладной интервальный анализ. М. - Ижевск: Институт компьютерных исследований, 2005.

[51] Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука, 1974.

[52] Калман P.E., Бьюси P.C. Новые результаты в линейной фильтрации и теории предсказания // Техническая механика (сб. переводов). Сер. Д. 1961. № 1. С. 123-136.

[53] Квакернаак X., Сиван Р. Линейные оптимальные системы управления. М.: Мир, 1977.

[54] Кетков Ю.Л., Кетков А.Ю. MATLAB 6.x.: программирование численных методов // Санкт-Петербург: БХВ-Петербург, 2004.

[55] Климов Д.М. Инерциальная навигация на море. М.: Наука, 1984.

[56] Костоусова Е.К. О полиэдральном оценивании областей достижимости линейных многошаговых систем // Автоматика и телемеханика. 1997. № 3. С. 57-68.

[57] Красовский H.H. К теории управляемости и наблюдаемости линейных динамических систем // Прикл. математика и механика. 1964. Т. 28, вып. 1. С. 3-14.

[58 [59

[60

[61

[62

[63

[64

[65

[66

[67 [68

Красовский H.H. Теория управления движением. М.: Наука, 1968.

Красовский H.H. Игровая задача о коррекции движения // Прикл. матем. и мех. 1969. Т. 33, вып. 3. С. 386-396.

Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.

Красовский A.A., Белоглазое H.H., Чигин Г.П. Теория корреляционно - экстремальных навигационных систем. М.: Наука, 1979.

Кремлев А.Г. Об управлении квазилинейной системой при неопределенных начальных условиях // Дифференц. уравнения. 1980. Т. 16, № И. С. 1967-1979.

Кремлев А.Г. Задача коррекции движения квазилинейной системы при квадратичных ограничениях // Дифф. уравнения. 1984. Т. 20. № 8. С. 1348-1359.

Кремлев А.Г. Асимптотические методы оптимального управления сингулярно возмущенными и квазилинейными системами // Диссертация на соискание ученой степени доктора физико-математических наук. Екатеринбург. 1997.

Кузнецов Д.Ф. Численное моделирование стохастических дифференциальных уравнений и стохастических интегралов. СПб: Наука, 1999.

Куржанский A.B., Пищу липа И. Я. Минимаксная фильтрация при квадратичных ограничениях. I-Ш.- Дифф.уравнения. 1976. Т.12. № 8, с. 1434-1446; № 9, с.1568-1579; № 12, с.2149-2158.

Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.

Куржанский А.Б. О синтезе управлений по результатам измерений // Прикл. математ. и механика, 2004, Т.68. Вып.4. С. 547-563.

[69] Куржанский А. Б. Принцип сравнения для уравнений типа Гамильтона - Якоби в теории управления. // Труды Института математики и механики УрО РАН. 2006. Т. 12. № 1. С. 173-183.

[70] Лазарев Ю. Моделирование процессов и систем в MATLAB. СПб.: Питер, 2005.

[71] Липцер Р.Ш., Ширяев А.Н. Статистика случайных процессов. М.: Наука, 1974.

[72] Липтон А. Выставка инерциальных систем. М.: Наука, 1971.

[73] Матасов А. И. Введение в теорию гарантирующего оценивания. М.: Изд-во МАИ, 1999.

[74] Немыцкий В.В., Степанов В.В. Качественная теория дифференциальных уравнений. М.: ГИТТЛ, 1949.

[75] Овсянников Д. А. Математические методы управления пучками. JL: Наука, 1980.

[76] Панин В.В. Основы теории информации. М.: Бином. Лаборатория знаний, 2007.

[77] Пантелеев A.B., Бортаковский A.C. Теория управления в примерах и задачах. М.: Высш. школа, 2003.

[78] Парусников H.A., Морозов В.М., Борзое В.И. Задача коррекции в инерциальной навигации. М.: Изд-во МГУ, 1982.

[79] Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1969.

[80] Понтрягин Л. С. Обыкновенные дифференциальные уравнения. М. Наука, 1974.

[81] Поршнев C.B. Компьютерное моделирование физических процессов в пакете MATL AB. M.: Горячая линия - Телеком, 2003.

[82] Пытьев Ю.П. Методы математического моделирования измерительно - вычислительных систем. М.: Физматлит, 2002.

[83] Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973.

[84] Степанов B.B. Курс дифференциальных уравнений. М.: Физматгиз, 1958.

[85] Степанов O.A. Применение теории нелинейной фильтрации в задачах обработки навигационной информации. СПб. ГНЦ РФ — ЦНИИ-Электроприбор. 1998.

[86] Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. М.: Наука, 1979.

[87] Треногин В.А. Функциональный анализ. М.: Наука, 1980.

[88] Трикоми Ф. Дифференциальные уравнения. М.: Изд-во иностранной литературы, 1962.

[89] Филиппова Т. Ф. Об одном достаточном условии в задаче управления ансамблем движений // Оценивание динамики управляемых движений. Свердловск: УрО АН СССР, 1988. С. 111-118.

[90] Хант В.Р. и др. Matlab: официальный учеб. курс Кембр. ун-та. М.: Изд-во ТРИУМФ, 2008.

[91] Черноусъко Ф.Л. Об оптимальной коррекции при активных помехах // Прикл. матем. и мех. 1968. Т. 32, вып. 2. С. 203-208.

[92] Черноусъко Ф.Л. Минимаксная задача одноразовой коррекции при погрешностях измерений // Прикл. матем. и мех. 1968. Т. 32, вып. 4. С. 587-595.

[93] Черноусъко Ф.Л., Колмановский В. Б. Оптимальное управление при случайных возмущениях. М.: Наука, 1978.

[94] Шелементъев Г. С. Об оптимальном сочетании управления и наблюдения // Прикл. матем. и мех. 1968. Т. 32, выи. 2. С. 185-193.

[95] Шелементъев Г. С. Об одной задаче коррекции движения // Прикл. матем. и мех. 1969. Т. 33, вып. 2. С. 251-260.

[96] Ширяев В. И. Сигналы, наихудшие для наблюдения в задаче минимаксной фильтрации // Гарантированное оценивание и задачи управления. Свердловск. 1986. С. 127-131.

[97] Экланд И., Темам Р. Выпуклый анализ и вариационные проблемы. М.: Мир, 1979.

[98] Ananiev B.I. On Informational Sets for Multistage Statistically Uncertain Systems // Proc. of the Steklov Institute of Mathematics. 2000. Suppl. 2. Pp. S1-S15.

[99] Bertsecas D.P., Rhodes I.B. Recursive State Estimation for a Set-Memberschip Description of Uncertainty // IEEE Trans, on Auto. Control. 1971. AC-16, no. 2. Pp. 117-128.

[100] Boltyanski V.G., Poznyak A. Robust Maximum Principle in Minimax Control // Int. J. of Control. 1999. Vol. 72, № 4. Pp. 305-314.

[101] Boltyanski V.G., Poznyak A. Linear Multi-model Time Optimization // Optimal Control, Applications and Methods. John Willey h Sons. 2002. Vol. 23. Pp. 141-161.

[102] Clarke F.H. Optimization and Nonsmooth Analysis. Wiley - Interscience Publ., 1983.

[103] Chernousko F.L. State Estimation for Dynamic Systems. Florida: CRC Press, 1994.

[104] Curtain R.F., Pritchard A.J. Infinite Dimensional Linear Systems Theory. Springer-Verlag, 1978.

[105] Gusev M.I. Optimal inputs in guaranteed identification problems // Proceedings of the Steklov Institute of Mathematics. 2005. Suppl. 1. Pp. S95-S106.

[106] Hestenes M.R. Calculus of Variations and Optimal Control Theory. N.Y.: John Willey & Sons, 1966.

[107] Kurzhanski A.B., Filippova T.F. On the theory of trajectory tubes — a mathematical formalism for uncertain dynamics, viability and control // Advances in Nonlinear Dinamics and Control. Boston: Birkhauser, 1993. Pp. 122-188.

[108] Kurzhanski A.B., Valyi I. Ellipsoidal Calculus for Estimation and Control // Boston: Birkhauser, 1996.

[109] Kurzhanski A.B., Varaiya P. Dynamic optimization for reachability problems // J. Optim. Theory and Appl. 2002. Vol. 108. Pp. 227-251.

[110] Kurzhanski A.B., Varaiya P. The Hamilton - Jacobi Equations for Nonlinear Target Control and Their Approximation, // Analysis and Design of Nonlinear Control Systems, (in Honor of Alberto Isidori), Springer-Verlag. 2007. Pp.77-90.

[111] Mordukhovich B.S. Generalized Differential Calculus for Nonsmooth and Set-valued Mappings //J. Math. Anal. Appl. 1994. Vol. 183. Pp. 250-288.

[112] Rockafellar R.T., Wets R.J. Variational Analysis. Berlin: Springer, 1988.

[113] Savkin A. V., Petersen I.R. Set-Valued State Estimation via Limited Capacity Communication Channel // IEEE Trans, on Auto. Control. 2003. AC-48, no. 4. Pp. 676-680.

[114] Schmitendorf W.E. Minimax Control of Systems with Uncertainty in the Initial State and in the State Equations // IEEE Trans, on Auto. Control. 1971. AC-22, no. 3. Pp. 439-443.

[115] Schweppe F.C. Uncertain Dynamic Systems. New York: Prentice Hall, 1973.

[116] Subbotin A.I. Generalized Solutions Of First Order Pdes: The Dynamical Optimization Software. Birkhauser, Boston. 1995.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.