Синтез управления электромеханическими системами , содержащий вложенные функции насыщения тема диссертации и автореферата по ВАК РФ 00.00.00, доктор наук Морозов Юрий Викторович

  • Морозов Юрий Викторович
  • доктор наукдоктор наук
  • 2025, «Московский физико-технический институт (национальный исследовательский университет)»
  • Специальность ВАК РФ00.00.00
  • Количество страниц 245
Морозов Юрий Викторович. Синтез управления электромеханическими системами , содержащий вложенные функции насыщения: дис. доктор наук: 00.00.00 - Другие cпециальности. «Московский физико-технический институт (национальный исследовательский университет)». 2025. 245 с.

Оглавление диссертации доктор наук Морозов Юрий Викторович

Введение

Глава 1. Управление в системах 2-го порядка

1.1 Глобальная стабилизация интегратора 2-го порядка обратной связью в виде вложенных сигмоид

1.1.1 Функция Ляпунова и глобальная устойчивость замкнутой системы при любых параметрах в законе управления, состоящем из 2-х сигмоид

1.1.2 Частные случаи и численное моделирование

1.2 Глобальная стабилизация интегратора второго порядка обратной связью в виде вложенных сатураторов

1.2.1 Функция Ляпунова и глобальная устойчивость замкнутой системы при любых параметрах в законе управления, состоящем из 2-х сатураторов

1.2.2 Численная иллюстрация

1.3 Глобальная стабилизация интегратора второго порядка разрывной обратной связью

1.3.1 Гладкая кривая переключения

1.3.2 Непрерывная кривая переключения

1.3.3 Разрывная кривая переключения

1.3.4 Численная иллюстрация

1.3.5 Квазиоптимальное по времени управление интеграторам второго порядка с фазовыми ограничениями на переменные

1.4 Об оптимальном выборе коэффициентов регулятора на основе вложенных сатураторов в задаче стабилизации в точке для робота-колеса

1.4.1 Математическая модель робота-колеса

1.4.2 Синтез обратной связи с помощью вложенных сатураторов

1.4.3 Введение понятия фазового портрета типа узел для нелинейной системы

1.4.4 Решение задачи поиска максимальной линейной асимптоты для замкнутой нелинейной системы с фазовым портретом типа узел

1.5 Оптимизация выбора коэффициентов регулятора на основе вложенных сатураторов в задаче стабилизации робота-колеса в точке

1.5.1 Введение понятия криволинейной асимптоты для нелинейной системы

с фазовым портретом типа узел

1.5.2 Решение задачи поиска оптимальных коэффициентов для управления в виде вложенных сатураторов с помощью построения нелинейной асимптоты

1.6 Предельный цикл как результат глобальной бифуркации в одном классе симметричных систем с разрывной правой

1.6.1 Локальная устойчивость замкнутой системы с разрывной правой частью с немонотонной функцией переключения

1.6.2 Глобальные бифуркации в двумерной системе с разрывной правой частью и немонотонной функцией переключения

1.6.3 Предельный цикл или скрытый аттрактор?

1.7 Выводы

Глава 2. Управление в системах 3-го порядка с использованием эталонной

системы

2.1 Функция Ляпунова и глобальная стабилизация интегратора третьего с помощью эталонной системы с вложенными сигмоидами

2.1.1 Необходимые и достаточные условия глобальной устойчивости

2.1.2 Алгоритм построения и визуализации областей притяжения нуля в замкнутой системе с гладкой правой частью в трехмерном пространстве

2.2 Функция Ляпунова и глобальная стабилизация интегратора третьего порядка

с помощью эталонной системы с вложенными сатураторами

2.2.1 Необходимые условия глобальной устойчивости

2.2.2 Достаточные условия глобальной устойчивости

2.2.3 Глобальная устойчивость при ограниченном ресурсе управления

2.2.4 Цилиндр как область притяжения нуля в замкнутой системе с вложенными сатураторами

2.2.5 Квазиоптимальное по времени управление интеграторами третьего порядка с фазовыми ограничениями

2.3 Управление интегратором 3-го порядка с помощью обратной связи в виде 3-х

вложенных функций насыщения

2.3.1 Метод построения скрытого колебания для замкнутой системы с тремя

вложенными сатураторами

2.4 Скрытые колебания в задаче управления интегратором 3-го порядка при использовании разрывного и непрерывного управления

2.4.1 Метод построения скрытого колебания в замкнутой системе с двумя вложенными сатураторами

2.4.2 Аналитическое исследование глобальной бифуркации в замкнутой системе с разрывной правой частью и кривой переключения в виде сатуратора

2.5 Методы оценки инвариантных множеств для замкнутой системы, содержащей вложенные сатураторы

2.5.1 Стабилизация цепочки трех интеграторов, с помощью эталонной системы с двумя вложенными сатураторами

2.5.2 Эквивалентная переключаемая аффинная система и ее свойства

2.5.3 Построение эллипсоидальных оценок инвариантных множеств

2.6 Оценка области притяжения с помощью метода обратного интегрирования

2.6.1 Алгоритм оценки области притяжения в многомерном пространстве

2.6.2 Оценка области притяжения в задаче управления маятника Капицы

2.6.3 Оценка области притяжения нуля замкнутой системы, содержащей два вложенных сатуратора

2.7 Выводы

Глава 3. Управление в системах порядка выше 3-го

3.1 Глобальная устойчивость аффинной системы с переключением четвертого порядка

3.1.1 Построение управления интегратором 4-го порядка с помощью эталонной системы 2-го порядка

3.1.2 Определение параметров при, которых аффинная система с переключениями 4-го порядка имеет глобальную устойчивость нуля

3.1.3 Метод аналитического построения области абсолютной устойчивости

3.2 Использование эталонной системы, содержащей 2-ве вложенных сигмоиды для стабилизация обратного маятника на подвижном основании

3.2.1 Безразмерная математическая модель движения обратного маятника на тележке

3.2.2 Построение стабилизирующего управления с помощью двумерной эталонной модели в виде 2-х вложенных сигмоидов

3.2.3 Локальная устойчивость замкнутой системы

3.2.4 Численное моделирование

3.2.5 Задача стабилизации в заданной точке движущегося вдоль прямой колеса с установленным на его оси обратным маятником

3.3 Управление роботом-колесом с помощью маятника

3.3.1 Математическая модель движения робота колеса

3.3.2 Синтез управления с помощью эталонной модели второго порядка, содержащей вложенные сигмоиды

3.3.3 Численное моделирование с управлением, содержащим сатуратор и 2-ва вложенных сигмоида

3.4 Численное интегрирование уравнений качения с использованием виртуального управления, основанного на эталонной системе

3.4.1 Использование эталонной системы с вложенными сигмоидами для синтеза виртуального управления

3.4.2 Качение тяжелого обруча по криволинейному допустимому профилю

3.4.3 Качение колеса по допустимой кривой: задача определения константы Филиппова для метода Рунге-Кутта

3.4.4 Качение колеса по допустимой кривой: задача гармонизации

3.4.5 Качение тяжелого колеса с маятником по допустимой кривой

3.5 Управление упрощенной моделью би-спиннера со смещенным центром масс

3.5.1 Математическая модель биспинера со смещенным центром масс с 3-мя степенями свободы

3.5.2 Использование решения усредненной модели как целевой траектории

3.5.3 Синтез непрерывного ограниченного и разрывного законов управления

3.5.4 Построение области притяжения на плоскости

3.6 Экстренное управление квадрокоптером при отказе двух симметричных винтов

3.6.1 Математическая модель движения биспинера в трехмерном случае

3.6.2 Управление линеаризованной моделью

3.6.3 Управление по скорости для биспинера с помощью сигмоидов

3.6.4 Управление по позиции для биспинера с помощью сигмоида

3.6.5 Численное моделирование полной системы с учетом разряда батареи

3.7 Выводы

Глава 4. Мультиагентные системы

4.1 Управления группой агентов с помощью гладкого закона управления

4.1.1 Модель агента — интегратор второго порядка

4.1.2 Моделирование сил парного взаимодействия между агентами через сигмоиды

4.1.3 Управление формацией

4.1.4 Использование математической модели колесного робота вместо интегратора второго порядка

4.1.5 Моделирования взаимодействия в группе с помощю сигмоиды

4.2 Синтез глобально устойчивого разрывного закона управления формацией . . 212 4.2.1 Синтез глобально устойчивого закона управления формацией, каждый

агент которой описывается уравнением Лагранжа второго рода

4.2.2 Синтез глобально устойчивого квазиоптимального по быстродействию управление формацией, каждый агент которой описывается тройным интегратором с ограниченным возмущением

4.2.3 Синтез глобально устойчивого закона управления формацией, каждый агент которой описывается уравнением Лагранжа второго рода с внутренней динамикой

4.3 Численное моделирование формации, содержащей большое количество агентов, каждый из которых описывается интегратором третьего порядка

4.3.1 Квази-оптимальным по быстродействию закон управления для интегратора 3-го порядка

4.3.2 Результаты численного моделирования для агентов в группе 50, 100 и

500

4.4 Выводы

Заключение

Список литературы

Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Введение диссертации (часть автореферата) на тему «Синтез управления электромеханическими системами , содержащий вложенные функции насыщения»

Введение

Актуальность темы исследования. Повышение эффективности и качества функционирования технических объектов и их систем управления является традиционно актуальной проблемой, однако в последние годы формируются процессы, связанные с усилением требований качества функционирования и экономичности управляемых технических систем. Точность изготовления компонентов электромеханической системы выдвигают новые требования к системам управления как по точности, так и по качеству переходных процессов. Ранее разработанные алгоритмы без учета структуры объекта, характеристик его нелинейных элементов и ограниченности управления становятся менее актуальными, поэтому необходимы новые методы управления такими объектами, учитывающие конкретный вид нелинейности и ее свойства, а также гарантирующие наперед заданные отклонения во время движения по части переменных.

Для разработки метода управления нелинейными системами в современных условиях необходимо сформулировать цель диссертационного исследования, решить основные задачи для достижения цели и проверить положения разрабатываемого метода. В данной работе для апробации рассмотрен ряд нелинейных электромеханических систем.

В академических трудах Isidori A., Khalil H. K., Ройтенберг Я. Н., Samson C., Крищенко A. П., Ткачев С.Б., Brockett R.W. принято учитывать известную нелинейность с помощью метода линеаризации обратной связью, который дает хороший результат до тех пор, пока не возникает ограничение на управление. При этом закон управления в зависимости от реализации ограничений может быть гладким ( Формальский A. M., Черноусько Ф. Л.), непрерывным ( Формальский A. M., Рапопорт Л. Б., Пестерев А. В.) или разрывным (Филиппов А. Ф., Пятницкий E. С., Матюхин В. И.). В случае гладкого или непрерывного закона управления для дальнейшего исследования локальной устойчивости в замкнутой нелинейной системе используют метод погружения нелинейной системы в класс линейно нестационарных систем ( Гайшун И. В.) либо сведение замкнутой нелинейной системы к типу Лурье с последующим использованием известных критериев из теории абсолютной устойчивости (Гелиг А. Х., Леонов Г. А., Пятницкий E. G., Рапопорт Л. Б., Формальский A. M., Якубович В. А., Каменецкий В. А.).

Для исследования нелинейных систем с разрывной правой частью используют вектор-функции Ляпунова, предложенные Беллманом Р. и Матросовым В. М., а решение системы понимается в смысле Филиппова А. Ф. Дальнейшее развитие данный метод получил в работах Маликова А. И., Козлова Р. И., Земляковой А. С. и др.

Почти во всех случаях использования описанных методов гарантируется только локальная асимптотическая устойчивость или устойчивость в большом, но не в целом ( Барбашин Е. А., Красовский Н. Н., Руш. Н).

Для большинства нелинейностей, описанных и выявленных в электромеханических системах (Айзерман М. А., Khalil H. K., Пальтов И. П.), глобальная устойчивость не доказана, хотя на практике у инженеров она не вызывает сомнений, например, Пальтов И. П., Шуткин Л. В., Hoffmann G. M. и д.р.

Основным методом, позволяющим доказать глобальную асимптотическую устойчивость является метод построения функции Ляпунова А. В. (ФЛ), который наибольшее развитие получил в период 50-70 хх. годов ХХ века ( Плисс В. А., Барбашин Е. А., Красовский Н. Н., Ла-Саль Ж., Гайшун И. В., Айзерман М. А., Уокер Д. А., Кларк Л. Г., Фрадков А. Л.). Результаты, полученные в этих работах, до сих пор не потеряли своей актуальности. Однако разработанные общие методы построения ФЛ (7 из которых перечислены в книге Кима Д.

П.) оказались непригодными для сильно-нелинейных систем. Попытки сузить класс систем, для которых сразу можно указать ФЛ привели либо к теоремам ( например, достаточные условия для нелинейных систем 3-го порядка Барбашин Е. А., Гайшун И. В. ), для которых невозможно найти ни одну нелинейную систему, удовлетворяющую условиям из этих теорем, либо к ФЛ для конкретной нелинейной системы. Таким образом, для целого класса нелинейностей результатов получено не было, а с появлением функции Лурье-Постникова ( Лурье А. И. и Постников В. Н.) и критерия Попова В. М., тематика, связанная с использованием нелинейных ФЛ, исчезает из рассмотрения у большинства авторов. Дальнейшее развитие и широкое использование получают только методы, использующие квадратичные ФЛ, которые гарантируют лишь локальную устойчивость для нелинейных систем. Поэтому доказательство глобальной асимптотической устойчивости нелинейных систем, содержащих нелинейности типа функций насыщения, остается открытой задачей. Математическую постановку данной задачи впервые сформулировал Тее1 Л. И,., он же предложил доказательство, основанное на итерационном построении ФЛ специального вида, однако им наложенные ограничения на вид ФЛ являются трудно проверяемыми условиями, что приводит к невозможности практического использования полученных результатов. Поэтому задача поиска ФЛ для нелинейной системы с вложенными функциями насыщения остается актуальной.

В настоящее время известно, что невозможность найти ФЛ для нелинейной системы, гарантирующую глобальную асимптотическую устойчивость положения равновесия, может быть связана с возникновением в этой системе достаточно сложных движений - скрытых колебаний или аттракторов (Леонов Г.А., Кузнецов Н. В.), причем данный тип движения никак не следует из структуры нелинейной системы. В своих работах авторы показали, что разрушение глобальной асимптотической устойчивости может происходить из-за появления периодических движений при изменении одного или нескольких параметров системы, поэтому возникает задача поиска и определения этих состояний в системе.

Наконец, если предположить, что свойством глобальной асимптотической устойчивости обладает замкнутая система при всех значениях параметра из интересующего диапазона, почти всегда возникает задача не допустить перерегулирования в системе КЬаЫ Н. К. Для решения которой необходимо сформулировать задачу поиска оптимальных параметров для данной нелинейной системы, исходя из желаемых характеристик переходных процессов. С другой стороны, для подавления ограниченных, но быстроменяющихся возмущений необходимо использовать максимально допустимое быстродействие, которое по аналогии с использованием разрывного закона управления приводит к проблема чатеринга (Уткин В.И.). Таким образом исследование глобальной асимптотической устойчивости у разрывных систем остается актуальной задачей, а возможность построения для таких систем ФЛ, позволяет оценить максимальную область притяжения для непрерывной системы с бесконечной желаемой скоростью сходимости.

В свою очередь, на практике обычно разрывное управление реализуют через функцию насыщения гладкую или непрерывную, которая активизируется только в окрестности положения равновесия (КЬаЫ Н. К., Уткин В.И.). Т.е. фактически происходит взаимопроникновение проблемы реализации устойчивого скользящего режима в разрывной системе и задачи оптимального выбора параметров в функции насыщения для гладкой или непрерывной нелинейной системы.

Фундаментальной научной проблемой диссертации является проблема синтеза управления, содержащего функции насыщения, в том числе вложенные, при которых гарантируется выполнение ограничения на часть фазовых переменных, глобальная устойчивость и отсутствие перерегулирования в электромеханических системах.

Для решения фундаментальной научной и научно-практической проблем разработан метод синтеза управления электромеханическими системами, гарантирующий движение

исходной системы близкое в асимптотике к движению более простой эталонной нелинейной модели, обладающей заданными свойствами.

Целью диссертационной работы является разработка теоретических основ и методов стабилизации нелинейных систем в точке и построение областей притяжения для систем с ограниченным ресурсом управления и ограничениями на часть фазовых переменных. Поставленная цель достигается решением следующих основных задач:

- исследование глобальной асимптотической устойчивости плоских нелинейных систем с ограниченным ресурсом управления и ограничениями на фазовые переменные;

- исследование глобальной асимптотической устойчивости нелинейных систем 3-го и 4-го порядка с неограниченным ресурсом управления и ограничениями на фазовые переменные;

- исследование глобальной бифуркации в плоской системе с разрывной правой частью типа Филиппова с монотонной и немонотонной функциями переключения;

- решение задачи оптимизации наилучшего выбора коэффициентов в обратной связи, состоящей из вложенных функций насыщения;

- разработка метода решения задачи траекторной стабилизации, где траектория задается неявно посредством эталонной системы при движении электромеханической системы;

- разработка метода использования эталонной системы с заданными свойствами и виртуального управления для длительного численного интегрирования консервативных систем при качении по криволинейному профилю;

- разработка метода аналитико-численного построения скрытого аттрактора в задаче управления интегратором 3-го порядка с ограниченным непрерывным или разрывным управлением и ограничениями на фазовые переменные;

- разработка алгоритма численного построения выпуклых оценок областей устойчивости нулевого решения нелинейной системы.

Для достижения поставленной цели необходимо решить следующие задачи:

1. Проведение анализа существующих методов синтеза ограниченного управления с учетом ограничений на фазовые переменные. Сбор и классификация нелинейностей, характерных для электромеханических систем для определения направления исследований. Поиск новых методов работы с символьными вычислениями больших объемов для решения задач, ранее не доступных для решения.

2. Формулировка фундаментальной проблемы применительно к поставленной цели исследований.

3. Доказательство глобальной устойчивости плоских нелинейных систем, систем 3-го и 4-го порядка, с ограниченным ресурсом управления и ограничениями на часть фазовых переменных.

4. Исследование глобальной бифуркации в плоской системе и систем 3-го с разрывной правой частью типа Филиппова.

5. Оптимизация наилучшего выбора коэффициентов в обратной связи, гарантирующих отсутствие перерегулирования в нелинейной системе, содержащей вложенные функции насыщения и обладающей глобальной асимптотической устойчивостью положения равновесия.

6. Разработка метода аналитико-численного построения скрытого аттрактора в задаче управления интегратором 3-го порядка с ограниченным непрерывным и разрывным управлением и ограничениями на часть фазовых переменных.

7. Разработка алгоритма численного построения выпуклых оценок областей притяжения нулевого решения нелинейной системы.

8. Разработка метода решения задачи траекторной стабилизации, где траектория задается неявно посредством эталонной системы при движении электромеханической системы;

9. Апробация разработанного метода решения задачи траекторной стабилизации электромеханической системы на примере задачи управления движением маятника на подвижном основании по линии, задачах для длительного численного интегрирования консервативных систем при качении по криволинейному профилю, задачи управления плоской и 3-х мерной моделью биспинера, а также задачи управления формацией, содержащей большое количество агентов.

Научная новизна. Результаты, полученные в диссертационной работе, постановки задач и методы их решения являются новыми в теории управления. К основным новым результатам относятся следующие:

1. Проведен анализ существующих методов синтеза ограниченного управления с учетом ограничений на фазовые переменные, а также выделен класс нелинейностей, характерных для электромеханических систем, что позволило определить направления исследований и выделить подзадачи в рамках сформулированной научной проблемы.

2. Сформулирован и доказан ряд новых утверждений о глобальной устойчивости плоских нелинейных систем, а также систем 3-го и 4-го порядка с ограниченным ресурсом управления и ограничениями на часть фазовых переменных.

3. Впервые исследована глобальная бифуркация в плоской системе с разрывной правой частью типа Филиппова с монотонной и немонотонной функциями переключения.

4. Аналитически найдены значения наилучшего выбора коэффициентов в обратной связи, гарантирующие отсутствие перерегулирования в нелинейной системе, содержащей вложенные функции насыщения и обладающей глобальной асимптотической устойчивостью положения равновесия.

5. Разработан метод аналитико-численного построения скрытого аттрактора в задаче управления интегратором 3-го порядка с ограниченным непрерывным и разрывным управлением и ограничением на ускорение, а также впервые исследована глобальная бифуркация в таких нелинейных системах.

6. Разработан новый алгоритм численного построения выпуклых оценок областей устойчивости нулевого решения нелинейной системы;

7. Разработан новый метод синтеза закона управления, позволяющий использовать в задаче траекторной стабилизации вместо траекторий эталонные системы, которые обладают глобальной устойчивостью.

8. Проведена апробация данного метода на задачах управления движением маятника на подвижном основании по линии; на задачах для длительного численного интегрирования консервативных систем при качении по криволинейному профилю; на задачах управления плоской и 3-х мерной моделью биспинера, гарантирующего висение на заданной высоте; на задаче управления формацией, содержащей большое количество агентов;

Теоретическая значимость. Доказательство глобальной устойчивости для достаточно широкого класса плоских систем и систем 3-го порядка с нелинейностями в виде вложенных функций насыщения позволило сформировать новый класс эталонных нелинейных систем, гарантирующих выполнение ограничений по части фазовых переменных и отсутствие перерегулирования, если выбирать коэффициенты рекомендованным образом. Данный класс систем позволяет обобщить метод линеаризации обратной связью на случай, когда вместо линейной системы выступает нелинейная эталонная систем. Таким образом, в рамках общей концепции удалось объединить разрозненные до настоящего момента методы синтеза управления для гладких и непрерывных функций насыщения.

С использованием данного подхода к построению нелинейной обратной связи с помощью нелинейной эталонной системы, впервые синтезирован: - непрерывный закон управления, гарантирующий глобальную устойчивость для интегратора 4-го порядка и указан набор параметров при котором это свойство сохраняется; - непрерывный закон управления, гарантирующий локальную устойчивость в задаче управления маятником на подвижном основании (тележка или колесо); - непрерывный и разрывный закон управления плоской моделью биспинера, гарантирующий висение на заданной высоте; - непрерывный закон управления 3-х мерной моделью биспинера; - разрывный закон формацией, содержащей большое количество агентов; - виртуальный закон управления, гарантирующий численное интегрирование в задаче качения без проскальзывания консервативных систем.

Впервые был построен аналитически скрытый аттрактор для разрывной системы 3-го порядка и найден интервал параметров управления, при котором она глобально устойчива.

Впервые был построен аналитико-численным методом скрытый аттрактор для непрерывной системы 3-го порядка, и найден интервал параметров управления, при котором она глобально устойчива.

Разработан алгоритм численного построения выпуклой аппроксимации области притяжения нелинейной системы и впервые применен к построению области притяжения в задаче стабилизации маятника Капицы вибрационным управлением.

Практическая значимость. Полученные в диссертационном исследовании методы анализа и синтеза систем автоматического управления с точно известными параметрами и нелинейностями позволяют снизить консерватизм замкнутых систем по сравнению с регуляторами, полученными исходя из более общих подходов, повышая точность регулирования этими системами. Такие регуляторы могут заметно уменьшить энергозатраты на управление и продлить время автономной работы замкнутых систем за счет более тонкой настройки закона управления.

Глобальная устойчивость эталонных систем, используемых при синтезе закона управления, позволяет для объектов с неточно заданными параметрами повысить робастное качество замкнутых систем в условиях параметрической неопределенности объектов управления, вызванных неточно известной математической моделью или технологическими допусками при производстве компонент объектов управления.

Основные положения, выносимые на защиту

1. Доказана глобальная устойчивость интегратора 2-го и 3-го порядка, замкнутого управлением, состоящим из вложенных функции насыщения с помощью функций Ляпунова с интегральным членом, как для гладкого, так и для непрерывного случаев.

2. Доказана глобальная устойчивость интегратора 2-го порядка, замкнутого разрывным законом управления, кривая переключения которого может быть как гладкой, так и непрерывной функцией, при этом функция Ляпунова одинаковая для разных кривых переключений.

3. Введено понятие криволинейной асимптоты и узлоподобного фазового портрета для нелинейной системы на плоскости, на основании которых аналитически решена задача

оптимального выбора коэффициентов для обратной связи ввиде сатураторов в задаче стабилизации колеса в точке.

4. Исследована глобальная бифуркация в плоской системе с разрывной правой частью типа Филиппова, в которой кривая переключения не обладает монотонностью.

5. Введено понятие эталонной системы как системы дифференциальных уравнений, обладающей заданными свойствами, в частности ограниченным управлением и ограничением по фазовой скорости. С помощью такой системы построен закон управления интегратором 4-го порядка и доказана его глобальная устойчивость.

6. С помощью эталонной системы, содержащей вложенные сигмоиды, синтезированы законы управления маятником на подвижном основании в виде тележки и колеса. Для данного закона управления найден диапазон параметров, гарантирующих локальную устойчивость.

7. С помощью введения сигмоидов и виртуального управления, решена задача длительного интегрирования уравнений движения, описывающая качение без проскальзывания консервативных систем на длительных интервалах времени. При этом кривизна кривой, по которой могут катиться объекты, должна быть меньше обратной величины от радиуса колеса.

8. Предложен метод построения скрытого колебания в задаче управления 3-м интегратором посредством управления, содержащим 2 и 3 вложенных сатуратора.

9. Аналитически построена область параметров в задаче управления 3-м интегратором посредством разрывного управления, определяющая все глобальные бифуркации в системе. Параметры скрытого аттрактора выписаны аналитически.

10. Введено понятие плоской модели биспинера, для которой синтезированы два закона управления, позволяющие поддерживать вращение вокруг оси на заданной высоте: непрерывный и разрывный. Для сравнения эффективности построены области притяжения численно.

11. Предложен закон управления 3-х мерной моделью биспинера в виде последовательного построения эталонных моделей, учитывающий разрядку батарей и энерговооруженность модели.

12. Разработан алгоритм численного построения выпуклой аппроксимации области притяжения нелинейной системы. Эффективность предложенного алгоритма проверена в задаче стабилизации маятника Капицы вибрационным управлением.

13. Синтезирован разрывный закон управления формацией, содержащей большое колличество агентов, каждый агент которой описывается уравнением Лагранжа второго рода.

Соответствие паспорту специальности

Работа соответствует специальности 2.3.1 Системный анализ, управление и обработка информации, статистика по пунктам:

-Теоретические основы и методы системного анализа, оптимизации, управления, принятия решений, обработки информации и искусственного интеллекта;

-Формализация и постановка задач системного анализа, оптимизации, управления, принятия решений, обработки информации и искусственного интеллекта;

-Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решений, обработки информации и искусственного интеллекта;

-Разработка специального математического и алгоритмического обеспечения систем анализа, оптимизации, управления, принятия решений, обработки информации и искусственного интеллекта.

Методы исследования. В работе применяются методы линейной алгебры, теории устойчивости линейных систем, теории дифференциальных уравнений, функционального анализа, методы математического моделирования и методы оптимизации.

Степень обоснованности и достоверности полученных научных результатов. Достоверность полученных результатов обоснована приведёнными доказательствами утверждений, лемм и теорем, а также дополнительно проверена результатами математического и компьютерного моделирования, согласующимися с теоретическими результатами.

Апробация. Результаты работы докладывались и обсуждались на следующих всероссийских и международных конференциях: 6-й Международной конференции «Параллельные вычисления и задачи управления» РАСО2012 (М., 2012); 10-й Всероссийской школы-конференции молодых ученых «Управление большими системами» УБС2013 (Уфа, 2013); 4th International Conference on Nonlinear Dynamics (Sevastopol, 2013); 13-й Международной конференции «Устойчивость и колебания нелинейных систем управления» (конференция Пятницкого) (М., 2016); 10-й Всероссийской мультиконференции по проблемам управления МКПУ-2017 (Таганрог, 2017); 14-й, 15-й, 16-й Международной конференции «Устойчивость и колебания нелинейных систем управления» (конференция Пятницкого) (М., 2018, 2020, 2022); 13-го, 14-го Всероссийского совещания по проблемам управления ВСПУ XIII, XIV (М., 2019, 2024); 12-й мультиконференции по проблемам управления МКПУ-2019 (Дивноморское, 2019); 6-й Международной научно-практической конференции «Системы управления, сложные системы: моделирование, устойчивость, стабилизация, интеллектуальные технологии» European Control Conference ECC-2013 (Zurich, Switzerland, 2013); 21st IFAC World Congress (Berlin, Germany, 2020); 4th, 11th, 12th, 13th, 14th, 15th International Conference Optimization and Applications 0PTIMA-2013 (Petrova, Montenegro, 2013, 2020, 2021, 2022, 2023, 2024); Всероссийская научно- практическая конференция МИКМ0-2025 (Симферополь, 2025).

Публикации. По теме диссертации опубликовано 38 работ: 11 журнальных статей в рецензируемых изданиях (9 индексируются в Web of Science и Scopus, а 2 индексируется в Scopus), 27 статей в сборниках конференций (10 индексируются в Web of Science и Scopus, 17 конференций индексируются в РИНЦ).

Среди опубликованных по теме диссертации работ 6 статей из рецензируемых изданий выполнены без соавторства.

Связь с планами научных исследований. Работа выполнена при поддержке Российского фонда фундаментальных исследований грант № 18-08-00531 и при частичной поддержке Программы фундаментальных научных исследований по приоритетным направлениям, определяемым Президиумом Российской академии наук, № 7 «Новые разработки в перспективных направлениях энергетики, механики и робототехники».

Структура и объем диссертации. Диссертационная работа состоит из введения, четырех глав, заключения и списка литературы. Работа изложена на 245 страницах, содержит 134 иллюстрации, 2 таблицы. Список цитируемой литературы включает 214 публикаций.

Личный вклад. Все результаты, представленные в диссертации, получены автором самостоятельно и при его непосредственном участии. Во всех совместных исследованиях автору принадлежит ведущая роль формулировке задач, доказательстве утверждений, организации экспериментальных исследований, программной реализации символьных и

расчетных методов, тестировании разработанного программного обеспечения.

Содержание работы.

Введение.

Во введении обоснована актуальность и значимость исследуемой проблематики, дан обзор литературы, сформулированы цель и задачи исследования, основные положения, выносимые на защиту, приведены данные о структуре и объеме диссертационной работы.

Глава 1. Управление в системах 2-го порядка.

В главе 1 рассматривается применение управления в виде вложенных функций насыщения к плоским системам. Доказывается глобальная асимптотическая устойчивость нулевого положения равновесия для гладкого и непрерывного случаев. Для разрывной правой замкнутой системы в случае управления интегратором второго порядка строится универсальная функция Ляпунова. Далее вводится понятие прямолинейной и криволинейной асимптот для нелинейной системы с вложенными сатураторами и решается задача оптимального выбора коэффициентов в законе управления, гарантирующего движение без перерегулирования. В качестве примера решается задача качения колеса. В последнем разделе изучаются глобальные бифуркации в плоской системе с разрывной правой частью типа Филиппова с немонотонной кривой переключения. Аналитически находится значения бифуркационного параметра при котором в рассматриваемой системе возникает цикл, охватывающий несколько положений равновесия.

Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Список литературы диссертационного исследования доктор наук Морозов Юрий Викторович, 2025 год

N -

- |51=Д1Ди/2 | 2 -

^ / н

~и, В I 52=51~[ -

1 1 1 мин 1 1 1 I I

О 2 4 6 8 10 12 14 16 18 20 22

Рисунок 3.52 — Модель разряда батареи.

Для аппроксимации максимальной тяги будем использовать полином 5-го порядка и =

Р^г. Результат такой аппроксимации (кривая 2) в сравнении с линейной аппроксимацией (кривая 1) изображен на рисунке 3.52. Причем коэффициенты данной кривой практически не меняются для одной и той же батареи по мерее ее старения. Проведенные опыты показали, что изменение происходит скачкообразно и обычно, батарей с новой характеристикой не пригодна для полетов.

3.6.5. Численное моделирование полной системы с учетом разряда батареи

На рисунках 3.53-3.56 представлены результаты численного моделирования для исходной нелинейной системы, замкнутой предложенным алгоритмом управления для различных начальных условий.

Когда, начальные условия "хорошие" , см. рисунки 3.53, 3.55, т.е. в начальный момент биспинер имеет отличную от нуля угловую скорость относительно вертикальной оси, летательный аппарат поддерживает заданную высоту, несмотря на разряд батарей.

Когда, начальные условия "плохие", см. рисунки 3.54, 3.56, т.е. в начальный момент биспинер не вращается вокруг вертикальной оси, летательный аппарат может поддерживать заданную высоту только короткое время, однако этого времени вполне достаточно, чтобы совершить безопасную посадку.

3.7. Выводы

В главе 3 рассмотрено применение управления в виде вложенных функций насыщения к электо-механическим системам, описываемым системой дифференциальных уравнений порядка выше 3-го. В некоторых задачах окончательные выражения не приводятся из-за их громозкости, но зато указан алгоритм для их вычисления путем применения символьных вычисления. Сначала дано решение задачи синтеза управления интегратором 4-го порядка, гарантирующего глобальную асимптотическую устойчивость начала координат с помощью импульсного управления [105, 183]. Чтобы доказать глобальную устойчивость плоской системы с переключениями использовался метод решения (аналитически) системы

Рисунок 3.53 — Отклонение по высоте и проекция фазовой траектории на горизонтальную

плоскость, г(0) = 20.

Рисунок 3.54 — Отклонение по высоте и проекция фазовой траектории на горизонтальную

плоскость, г(0) = 0.

линейных матричных неравенств 2-го порядка [181]. Далее синтезирована обратная связь для управления маятником на подвижном основании, в качестве которого выступают тележка [196], [192] и колесо[194, 99, 193]. Обе задачи решаются в безразмерных переменных и времени. В следующем разделе предлагается новое решение задачи управления роботом-колесом [100, 187]. При синтезе закона управления используется эталонная система с гладкой правой частью из 2-ой главы. Далее, предложенный метод, использования эталонной системы применяется в задаче длительного качения колеса с маятником по существенно криволинейному желобу [101]. В конце этой главы даные новые математические модели, описывающие движение биспинера плоская [84, 175, 174] и пространственная (полная) [171], причем для полной модели системы закон управления строится последовательным применением эталонных моделей и выписывается символьно прямо в виде кода на языке

С++.

Рисунок 3.55 — а) компоненты вектора угловой скорости; б) график иг(£); в) управления

для г(0) = 20.

Рисунок 3.56 — а) компоненты вектора угловой скорости; б) график иг(£); в) управления

для г(0) = 0.

Глава 4. Мультиагентные системы

4.1. Управления группой агентов с помощью гладкого закона управления

В настоящее время наблюдается бурное развитие одного из направлений общей теории управления, которое посвящено управлению мультиагентной системой.

В обзоре [142] говорится, от том что за последние 7 лет опубликовано несколько тысяч работ по теоретико-графовым моделям децентрализованного управления в мультиагентных системах. Очевидно, что ни один автор не способен ознакомиться со всеми результатами, полученными в данной теории за последние 20 лет.

Каждый год появляются работы, в которых авторы стремятся структурировать и обобщить существующие результаты в данном направлении. Одной из первых таких работ является [126], в которой предлагается некоторая классификация статей, связанных с формированием группы из простых объектов. Далее приводится таблица 5.1, в которой классификация работ идет по типу протокола согласования характеристик (ПСХ)

Таблица 4.1 — Классификация

работ типу протокола согласования характеристик.

тип агента тип протокола работы

интегратор двойной интегратор интегратор высокого порядка ПСХ 1-го порядка ПСХ 2-го порядка, ПСХ с лидером ПСХ n-го порядка [44],[92],[119],[28],[29] [116] [89],[117],[60],[127] [118]

Авторы рассматривают различные постановки задач сводящиеся к изучению ПСХ, посредством анализа свойств Лапласовской матрицы2^.

В данную классификацию не попали работы, связанные с запаздыванием при передачи информации. А также статьи, посвященные исследованию ПСХ для агентов, движение которых описывается нелинейными уравнениями.

Более полную классификацию можно встретить в книге Ку [112] и курсе лекций Льюиса [67], в котором предпринята попытка классифицировать задачи, связанные с управлением мультиагентной системой.

Однако, несмотря на столь богатое многообразие работ всегда можно указать достаточно жесткие предположения на рассматриваемую модель агента как абстрактный математический объект, при которых будет достаточно сложно найти строгий результат, не связанный с эмпирическими предположениями.

Тематика данной статьи наиболее близка к работам, в которых изучается управление агентами, движущимися в единой формации, вдоль заданной траектории. В зарубежной для обозначения такого типа движений используются различные термины. Приведем основные из них: "flock" /formation" ,"a-net" ,"network" . Наличие большого количества терминов обозначающих принципиально одинаковый объект, вызывает некоторые дополнительные трудности при изложении результатов разных авторов. Поэтому, чтобы избежать путаницы в обозначениях и определениях, они в тексте статьи будут приведены полностью.

2В зарубежной литературе существуют различные определения, данной матрицы, поэтому чтобы избежать двусмысленности в данной работе используется следующее определение: С = Д(А) —А, где матрица А является матрицей смежности некоторого графа §, а Д(Л) = diag(d1,..., ¿п), ¿г = <

матрицей степеней вершин.

а.

является

4.1.1. Модель агента — интегратор второго порядка

Обозначим общее число агентов через п. Динамика каждого агента описывается интегратором 2-го порядка

Фг = рг, рг = и(д,р,т), (4.1)

где д = [д1,..., дп} е Етхп, р = {р1,... ,рп} е Етхп, т = [т1,... ,тп} е Етхга — координаты, скорость и ускорение п агентов в абсолютной евклидовой системе координат. Заметим, что управление иДд,р,т) имеет смысл ускорения ¿-го агента. Будем считать, что ускорение и является управлением для ¿-го агента.

Далее под информацией об ¿-м агенте будем понимать вектор состояния агента вг =

(дг,рг,тг)т е Етх3.

Введем ограничения на радиус распространения информации между агентами. Пусть г°и4(ггпр) означает расстояние, на которое ¿-ый агент передает (получает) вектор вг рисунок 4.1.

Рисунок 4.1 — Модель агента

Будем говорить, что ¿-му агенту доступна частичная информация об ]-м агенте, если одна или несколько компонент вектора состояния неизвестны, т.е. в1к = 0, к = 1, 2, 3. Далее предполагается, что г°и4=ггпр=г, когда мы говорим о передаваемой информации между агентами.

Перечислим требования к желаемому закону управления [120]. Полученный закон управления, должен обеспечить:

п.1) отсутствие столкновений между агентами для любого момента времени, п.2) поддержание заданного расстояния между агентами, п.3) одинаковую скорость для всех агентов,

п.4) геометрический центр формации должен следовать вдоль заданной траектории.

Помимо перечисленных здесь требований, автор в работе [120] также вводит дополнительные ограничения на закон управления, вызванное необходимостью гарантировать отсутствие столкновений с препятствиями, при движении агентов не в свободном пространстве.

Стоит отметить, что данное ограничение столь жесткое, что некоторые авторы предполагают, что п. 2)-4) выполняются автоматически, а отсутствие столкновений с препятствиями рассматривают, как самостоятельную задачу близкую к задаче разрешения

конфликтных ситуаций между агентами. Например, статья [80] полностью посвящена данной задаче, а предложенное автором решение, основано на построении "вихревой оболочки" вокруг каждого агента.

Аналогичная задача с использованием гироскопических сил была рассмотрена в [17], однако строгого результата получено не было, хотя авторы предложили алгоритм, проверенный моделированием. Основное отличие этой работы от [80] заключается в том, что агентам позволено выбирать направления обхода, т.е. при некоторых ситуациях возможно столкновение.

В данной работе будет рассматриваться только случай движения группы агентов в свободном пространстве.

Чтобы построить закон управления формацией, посредством децентрализованного управления, необходимо общую задачу управления разбить на подзадачи, решение которых позволяет удовлетворить каждому из перечисленных требований отдельно. Кроме того, пару, взаимодействующих между собой агентов, можно назвать простейшей группой. Такое рассмотрение будет допустимо и для п. 4), если ввести агентов, наделенных определенными свойствами.

Чтобы перейти от парного взаимодействия к групповому, необходимо для каждого агента ввести понятие "множество соседей" ¿-го агента N¿(5), т.е. количество только тех агентов, с которыми произвольно выбранный агент может обмениваться информацией в*. Определим его как

N¿(5) = {] : Огз(5) > 0}, (4.2)

где а^ (5) компоненты матрицы смежности некоторого динамического орграфа вершины которого соответствуют агентам, а ребра определяют потоки информации, т.е. доступность компонент вектора вг для вычисления управления. Будем говорить, что орграф имеет дугу (у, у) или г], если существует агент г, способный передать вектор вг и существует агент ], способный получить эту информацию. Последнее возможно, только в том случае, когда относительное расстояние между агентами меньше некоторой наперед заданной величины г. Поэтому, в нашем случае, можно определить матрицу смежности А(^) = а^(5) следующим образом:

а..(о) = /! , 11^ — 5*11 ^ г,г = ] (43)

а%3 (5)=\0 , иначе. (4.3)

Из (4.3) следует, что матрица смежности будет состоять из кусочно непрерывных функций. Чтобы этого избежать определим компоненты матрицы А(^), через гладкие ограниченные функции. Обозначим через рь(г), г € [0, функцию скачка, которая удовлетворяет

перечисленным ниже свойствам:

а) непрерывная и ограниченная единицей функция при г € [0,

б) рЛ(0) = 1 и рЛ(1) = 0,

в) ¿рн(г)/¿г ^ 0, г € (0, ,

г) существуют константы 0 < к < 1 и Ьь > 0 при которых ||¿ри(г)/dz\\ < Ьь при г € (0,

Замечание 28. Пусть выполнены условия а)-г), тогда существует некоторая константа г > 0, что для фиксированного к выполняется р^(г/г) ^ 1, г ^ гк.

используя функцию рн(г) для фиксированного к перепишем элементы матрицы А(^) в виде:

ац (9) = рнШ — 5з\\а/г<?). (4.4)

Здесь и далее, через || • обозначена 7-норма, а а элементы матрицы (4.4) являются сигмоидными функциями в смысле определения 9. 3

Из такого определения (4.2), "множества соседей" следует, что оно всегда однозначно определяется, если известно относительное расстояние между рассматриваемыми агентами в конфигурационном пространстве.

Альтернативное определение соседних агентов можно встретить в работе [126]. В которой предполагается, что число соседей не зависит от расстояния между ними и определяется только моментами времени, в которые происходит потеря информации о соседях. Вид этой функции приведен ниже: Аг(£) = {] 1<7^,])Щ = 1,j = ¿,j = 1,... , п}, где п — это число вершин графа, а 7(1,^[1\ является индикаторной функцией (целочисленный гистерезис [46]), которая используется, например, в работе [46] для анализа связности орграфа, посредством внесения или исключения дуги.

4.1.2. Моделирование сил парного взаимодействия между агентами через

сигмоиды

Теперь рассмотрим подробно каждый тип парного взаимодействия, соответствующий одному из четырех, приведенных выше требований. Примеры таких взаимодействий схематично показаны на рисунке 4.2.

Рисунок 4.2 — Характерные типы взаимодействия

Притяжение и отталкивание

Для построения потенциальной функции воспользуемся методом, предложенным в статье [89]. Сначала, строится вспомогательную функцию, которою обозначим через ф(в), описывающая парное взаимодействие между агентами, обладающая следующими свойствами:

3Будем говорить, что вектор г е Дт имеет <г-норму[91] ||г||ст е Д^о для некоторого значения е > 0, если существует преобразование вектора г следующего вида: ||г||ст = 1/е(^/1 + е||г||2 — 1). Легко проверить, что для любого фиксированного значения е > 0 при г = 0, ||г||ст = ||г||. Главной особенностью данной нормы является то, что она дифференцируема в нуле. Обозначим градиент от <г-нормы по г через <7б(г) = ||г||ст. Он определяется следующим выражением: <тб(г) = г/у/1 + е||г||2 = г/(1 + е||г||ст) и обладает свойствами

а. г ае(г) > 0, Уг = 0;

б. ||ае(г)|| < 1/^е, Уг;

Т

в. (х — у) (ае(х) — ае(у)) > 0, Ух = у.

1. max = ф(0) = hi — максимальное отталкивание,

2. min = '-p(da) = h2 — максимальное притяжение.

3. ф(з*) = 0, s* E [ra, — положение равновесия.

Затем функция ф(в) интегрируется на заданном интервале. После чего, получаем гладкую потенциальную функцию, которую можно записать в виде

fZ

Ф*(г)= I Фa(s)ds. (4.5)

¿(1а

Функция фа(г) из (4.5) обладает следующими свойствами:

1. фа (г) ограничена при г а = ||г||ст;

2. фа(г) имеет глобальный минимум в точке г = ¿а.

Зная потенциал между двумя агентами, определяем "потенциал формации" т.е. полную потенциальную энергию всех агентов,

и(9) = 2 ЕЕ фа (Ни - Л). (4.6)

г

Теперь, используя функцию (4.6), получаем закон управления для каждого агента, обеспечивающий притяжения на расстояниях больше заданного и отталкивание на расстояниях ближе заданного, который имеет следующий вид:

ииг = -V,, и (д). (4.7)

Приведенный выше потенциал (4.6) можно переписать в другом виде

и (д) = ис(д) + ий (?), (4.8)

где иО(д) = 0.5 фа — дгНа),ис (?) = Ц^Ъ (д)ННфа(НгНа). Таким образом, как

только агенты становятся не соседними один потенциал заменяется другим: ис(о) < — и^ (?). Потенциал и^, (?) в (4.8) можно трактовать как взаимодействие агента с некоторым виртуальным особым агентом, причем в этом случая управление и(?) воздействует только на соседних агентов, т.е. не требуется знание полной информации о всех агентах группы.

Как говорилось выше, так построенный закон управления, имеет ограничения на максимальное воздействие, а значит, в некоторых ситуациях возможны столкновения агентов. Одним из методов решения данной проблемы может служить неограниченный потенциал. Такой подход был предложен, например, в [126]. Остановимся на нем более подробно, т.к. при некоторых условиях он может быть применим. Итак, в работе [126] потенциальная функция ф(%-) является интегралом от функции

mi

(4.9)

d^(qij) I (r-qn)m2 , qij < r

= I , qj =r

m3 , qij > r

где qij = ||qi — qj ||, mi ^ 2, m2 ^ 1, m3 ^ 0, и удовлетворяет трем свойствам:

lim ^(qtj) = rc, ^^ ^ 0, qij E [0, r), lim ^^ — < rc. (4.10)

qij ^r J dqij J qij ^0 dqij qij

Очевидно, что потенциальная функция, имеющая производную (4.9) не может быть записана в виде: V(||д — ||) = а^ (¿)(%-)2, где а^(¿) = (¿) > 0, что ее отличает от аналогичных работ [117], [60], [116]. Однако главной, ее особенностью является то, что синтезированный на ее основе закон управления

ии = — Е ^) (4.11)

сохраняет связность графа 0(д) из-за свойства (4.10). Это означает, что количество "соседних" агентов не меняется, начиная с некоторого момента времени.

В работе [64] был предложен более простой вид закона управления (4.11), (4.10), обладающий аналогичными свойствами, который имеет вид

«" = - Е(aj - j, (4-12)

jeNt (q)

qij qij

где аг] > 0, bij > 0, i, j = 1, n. Преимущества и недостатки, приведенных законов управления будут рассмотрены ниже.

Согласование скоростей

Итак, предложенный в предыдущем разделе, закон управления обеспечивает отсутствие столкновений и в то же время препятствует агентам расползтись в разные стороны, т.е. считаем требования п.1) и п.2) выполненными. Для выполнения требования п.3), которое можно трактовать как — согласование скоростей в формации, воспользуемся результатами теории графов.

В [39] показано, что скорость сходимости замкнутой системы при выборе закона управления в виде

uf = Y1 аг] (q)(pj— Рг) (413)

jeNt

равна A2 ^ 0. Закон управления вида (4.13) в зарубежной литературе, принято называть (линейным) правилом согласования скоростей. По своему действию такой закон управления аналогичен демпфирующему воздействию. Часто, это закон управления записывают в более компактном виде, используя Лапласовскую матрицу:

т Т

uf = -Р L(q)p. (4.14)

Известно [39], что L(q) всегда имеет правый собственный вектор 1n = (1,..., 1)T, которому отвечает минимальное собственное значение Ai = 0. Другие свойства L(q)

Лемма 1[34] Пусть G(q) = (V(q), E(q)) неориентированный граф степени n с неотрицательной симметричной матрицей A(q) = A(q) . Тогда следующие утверждения верны:

1. L(q) является положительной полуопределенной матрицей;

2. Граф G(q) имеет c ^ 1 связанных компонент, если rank(L(q)) = n — c. В частности, граф G(q) является связанным, если rank(L(q)) = n — 1;

3. Пусть G(q) является связанным графом для любой конфигурации q, тогда

A2(L(q)) = min (4.15)

z±Ln \\Z ||

Используя данную лемму можно показать, что рг(t) ^ а, t ^ то для всех i со скоростью сходимости (4.15), если G(q) является связанным графом.

Взаимодействие агентов с агентом-лидером

Для удовлетворения п.4) рассмотрим движение произвольного агента вдоль некоторой траектории как парное взаимодействие. Итак, чтобы довести информацию, о желаемой траектории до агентов, определим исключительного агента-лидера, которого будем обозначать /-агентом. Компонент закона управления, определяемый с помощью информации в1 от /-агента, будем называть "навигацией". Кроме того, будем считать, что управление /-агентом не зависит от других агентов и определяется заранее, т.е. его движение описывается интегратором второго порядка

4.1 = рг, рг = Щ ((г,рг), (4.16)

где функция и>г(ф, рг) известна. Используя терминологию из раздела 3.4, система 4.16 - это эталонная система в смысле определения 13.

Иначе говоря, данный агент точно знает, куда нужно двигаться геометрическому центру масс группы, после образования формации.

Исходя из сказанного выше, можно построить иерархию агентов, используя в качестве критерия обеспеченность информацией вг, иными словами, чем больше агенту доступно информации о лидере, тем более высокое положение в этой иерархии он занимает [4].

Тогда закон управления, обеспечивавший навигацию, может быть записан следующим выражением:

Ц = — ех(4г — ®) — о2(рг — рг) — с3(тг — щщ ), (4.17)

где с?, если соответствующая компонента вектора в? недоступна для ¿-го агента. Далее, будем предполагать, что мы точно знаем количество агентов каждого типа, причем это число конечно. Кроме того, ни один агент не может в процессе движения поменять свой тип.

В некоторых работах, наряду с агентом лидером, который обладает свойствами, описанными выше, вводят некоторого виртуального агента, которого при некоторых дополнительных ограничениях можно считать агентом лидером. В качестве примера, можно привести работу [58], к которой предполагается, что ¿-ый агент способен получить, обработать и передать дополнительную информацию: координаты и скорость центра масс ((,р) группы или координаты и скорость центра масс подгруппы ((¡г,рг), образованной соседними агентами. Для вычисления этих данных можно воспользоваться результатами, полученными, в одной из работ [93] ,[90] ,[138].

4.1.3. Управление формацией

Объединяя все сказанного выше, можно записать децентрализованный закон управления, удовлетворяющий всем заданным свойствам

и = Ц7 + и\ + и\, (4.18)

где компоненты , и Ц определены в (4.7), (4.14) и (4.17) соответственно.

Далее, посмотрим, как отсутствие информации о лидере влияет на движение формации.

Движение вдоль прямой

Сначала, рассмотрим случай отсутствия ускорения у лидера. Тогда закон управления (4.18) можно переписать в виде [4]:

иг = — Е фа(Н — (^а)+ Е ач (4)(Рз — Рг) —

з€Мг(я) зеЫг(я) (4.19)

— Ьг[сл((г — (I) + С2(рг — рг)], сь > 0,

где кг = 1, если агент информированный и кг = 0 в противном случае. Предполагается, что число М0 информированных агентов больше нуля, ограничено и существенно меньше

общего числа агентов , т.е. 1 ^ М0 << п. Случай М0 = п, был рассмотрен в теорема 6. Модификацию данного закона управления можно встретить в [58]. В этой работе предложены 2 протокола взаимодействия между агентами и лидером, посредством

7

применения управления иг:

= и\ — о1 (дг + д) — с! (р + р), (4.20)

где координаты и скорость центр масс формации, определяются соответственно

1 П 1 п

д= - У] ^ Р = - У Рг.

пп

г=1 г=1

т.е. в этом случае предполагается, что г-ый агент может вычислить центр масс формации. Здесь и далее, символом 7 наряду с I будем обозначать вектор, соответствующий агенту лидеру.

С одной стороны, такая модификация закона управления позволяет быстрее осуществлять перегруппировки. С другой, для получения этой информации нужно затратить дополнительные ресурсы, которых могут быть недоступны. Можно, также предложить еще одну модификацию предложенного ранее закона управления (4.19)

и] = Щ — с1 (Яг + Я1+Ма ) — с2 (Рг + р1+Ма ), (4.21)

где = 2^г=1 " Яг, Р1+У^ау = 2^г=1 г Рг при таком законе управления г-му

агенту достаточно знать положение и скорость своих соседей, число которых определяется величиной N°. В частности для а-сети4 оно не превышает 6. Недостатком же данного закона управления является то, что данной информации может быть не достаточно, чтобы отказаться от значительного числа информированных агентов.

Далее приведем ряд утверждений являющихся обобщениями ранее известных. Обобщения касаются класса потенциальных функций, используемых в управлении, а также непосредственно связаны с введением дополнительной информации в законы управления.

Лемма 17. Пусть функция, определяющая навигацию f (д,р, д7 ,Р7) является линейной по своим аргументам, т.е. представима в следующем виде:

f (Я,Р, Я7,Рт) = Нд9(й,Р) + Нн 1 0 h(q,p, д7 ,Р7), (4.22)

где Н = diag(hl, , ^+1,..., К) Ъ 05, Нд = diag (Л,ь..., Ныд ,Ныд+1,...,^) Ъ 0,0 <

Мк < п, 0 < Мд <п,Нг = {0,1}, г = {1, п}.

Тогда движение группы может быть представлено в виде N двумерных систем, описывающих движение агентов относительно центра масс этой группы

й = Р, Р = —VV(д) — ¿(д)р + Ндд(д,Р) (4.23)

и одной двумерной системы, описывающей взаимодействие центра масс группы с 1-агентом

д = Р, Р= ^МФ^Ят,Рт), (4.24)

где д(д,р) = — с1д — с2Р, Ь,(д,р, д7,р7) = —с1(д — д7) — с2(Р—р7), через д = д — 10д, р = р — 10Р>, и = и — 1 0 и обозначены компоненты вектора состояния в системе координат связанной с центром масс группы.

4в наших обозначениях это формация, агенты которой образуют структуру, состоящую из одинаковых равносторонних треугольников

5Знак Ъ 0 означает положительную полуопределенность.

Доказательство леммы 17. Пусть матрица И определяет число информированных агентов, а матрица Ид = IN задает число агентов получающих координаты и скорость центра масс группы, тогда функция / (д,р,д1 ,р1) может быть представлена в виде / (д,р,д1 ,р~() = —СгИд(д — 1п 0 ф) — С2Ид(д — 1п 0 д) — СгИн1п 0 (д — д1) — С2Ин1п 0 (р — р1) или

/(д,р,д-у,р7) = — Ин(Сх(( — 1п 0 ) + С2(р — 1п 0 ,р1)) — (I — Ин)(Сг(( — 1п 0 ф) + С2(р — 1п 0р))

Дальнейшие рассуждения полностью повторяют доказательство леммы 2 из [90]. Доказательство леммы 17 завершено.

Основная идея леммы 17 заключается в том, что если функция навигации / (д,р, д1 ,,р1) удовлетворяет (4.22), то можно провести декомпозицию исходной системы на N + 1, где достаточно обеспечить глобальную устойчивость только системе (4.24), т.к. глобальная устойчивость для (4.23) гарантируется свойствами потенциалов. Можно показать, что замкнутая система

4 = Р, - (4 25)

р = (д) — Ь(д)р + /1 (д,р,д1 ,р1),

где Ь(д) = Ь1т0 е Ятп, здесь параметр т определяет размер конфигурационного пространства, эквивалентна следующей системе:

4 = р, (4 26)

р = и = —УиА((?) — Я(д)р, { ' ;

где и\(с[) = и(д) + ■(д) является обобщенным потенциалом группы агентов, а матрица ■(д) = 2ХдТд имеет смысл матрица инерции, с фиксированным значением Л = Сг > 0 для всех агентов, матрицу Д(д) = С21т + Ь(д) е Ятп, С2 > 0 можно рассматривать как демпфирующее воздействие некоторых силы вязкости между агентами, т = 1 . Из сравнения правых частей, что введение информации о центре масс потока так же как и введение информации о лидере позволяет регуляризовать матрицу и\(д) потенциальной энергии группы.

Приведем теорему, доказательство которой практически дословно повторяет доказательство теорем 1 в [89], если воспользоваться леммой 17, из которой следует, что при Ь ^ то агенты будут двигаться как узлы а-сети, причем их скорости будут одинаковыми. Кроме того, в зависимости от начальных условий, гарантируется отсутствие столкновений. Доказательство остается справедливым, в силу того, что отсутствие информации о лидере компенсируется информацией о центре масс группы. Более того, все рассуждения остаются справедливыми и не нарушают доказательство, если в управлении использовать бесконечный потенциал.

Теорема 17. Рассмотрим группу агентов, динамика которых описывается системой (4.25), при этом управление выбирается в форме (4.19), (4.20). Начальная энергия всех агентов ограничена и динамический граф, соответствующий этой группе агентов, является связным для каждого момента времен Ь ^ 0. Тогда следующие утверждения верны:

• Почти каждое решение замкнутой системы (4.25) и (4.26) сходится к положению равновесия (д*,р*), причем д* является а-решеткой, где

д* = дг— Ф,р* = рг— 'р.

• Скорости всех агентов асимптотически сходятся в относительной системе координат.

• Пусть дано c < c* = ^«(0), тогда (t) = qj (t), Vi = j, Vt ^ 0.

Данную теорему можно переформулировать в другом виде. Если каждый подграф графа G(q) является связным и содержит информированного агента, то существует момент времени T* > 0, после которого G(q) будет состоять, только из одного связного графа, причем, при таких начальных условиях коэффициенты (4.21) могут быть выбраны следующим образом: c^ = 0 и ¿> =0. Следствие из теоремы 17.

Следствие 5. Если существует подграф графа G(q), не содержащий ни одного информированного агента и коэффициенты в (4.21) ci = 0, cY = 0, тогда всегда можно подобрать начальные условия при которых граф G (q) не станет связным, а агенты соответствующие изолированному подграфу образуют кластер, движение которого полностью определяется начальными условиями агентов, его образующих.

Движение вдоль кривой

Введем Предположения

1. При взаимодействии подграфов не происходит переключений для любого момента времени t ^ T;

2. Скорость лидера не постоянна, т.е. pY(t) = const;

3.1 Все агенты информированные, т.е. hi = 1, i = 1,..., N;

3.2 Известно, что Mh, Mq и Mp агентам известно ускорение, координаты и скорость лидера соотвествтвенно;

4.1 Всем агентам известно ускорение лидера, т.е. закон управления (4.19) можно переписать в виде

u = ui + / (q7 ,Py );

4.2 Всем агентам известна положение и скорость центра масс группы, т.е. закон управления (4.20) можно переписать в виде

uY = uY + hi fY (q, ,PY ); (4.27)

Лемма 18. Пусть выполнено Предположение 1, начальная энергия агентов ограничена и (c*)2 ^ 4c*, тогда скорость центра масс группы сходится к скорости лидера с экспоненциальной скоростью т* = c*/2. При этом движение центра масс группы описывается системой описывается одной из двух систем, если в Предположении 1 выполнены пункты 1.,2.,3.1 и 4.1[4]:

q = Р, Р = Py - ci(g - q7) - c2(p - p7), cj = ci, c* = c2. (4.28)

если же справедливы в Предположении 1 пункты 1.,2.,3.2 и 4.2 системой

q = p, p = MhPY - ciM(q - Mhq7) - c2M(p - MhpY), ci = ciM, c2 = c2M (4.29)

h h h h

Доказательство леммы 18. Системы (4.20) и (4.28) эквивалентны, если выбрать c, = 1 -ci M и c, = 1 - c2 M в (4.20). Запишем систему дифференциальных уравнений (4.29) в отклонениях

6q + c2eq + cjeq = 0 (4.30)

где eq = ф— MhqY. В силу ограниченности начальной энергии агентов, eq согласно (4.30) будет экспоненциально стремиться к 0, если выполнено (c2)2 ^ 4c\. Из последнего неравенства, вытекают дополнительные ограничения на информированность агентов. Лемма 18 доказана.

Альтернативный подход с точки зрения дополнительной информации предложен в работе [19]. Авторы статьи используют, знание ускорений соседних агентов, чтобы синтезировать более качественный закон управления для i-го агента, при этом не нуждаясь в информации о центре масс системы. К сожалению, предложенный в работе [19] подход применим только для групп агентов с постоянным и известным графом коммуникаций.

Т.о. без полной информации об ускорение лидера, нельзя в рамках данной модели, обеспечить точное следование формации вдоль кривой. Однако, для некоторых задач, требуемая точность может быть достигнута, если воспользоваться аппроксимацией ускорения. Для этого необходимо хранение, вектора скорости соседних агентов, с последующим его использованием для ускорения aj = (pj — pJ)/2т, где т интервал задержки, Pj-текущая скорость j-го агента, а pT соответствует скорости агента в момент времени t — т.

4.1.4. Использование математической модели колесного робота вместо

интегратора второго порядка

Предположим, что есть группа колесных роботов, каждый из которых, в том числе лидер реальный или виртуальный, описывается следующей системой дифференциальных уравнений:

xi = Vi cos 6i, yi = Vi sin 6i, 6i = Viki, Vi = ai, (4.31)

где Vi — модуль вектора скорости, 9i — угловая ориентация платформы отдельного робота, ai — ускорение, ki — текущая кривизна, i = 1, ...,n, где n—число агентов. В данной системе (4.31) управлять можно двумя параметрами кривизной и ускорением каждого агента.

Далее предполагается, что Vi > V0 > 0, a |6i| < п/2, т.е. ни один из агентов не может остановиться или встать перпендикулярно желаемой траектории, в данном случае траектории лидера.

Тогда, используя замену переменных qii = xi, q2i = yi, pii = Vj, cos 0i, p2i = Vj, sin приходим к системе (4.1), где компоненты вектора ui выражаются через ускорение и текущую кривизну. Теперь остается вернуться к исходной системе и переписать синтезированный закон управления в старых координатах. Т.о. получаем закон управления колёсными роботами в виде

ki = (— sin eiu1 + cos 6iu2), (4 32) ai = (cos 6U + sin diu22),

где в качестве ui может быть использован один из приведенных ранее законов управления, содержащих потенциалы. Основным недостатком преобразования (4.32) является, требование Vi > 0, т.е. предложенное управление эффективно только при относительно быстром движении. Аналогичные проблемы имееют место и при замене переменных, предложенной в работе [59]. Можно также привести работы, в которых рассматривалось более простое описание колесной системы, но при этом роботы могли получать только относительные координаты между собой. Например, в [25] предлагается закон управления, состоящий из 2-х типов компонент l — l и l — ф. К главным недостаткам этого закона управления можно отнести его сложность реализации для относительно небольшого числа агентов.

4.1.5. Моделирования взаимодействия в группе с помощю сигмоиды

На рисунке 4.3 представлены результаты моделирования движения 11 колесных роботов следующих за лидером, при этом использовался закон управления (4.18), у которого в

качестве потенциальной силы использовался (4.12). При этом функция скачка Рь(г) была выбрана в виде:

1, г е [0,к),

Рь(г)

1 2

0,

1 + ес8(п )], г е [к, 1], г е (1, то).

(4.33)

Легко проверить, что производная функции (4.33) ограничена константой Ьь = 2(1—ь) и кроме того На левом рисунке 4.3 показано формирование группировки колесных роботов имеющие различные начальные условия. Лидер движется по окружности с постоянной по модулю скоростью. На правом рисунке 4.3 изображена конечная структура колесных роботов.

Рисунок 4.3 — Фазовые траектории 11 колесных роботов. Траектория лидера не

изображена.

Количество роботов подобрано таким образом, чтобы исключить симметрию формации. На рисунке 4.4 представлены результаты моделирования движения 11 колесных роботов следующих за лидером. На левом рисунке 4.4 показано формирование потока из агентов при использовании (4.19). При этом функция фа(г) выбрана в виде:

Фа (г) = Рн(г/та)ф(г - ¿а), Ф(г) =

- ) 1

агс^§(^ г е (^ то).

г е [0, ¿а],

(4.34)

- 2Н11,

Стоит отметить, что в отличии от [89], предложенная в данной работе функция (4.34), обладает преимуществом, которое заключается в том, что величину максимального притяжения и величину максимального отталкивания можно задавать независимо.

В начальный момент все агенты разбиты на кластеры по 2 или 3 агента в каждом, с одним информированным агентом. Желаемое расстояние выбрано недопустимым, чтобы проверить поведение агентов при столкновении. Лидер движется по окружности с постоянной по модулю скоростью. На правом верхнем рисунке 4.4 изображена конечная структура колесных роботов, в случае когда потенциал конечен. На правом нижнем рисунке 4.4 хорошо видны переходные процессы при формировании группы.

На рисунке 4.5 представлены результаты моделирования движения 36 агентов под управлением (4.27), следующих за лидером, причем ограничения на управления не учитываются. Из рисунков видно, что во время движения столкновения между агентами не происходит. На рисунках показаны этапы формирования единой формации из агентов, имеющие различные начальные условия. Лидер движется по прямой с постоянной по модулю скоростью направленной вдоль оси Ох. Движение двумерное.

50 10

30

го ; 10

; » 1- _1С

-го -зо

-50

Рисунок 4.4 — Фазовые траектории 11 колесных роботов и переходные процессы.

Траектория лидера не изображена.

ЬЛП 1=150

20

и

Д Л)

■№ -

И 40 X д 10 [I -10 -20 ■30

я

Рисунок 4.5 — Конфигурационные состояния 36 агентов.

Все рассмотренные в работе законы управления удовлетворяют поставленным условиям. Однако, наличие или отсутствие информации об желаемой траектории достаточно сильно влияет на устойчивость движения агентов внутри формации. Более того, все рассмотренные законы управления относятся к детерминированным, хотя задача объединения в формацию, может носить чисто стохастический характер, приводящий к вычислению геометрической вероятности, когда часть агентов не обладает информацией ни о лидере ни о своих соседях.

Как было показано выше, помимо навигации в каждом из приведенных законов управления присутствуют еще две компоненты. Из сравнения рисунке 4.3 и рисунке 4.4 видно, что для бесконечно растущего потенциала, возникает квантование уровней распределения агентов, тогда как для конечного потенциала, это произойти не может (образующие формацию агенты, остаются равномерно распределенными на окружности). Это связано с тем, что для достаточно близких расстояний управление в силу ограниченности не может справится с возросшей нагрузкой. С другой стороны, бесконечное управление не может быть использовано ни в одной практической задаче.

При вычислении компоненты закона управления, отвечающей за согласовании

скоростей используется тот же информационный граф, что и при вычислении потенциальной компоненте. Однако после того, как сформирован один единственный связный граф. Можно строить управление по согласованию скоростей, основываясь на информации только двух соседних агентов. Тем самым еще снизив затраты на вычисление полного закона управления.

Что касается, постановки задачи движения группы агентов в пространстве с препятствиями, то данная тема требует дальнейшего исследования, а приведенные законы управления, могут быть использованы как компоненты синтеза более общего и сложного закона управления.

4.2. Синтез глобально устойчивого разрывного закона управления формацией

Проектирование и управление систем, содержащих большое число агентов с множеством связей между ними является важной задачей в современном мире. При конструировании сетевых систем часто используют линейные протоколы взаимодействия между агентами наиболее типичным из таких протокол является протокол достижения консенсуса [45],[92]. При использовании данного протокола консенсус наступит только за бесконечное время, хотя скорость сходимости будет экспоненциальной. Чтобы получить консенсус за конечное время необходимо использование протоколов другого типа. Впервые задача достижения консенсуса за конечное время была поставлена в [21]. Дальнейшее ее изучение можно найти в [52],[214]. Чен и Льюис в [19] предложили бинарный протокол для управления сетью из агентов, описывающихся уравнениями Лагранжа. К сожалению вопрос оптимальности по быстродействию в данной работе не затрагивался и оптимизации по параметрам предложенного закона управления не проводилось. Кроме того предложенные законы управления применимы только для двумерных систем, либо для многомерных систем, которые можно расщепить на необходимое число двумерных.

В данной работе предлагается протокол (распределенный закон управления) для построения формации за конечное время из агентов, динамика которых описывается уравнениями Лагранжа, причем каждый агент имеет внутренний контроллер. Все численные примеры будут рассмотрены только в самом тривиальном случае, когда агент является двойным или тройным интегратором, чтобы показать особенности управления большими системами.

Прежде чем перейти к описанию группы агентов, стоит более детально остановиться на разрывных законах управления. Напомним, что одной из первых работ, в которой можно найти синтез оптимального по быстродействию закона управления двойным интегратором является [148] и напечатана она в 1969. А вот функцию Ляпунова для замкнутой системы получили только в 2011 в [110]. Существует несколько модификаций данного закона управления [166],[214], которые являются квази оптимальными по быстродействию, но при этом обеспечивают выход в терминальное состояние за конечное время.

Ли и Маркус [61] синтезировали закон управления для сервомеханизма без учета внутренней динамики и ошибок управления. В [94] Пау предложила почти оптимальный по быстродействию закон управления для сервомеханизма с неопределенной внутренней динамикой. Таким образом в [94] был предложен квази оптимальный по быстродействию закон управления тройным интегратором с параметрическим возмущением и зашумленным входом, более того в данной работе показано, что предложенный закон управления будет оптимальным, если выбрать соответствующие параметры определенным образом и предположить, что данная система является идеальным интегратором третьего порядка и в ней нет параметрических возмущений. К сожалению, при использование авторами функции насыщения не позволяет достичь заданного состояния за конечное время при использовании предложенного закона управления в недельных условиях, однако попадание в некоторую область вокруг заданного конечного состояния гарантируется.

Стоит отметить работы [143] и [109], в которых предлагается использовать неявные функции Ляпунова для управления интегратором, при этом гарантируется конечное время достижения заданного состояния. К сожалению, применение данного метода, для большого числа агентов крайне затруднительно в силу огромной трудоемкости вычисления закона управления.

Цель данного раздела заключается в синтезе квазиоптимального по быстродействию закона управления группы агентов, где под агентами понимаются машины, роботы-манипуляторы, сервомеханизмы и т.д.

4.2.1. Синтез глобально устойчивого закона управления формацией, каждый агент которой описывается уравнением Лагранжа второго рода

Рассмотрим систему состоящую из п + 1 агента, причем номер п + 1 соответствует агенту-лидеру, а померами 1, п обозначены ведомые агенты. Динамика каждого агента описывается дифференциальным уравнением второго порядка

Мг(дг)дг + С(дг, дг)дг + А(дг, дг)дг + дг(дг) = Ц + иг + (4.35)

где через дг е Кт обозначены обобщенные координаты каждого агента; Мг(дг) е Мтхт, Мг (дг) У 0 определяет матрицу инерции агента, здесь и далее символ У означает положительную определенность матрицы; матрица Сг(дг,дг) е Щтхт соответствует силам Кориолиса; матрица Ог(дг,дг) е Мтхт определяет силы вязкости, вектор дг(дг) е Кт определяет гравитационные силы; величина шума и неучтенной динамики обозначена через вектор ф е Кт, который ограничен по абсолютной величине ||£г|| ^ ф < то. В правой части уравнения 4.35 присутствует групповое управление иг е Кт, которое будет определено позже и внутреннее управление уг е Кт которое известно. Для простоты изложения будем предполагать, что оно подчиняется следующему уравнению:

и1г = Сг(дг, д^ + Бг(дг, д^ + дг(дг). (4.36)

Цель работы синтезировать законы управления иг(Ь) для агентов г = 1,п, которые обеспечивают создание формации за конечное время и синхронное движение ее за лидером. Под формацией будем понимать группу агентов удовлетворяющую следующему определению.

Определение 15. Группа агентов называется формацией, если все агенты из этой группы ( лидер и ведомые ) имеют одинаковую скорость и заданное расстояние между собой и соседними агентами.

Топология формации описывается направленным орграфом (д(1д, Е, А) = О (V, Е, А) и О(V, Еь, В), в котором вершины уг соответствуют вершинам направленного графа О(V, Е, А) и обозначают ведомых агентов, а связи между г-агентом и ^'-агентом соответствует ребро (уг, ), наличие связи между г-ведомым агентом и лидером означает наличие ребра (уг, Уп+\) в орграфе С?(V, Е, А).

Здесь множество V = {уг,... ,уп,уп+1} содержит все вершины орграфа Сд( V, Е, А), а множество £ = ЕиЕь еVxVUVь XV содержит все ребра соответствующего орграфа.

Через А = [Е^]п+1 обозначена матрица смежности графа: Е^ = 1 если (Уi,Уj) е Е иначе а^ = 0. Матрица смежности орграфа О(V, Е, А) состоит из элементов матрицы смежности орграфа С?(V, Е, А), т.е. подчиняется уравнению а^ = а^, г = 1,п, ] = 1,п. Матрица смежности ОЕь, В) состоит из одного столбца (предполагается только один лидер) матрицы смежности графа ¿7(V, Е, А) Ьг = йг,п+1, г = 0,... ,п.

ля локального закона управления V1

следующей системе уравнений:

Подставляя выражение для локального закона управления в (4.35), приходим к

Яг = рг, МДд^рг = щ + г = 1, п. (4.37)

Система (4.37) описывает интегратор 2-го порядка с ограниченным возмущением на входе. Сделаем несколько важных предположений.

Предположение 1. Предположим, что динамика агента описывается двумерным дифференциальным уравнением

Яо = ро, МДдо)ро = По(яо,Ро), 1Ы1 < По, (4.38)

а в группе агентов существует хотябы один ведомый агент г, который получает полную информацию прямо от лидера. В терминах информационного графа это означает, что для г-го агента элемент матрицы смежности Ьг > 0. С другой стороны будем предполагать, что ни один агент не может повлиять на движение лидера, т.е. соответствующие элементы матрицы смежности всегда нули йга+1,, = 0, э = 1, п.

Предположение 2. Под информацией о лидере будем понимать возможность получения соответствующим ведомым агентом точной позиции я0, скорости Яо и ускорения лидера По.

Предположение 3. Для того чтобы создать заданную формацию нам необходимо задать желаемые расстояния от нашего лидера до ведомого агента. Т.к. пространство состояний каждого агента т мерное, нам необходимо определить матрицу в пространстве ^пхт, которую обозначим через "Р = [Д,]пт=1. Напомним, что число п означает общее число ведомых агентов в группе.

Задача 32. (Построение формации за конечное время) Путь ¿(У, Е, А) это связанный орграф структура, которого не меняется во времени. Матрица Р заданная не меняющаяся во времени матрица. Необходимо определить распределенный закон управления пг(£) для всех агентов г такой что, для любых начальных условий существует конечное время ¿* такое, что Яг(£) = Я0^) — Дг, Яг(£) = Яо(£) для всех г и момента времени £ ^ ¿*.

Для решения задачи 32, используется бинарный закон управления, который описан в [69] и в наших обозначениях он имеет вид ,рМг, Я0,Р0, По), где N1, г = 1, п число соседних

агентов у агента с индексом г, которое связано с матрицей смежности уравнением

N = {э : а, > 0}. (4.39)

Выберем закон управления каждым агентом в следующей форме:

щ = — М(Яг)а^ ^ а, ) + Ь sigп(Siо)), (4.40)

з'еМ

где а = щ/1г, к = Ьг + Е а»,-, Sij = (рг — р,) + в (Яг + Дг — Я, — Д, )[0'5], До = 0, в < 2(а — С)

С = М+ п0, а = ш1пг=1,га{аг/г}. Здесь и далее через Пг обозначено максимальное ускорение. Сформулируем основной результат данного раздела.

Теорема 18. Рассмотрим группу агентов содержащую лидера, в которой ведущий и ведомый агенты описываются соответствующими уравнениями (4-38) и (4.35). Далее рассмотрим замкнутую систему (4-38),(4-35) и (4-40), взаимодействие в которой осуществляется в соответствии с коммуникационным орграфом ¿/(V, Е, А). Пусть орграф является остовным деревом, тогда агенты создают формацию за конечное время в

соответствии с геометрией, заложенной в матрице V если матрица М(дг) подчиняется неравенству

аг >М*~ + ио, (4.41)

где М* = тах ||М-1(дг)||.

г=1,п

Доказательство теоремы 18. Обозначим через 11 множество агентов получающих информацию напрямую от лидера. Выберем агента из этого множества, т.е. г е 11. Тогда управление иг этим агентом записывается в следующей форме:

иг = -М(дг)агЬг sign(Siо), (4.42)

Определим отклонения в позиции и скорости между лидером и г-м агентом

4 = дг + Дг - до,г1р = рг - ро, г е ¡1, (4.43)

Подставляя (4.42) в (4.43), имеем

Щ = -аг sign(Siо) + М(дг)-1ф - ио(до,Ро). (4.44)

Систему (4.44) можно трактовать как управление разрывной связью интегратором второго порядка с ограниченным возмущением. В силу условия (4.41) согласно [166] будем иметь глобальную устойчивость нуля. Для оценки времени выхода в ноль, воспользуемся результатами из [214] и построим функцию Ляпунова в форме

я / ™2/4 , Б = 0

ад,*)= 0г/ , б

^0 , Бо = 0.

Здесь,

^ = XiV\фi\ - (zí)2/Е,

Ег = -usign(Бiо) + ^г, 1г = (М+ ио) sign(Бiо),

фг = Zi (Zi ) Хг = ^ц/^^)^ .

Из теоремы 3 [110], следует, что все агенты из 11 достигают синхронизации с лидером по скоростям за конечное время, которое оценивается величиной ¿о = + где =

тах^). (¿о)г = 2у/ВД(0)Т?(0)), ¿о = ттах(^о)г, (фг = 2в-1л/%(0) + zf(0)(í?)i + ¿?, % =

((¿о)г)2(М+ ио - аг) sign(Бi0(zЯ,(0), zf (0))). Обозначим через 12 множество агентов, которые получают информацию непосредственно от узлов в 11. Пусть к е 12. Поскольку ускорения всех агентов ограничены и отслеживаются за конечное время управление (4.42) обеспечивает глобальную устойчивость замкнутой системы, причем до = дг, ро = рг, г е 11 после Ь > ¿о и

ик

-usign(Бfc), Бк = грк + в^1)[о-5],к е ¡2. (4.45)

Управление (4.45) гарантирует устойчивость нуля для переменных (гя, гр) за конечное время. Повторяя рассуждения для всех кластеров, приходим к выводу, что все агенты создают формацию за конечное время в соответствии с геометрией, заложенной в матрице V. Теорема 18 доказана.

Замечание 29. Управление за конечное время (4.42) является оптимальным по быстродействию управлением для всех агентов г е 11, если шум ф наихудший, т.е. ф = ф sign(Бi0). Если ||ф|| < ф, то отслеживающее управление за конечное время (4.42) является квазиоптимальным по быстродействию управлением для всех агентов г е 11.

4.2.2. Синтез глобально устойчивого квазиоптимального по быстродействию управление формацией, каждый агент которой описывается тройным интегратором с ограниченным возмущением

В этом разделе мы рассматриваем возмущенный тройной интегратор

Я = Р, Р = а, а = и (я,р, а, £) + д(я,р,а,£)п, (4.46)

где f (•) и д(-) — неизвестные члены, удовлетворяющие следующим неравенствам

У(я,р,а,г) е К3 х Е^о :

и(я,р,а,Ь)\ ^ Г(д,р,а,1), (4.47)

0 <С1(я,р,а,г) ^ \д(я,р,а,г)1 ^ 02 (я,р,а,Ь),

Г(я,р,а,Ь), 01(я,р, а,£) и 02(я,р,а,Ь) известные функции. Цель состоит в том, чтобы получить устойчивый терминальный (т.е. с конечным временем) стабилизатор для системы (4.46) на основе идеи, аналогичной той, что была в [94], т.е. использования поверхности переключения квази-времени- оптимальное управление в качестве стабильной поверхности скольжения для реализации регулятора скользящего режима.

Теорема 1[8]. Пусть поверхность переключения определена как S(я,р,а) = я + к(р,а) и и — положительная произвольная константа, где

- 1 / а2 ч I

а г 1 / а \ 2 ра

к(р,а) = зи~2 + п2гт\п2р+ т) + и

где

а2

П2(р,а) = ^п(р +2и 81§п(а^.

Система (4.46)-(4.47) глобально стабилизируется за конечное время с помощью управления с обратной связью по состоянию.

п = — и + Г(!)+ ^ sigп(S), е > 0. (4.48)

Замечание 30. Закон управления, предложенный в [8] является хрупким для системы (4.46), т.к. он не может обеспечить устойчивый скользящий режим по поверхности разрыва, поскольку использует поверхность переключения от оптимального по быстродействию управления. Для создания устойчивого скользящего режима необходимо модифицировать поверхность переключения S(я,р,а) [94], как это было сделано в разделе 2.2.

Предположим, что функции Г (•), 0^), 02(^) ограничены, т.е. выполняются неравенства:

У(я,р,а,г) е К3 х Е^о : \Г(я,р,а,£)\ ^ Г,

02(я,р,а,Ь) ^ О2, 01 (я,р, а, £) ^ 0^

а систему (4.46), замкнутую управление (4.48) будем трактовать как дифференциальные включения согласно определению в разделе 1.3 вида

У(я,р,а,г) е К3 х Е^о: и(я,р,а,£) е [—Г,Г] (449)

д(я,р,а,г) е [01,02]. (. )

Согласно [61], можно интегрировать систему (4.46) назад во времени, начиная с конечной токи в пространстве состояний. Используя произвольное начальное состояние и

постоянное управление получаем кривую и поверхность, заданные параметрически в виде

Г±(г,и = тид) = [ид(тг3/б, ±г2/2, тг)т е к3,г > 0}

£±(М,и = г±) = [(±(ирв - г), (4 50)

ТUf s2 ± Ч-+ t2), ±Tts3 Т (3s2t + 3st2 + t3))J G IR3,t > 0,s> 0}.

Исключая времена t и s в (4.50), имеем следующие аналитические выражения для поверхности переключения H(•)

3 2 3

„, ч a3 г. ,тт тт. / a2 \ 2 pai

H(') = Щ + U2 ^p^^U2p +2^) + ^J ,

_ (_2 Uv + 2Ua „ (4.51)

где

«a> = UWür + Uq) " 3 a > 0

Uq <Up < 2Uq, Up < U,

(a|a|\

p +2U/ (4.52)

'Я '

и кривой Гц = Г+ и Г- и [0,0, 0} относительно фазовых переменных

а3

Ги(р,а) = [(д,р,а) е Е3 : д = — ,и2(р,а,ия) = 0}.

Замечание 31. функция Н(р,а,ия,ия), определенная (4.51), (4.52) совпадает с функцией в(а, <7, 7) [22] при а = д и ия = ир = аг = С 1и - Р.

Теорема 19. Пусть поверхность переключения определена как Бц(д,р,а,ир,ия) = д + Н(р,а,ир,ия) и и — положительная произвольная константа. Система (4.46), (4.49) глобально стабилизируется за конечное время с помощью управления с обратной связью по состоянию

Т1 + ф + р2

и =--+ + ^п(Бц), е > 0. (4.53)

Сф1

и управление (4.53) обеспечивает устойчивый режим скольжения по поверхности разрыва.

Доказательство теоремы 19. Доказательство этой теоремы аналогично доказательству теоремы 1. [8]. Теорема 19 доказана.

Замечание 32. Квазиоптимальное управление (4.53) является оптимальным по быстродействию управлением для системы (4.46), если ия = ир = и, е = 0 и функция f и д определяются как f = -Fsign(u) и д = Сф1.

4.2.3. Синтез глобально устойчивого закона управления формацией, каждый агент которой описывается уравнением Лагранжа второго рода с

внутренней динамикой

В этом разделе динамика каждого агента описывается уравнением Лагранжа (4.35) с локальным управлением (4.36).

Предположение 4. Предположим, что Мг(дг) = 1г + ДМг, где параметрическая матрица возмущений ДМг ограничена

ЦДМгЦ <Мг, Мг(дг) = 0.

Шум в правой руке (4.35) равен нулю, т.е. ^ = 0. Ускорение пг каждого агента является решением уравнения

щ = дг(яг,яг,ям)тг + Мяг, яг, Яг,г), (4.54)

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.