Кооперативные решения в теоретико-игровых моделях природопользования и инвестирования с динамическим обновлением информации тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Ван Цзэян
- Специальность ВАК РФ00.00.00
- Количество страниц 167
Оглавление диссертации кандидат наук Ван Цзэян
Введение
Глава 1 Новый класс кооперативных решений в дифференциальных играх с непередаваемой полезностью: Решение через минимальное расстояние при переговорах
1.1 Формулировка проблемы при переговорах
1.1.1 Модель проблемы при переговорах
1.1.2 Классические решения в торговле
1.2 Решение Мин расстояния
1.2.1 Определение решения для переговоров на Мин расстояния
1.2.2 Свойства переговорного решения с минимальным расстоянием
1.3 Обсуждение переговорного решения с минимальным расстоянием
1.3.1 Множество переговоров является не выпуклым
1.3.2 Расширение до N игроков
1.3.3 Теоретическое сравнение решений в переговорах
1.4 Решение минимального расстояния при переговорах в дифференциальной игре
1.4.1 Модель начальной дифференциальной реакции
1.4.2 Алгоритм переговоров по наименьшему расстоянию в дифференциальной реакции
1.4.3 Сохранение временной консистентности
1.5 Модель дифференциальной игры для извлечения невозобновляемых ресурсов
1.5.1 Дифференциальная игра
1.5.2 Классические решения в переговорах
1.5.3 Решение переговоров с минимальным расстоянием
1.6 Заключение к Главе
Глава 2 Кооперативные дифференциальные игры с непередаваемой полезностью и непрерывным обновлением
2.1 Модель дифференциальной игры с непрерывным обновлением
2.2 Парето оптимальные стратегии с непрерывным обновлением
2.3 Уравнение Гамильтона Якоби Беллмана с непрерывным обновлением
2.4 Согласованность подигры с непрерывным обновлением
2.5 Решение переговорной задачи минимального расстояния в дифференциальных играх с непрерывным обновлением
2.5.1 Находим максимальную пару переговоров "А*" в интервале
[м + Т]
2.5.2 Находим решение переговорной задачи минимального расстояния из оптимального множества
2.6 Дифференциальная игра добычи невозобновляемого ресурса
2.6.1 Начальная модель игры
2.6.2 Парето оптимальные стратегии с непрерывным обновлением в модели добычи невозобновляемых ресурсов
2.6.3 Согласованность решения Парето оптимальной подигры
2.6.4 Решение минимального расстояния в переговорах с непрерывным обновлением
2.7 Модель дифференциальных игр для инвестиций и ценообразования80
2.7.1 Кооперативный случай
2.7.2 В случае непрерывного обновления
2.8 Заключение главы
Глава 3 Кооперативные дифференциальные игры с передаваемой полезностью и непрерывным обновлением
3.1 Кооперативные стратегии и траектории с непрерывным обновлением
3.1.1 Кооперативные стратегии в игре с непрерывным обновлением
3.1.2 Кооперативная траектория в игре с непрерывным обновлением
3.2 Кооперативное решение с непрерывным обновлением
3.2.1 Кооперативные траектории в игровой модели на интервале
[м + Т]
3.2.2 Характеристическая функция на интервале [£,£ + Т]
3.2.3 Кооперативное решение на интервале
[М + Т]
3.2.4 Ядро как кооперативное решение на временном интервале
[М + Т]
3.2.5 Построение кооперативного решения в игре с непрерывным обновлением
3.3 Свойство временной согласованности кооперативного решения в игре с непрерывным обновлением
3.4 Форма характеристической функции в игровой модели с непрерывным обновлением
3.5 Кооперативное решение как функция характеристической функции
с непрерывным обновлением
3.6 Модель добычи невоспроизводимых ресурсов
3.6.1 Исходная игровая модель
3.6.2 Оптимальные кооперативные стратегии с непрерывным обновлением
3.6.3 Характеристическая функция на интервале \р,Ь + в]
3.6.4 Значение Шепли с непрерывным обновлением
3.6.5 ГОГ ядра с непрерывным обновлением
3.7 Дифференциальная игровая модель для инвестиций и ценообразования
3.7.1 Начальная игровая модель в кооперативном случае
3.7.2 Оптимальные кооперативные стратегии с непрерывным обновлением
3.7.3 Характеристическая функция на интервале \р,Ь + в]
3.7.4 Шепли с непрерывным обновлением
3.8 Заключение к Главе
Глава 4 Применение модели игры в низкоуглеродной цепочке с непрерывным обновлением
4.1 Исходная модель низкоуглеродной цепочки
4.2 Общая модель дифференциальной игры с непрерывным обновлением
4.2.1 Модель кооперативной игры с непрерывным обновлением
4.2.2 Равновесие Нэша в игре с непрерывным обновлением
4.3 Модель цепочки с низким углеродным содержанием с непрерывным
обновлением
4.3.1 Кооперативный сценарий
4.3.2 Некооперативный сценарий
4.4 Численное моделирование
4.5 Заключение главы
Заключение
Литература
Введение
Актуальность темы диссертационного исследования
Дифференциальные игры являются отраслью теории игр, которая сосредоточена на изучении динамических взаимодействий между несколькими принимающими решения участниками. В отличие от классической теории игр, которая рассматривает статические ситуации, дифференциальные игры анализируют, как эволюционируют действия игроков со временем. В этих играх игроки принимают решения на основе текущего состояния системы и ее эволюции, влияя как на свою собственную прибыль, так и на динамику системы. Ключевыми элементами являются игроки, состояния (описывающие текущее состояние системы), управляющие переменные (выборы, сделанные каждым игроком для влияния на эволюцию системы), динамика (математические модели, описывающие состояние и изменения), а также цели (игроки оптимизируют функции полезности на основе состояний и управления). Поиск оптимальных стратегий с учетом действий других игроков включает различные концепции решений, такие как равновесие Нэша, обратная связь, открытая петля и стратегии Ста-кельберга. Дифференциальные игры находят применение в экономике, инженерии, биологии и военной науке, предоставляя понимание сложных сценариев, где время и изменяющиеся состояния имеют ключевое значение.
Кооперативные игры в рамках теории игр сосредоточены на динамике сотрудничества между игроками, где формирование коалиций для достижения общих целей имеет приоритет перед личными интересами. В отличие от некооперативных игр, которые подчеркивают индивидуальное принятие решений, кооперативные игры исследуют, как игроки могут сотрудничать и справедливо распределить выгоды или бремя сотрудничества. В кооперативных играх ключевыми компонентами являются игроки, которые образуют коалиции - группы, объединенные в достижении общей цели. Функции прибыли или полезности оценивают стоимость, которую каждая коалиция создает на основе их коллек-
тивных результатов. Распределение этой стоимости между игроками является центральной проблемой в кооперативных играх. Характеристические функции определяют стоимость каждой возможной коалиции, обеспечивая основу для различных концепций решений. Примеры таких концепций включают значения Шепли, которые распределяют прибыль в соответствии с маржинальными вкладами игроков, и ядро, представляющее стабильные распределения, которые не могут быть улучшены какой-либо подгруппой игроков. Кроме того, решения по переговорам учитывают соображения справедливости и способствуют проведению переговоров между игроками. Кооперативные игры находят применение в различных областях, таких как экономика, политическая наука, операционное исследование и информатика. Они проливают свет на такие темы, как разделение ресурсов, формирование коалиций в системах голосования, проблемы распределения ресурсов, планирование, распределенные вычисления и коллективное принятие решений. В сущности, кооперативные игры предлагают понимание динамики сотрудничества, позволяя игрокам стремиться к взаимовыгодным результатам, решая вызовы сотрудничества и систематически способствуя справедливости.
Кооперативные дифференциальные игры сочетают принципы как кооперативных игр, так и дифференциальных игр, включая динамические взаимодействия между принимающими решения участниками, которые могут формировать коалиции для достижения совместных результатов, учитывая при этом эволюцию системы со временем. Ключевыми элементами являются игроки, состояния, описывающие текущее состояние системы, управляющие переменные, влияющие на динамику системы, динамика, описывающая изменения состояния, а также функции прибыли или полезности, оценивающие результаты коалиций. Кооперативные решения сосредоточены на распределении общей стоимости, созданной с помощью сотрудничества между игроками или коалициями, с учетом совместных стратегий управления. Анализ направлен на поиск оптимальных стратегий для игроков или коалиций, максимизирующих свои соответствующие цели, с учетом действий других игроков. Концепции решений сочетают идеи из кооперативных и дифференциальных игр, адаптируя такие концепции, как значение Шепли, ядро или решения по переговорам, чтобы учитывать динамическую природу игры. Концепции решений сочетают идеи из кооперативных и дифференциальных игр, адаптируя такие концепции, как
значение Шепли, ядро или решения по переговорам, чтобы учитывать динамическую природу игры. В заключение, кооперативные дифференциальные игры позволяют углубить наше понимание стратегического сотрудничества между коалициями, позволяя им адаптировать стратегии управления со временем для достижения взаимной выгоды и эффективного решения сложных динамических задач.
Таким образом, исследование кооперативных дифференциальных игр с непрерывным обновлением показало многообещающие перспективы в различных областях, особенно в мультиагентных системах, робототехнике и теории игр. Кооперативные дифференциальные игры представляют собой рамки теории игр, используемые для изучения взаимодействия между несколькими принимающими решения участниками в динамической среде. Традиционные модели дифференциальных игр обычно являются дискретными по времени, где игроки принимают решения на основе прошлых действий и наблюдаемой информации на каждом шаге времени. Однако в реальных сценариях окружающая среда часто подвергается непрерывным изменениям, что делает непрерывное обновление в кооперативных дифференциальных играх важной областью исследований. Непрерывное обновление относится к способности агентов адаптировать свои стратегии в реальном времени на основе изменяющейся динамики окружающей среды. Кооперативные дифференциальные игры фокусируются на сценариях, где несколько агентов сотрудничают для достижения общей цели, часто включая сложные взаимодействия и координацию между агентами. Путем внедрения механизмов непрерывного обновления, эти игры позволяют агентам динамически корректировать свои стратегии, что приводит к более эффективным и адаптивным решениям. Непрерывное обновление может улучшить устойчивость, стабильность и сходимость свойств кооперативных дифференциальных игр. Непрерывное обновление позволяет агентам реагировать на изменения в окружающей среде, управлять неопределенностями и адаптироваться к действиям других агентов. Эта гибкость особенно актуальна в реальных сценариях, где условия могут меняться быстро или когда необходимо поддерживать сотрудничество несмотря на неопределенности. Путем сочетания концепций из теории управления, оптимизации и теории игр исследователи стремятся разработать эффективные алгоритмы и рамки для кооперативных дифференциальных игр с непрерывным обновлением. Эти достижения имеют потенциал
для улучшения процессов принятия решений, оптимизации распределения ресурсов, облегчения сотрудничества и решения сложных проблем, связанных с взаимодействием нескольких агентов. Несмотря на перспективы этого исследования, важно отметить, что данная область все еще развивается, и существуют некоторые вызовы и ограничения, которые предстоит преодолеть. Дальнейшие исследования и разработки требуются для совершенствования существующих подходов, изучения новых техник и их применения в различных реальных приложениях. Данная диссертация направлена на разработку теоретических моделей оптимального поведения и Парето-оптимальных траекторий в кооперативных дифференциальных играх с переносимой полезностью и непереносимой полезностью. Кроме того, было предложено новое решение по переговорам, называемое решением минимального расстояния, и применено к дифференциальным играм.
Степень разработанности проблемы в литературе
Теория дифференциальных игр является важной отраслью современной теории игр, которая продолжает развиваться и эволюционировать на протяжении последних нескольких десятилетий. Через установление фундаментальных теорий, улучшение методологий и расширение в различные области применения, дифференциальные игры обеспечивают надежные математические инструменты и практические приложения для описания и анализа процессов контроля конфликта. Исследователи продолжают стремиться разработать более точные модели и методы решения, чтобы лучше понять процессы контроля конфликта и применить теорию и методы дифференциальных игр в областях, таких как экономика, экология и управление. Истоки дифференциальных игр можно проследить до 1950-х годов, когда исследователи стремились расширить принципы теории оптимального управления для анализа динамических взаимодействий в стратегическом принятии решений. Первоначальная работа Руфуса Айзекса [1] в конце 1950-х годов заложила основы теории дифференциальных игр. Он представил концепцию дифференциальных игр преследования-уклонения, где два игрока участвуют в ситуации преследования с противоречивыми целями. Работа Айзекса была сосредоточена на простых линейных системах и предоставила понимание равновесных стратегий и траекторий для различных сценариев преследования-уклонения. В 1960-х годах Ричард Беллман [2] и другие внесли значительный вклад, формулировав уравнение Гамильтона-Якоби-Беллмана
(ЫЛБ). Это уравнение предоставляет мощную математическую основу для решения динамических задач оптимизации, включая дифференциальные игры. Российские ученые внесли значительный вклад в область дифференциальных игр на протяжении всей ее истории. Николай Н. Красовский [3, 4] разработал фундаментальные концепции и принципы в дифференциальных играх, его исследования сфокусированы на оптимальных стратегиях управления, анализе устойчивости и равновесных решениях в дифференциальных играх. Основы теории оптимального управления и разработка принципа максимума, который имеет применение как в оптимальном управлении, так и в дифференциальных играх, были проведены Леонидом С. Понтрягиным [6, 7] и его сотрудниками. Его работа предоставила важные математические инструменты для анализа динамических взаимодействий и поиска оптимальных стратегий в дифференциальных играх. Б.Н. Пшеничный [5], Л.А. Петросян [8, 9] своей работой сыграли важную роль в развитии теории и приложений дифференциальных игр. Они заложили основу для понимания стратегических взаимодействий в динамических системах и предоставили ценные идеи в процессах принятия решений в различных областях науки. В 1970-х годах внимание было обращено на дифференциальные игры с неполной информацией. Эти игры учитывают идею о том, что игроки имеют ограниченное знание о состоянии системы, с которой они взаимодействуют. Майкл Шубик и Патрик Саппес [10, 11, 12, 13] внесли свой вклад в это направление, изучая игры с неполной или асимметричной информацией. В 1980-х годах возник интерес к стохастическим дифференциальным играм, в которых в систему динамики была введена случайность или неопределенность. Исследователи разработали модели, которые явно учитывают стохастические процессы, такие как броуновское движение, для учета сложностей реального мира. Иоаннис Карацас [14], Авнер Фридман, Стивен Шрив [15], Уильям Сад-дерт [16] внесли значительный вклад в стохастические дифференциальные игры. Они сосредоточили свое внимание на теории стохастического управления и ее применении к различным задачам динамического принятия решений, включая децентрализованное управление, мультиагентные системы и приложения в экономике и инженерии.
Также значительным направлением исследований стали кооперативные дифференциальные игры, фокусирующиеся на ситуациях, где игроки сотрудничают вместо того чтобы конкурировать. Принципы кооперативной игровой теории
были расширены на динамические среды, что позволило анализировать стратегические взаимодействия между сотрудничающими принимателями решений. Тамер Башар [17, 18, 19] внес значительный вклад в изучение кооперативных дифференциальных игр. Он работал над кооперативным управлением, формированием коалиций и анализом устойчивости в мультиагентных системах, среди прочих тем. Эхуд Калай [22, 21, 20] исследует концепции кооперативного решения, такие как ядро и значения Шепли, которые имеют значение для кооперативных дифференциальных игр. Работа Калая исследует справедливость и устойчивость кооперативных результатов. Жорж Заккур [23, 24] является известным ученым в области кооперативной игровой теории и динамической оптимизации. Его исследования фокусируются на моделировании и анализе кооперативных дифференциальных игр в областях, таких как экологическая экономика, управление ресурсами и маркетинг. Работы Заккура позволяют получить представление о разработке кооперативных стратегий, которые уравновешивают индивидуальные и коллективные цели. Вклад Л.А. Петросяна и Ян-га, Дэвида WK [26, 29, 27, 30, 28, 31] дополнительно расширил наше понимание кооперативной игровой теории и ее применения к дифференциальным играм. Их исследования пролили свет на формирование и устойчивость коалиций, распределение вознаграждений, а также динамику и оптимизацию кооперативных стратегий.
Класс дифференциальных игр с непрерывным обновлением имеет некоторые сходства с теорией Модельного Предиктивного Управления (Model Predictive Control, MPC), которая разработана в рамках численного оптимального управления [32, 33, 34, 35]. В подходе MPC текущее управляющее воздействие достигается путем решения проблемы оптимального управления с конечным горизонтом на каждом моменте выборки. Для линейных систем существует решение в явном виде [36, 37]. Однако, в общем случае подход MPC требует решения нескольких задач оптимизации. Ещё одна связанная серия работ соответствует классу стабилизирующего управления [38, 39, 40, 41]; здесь рассматриваются аналогичные подходы к задачам оптимального управления с линейно-квадратичными критериями. Однако в текущей работе и статьях о подходе непрерывного обновления основная цель отличается: моделирование поведения игроков при непрерывном обновлении информации о игре в течение времени. Следующие работы тесно связаны с подходом непрерывного обновле-
ния: [42, 43, 44, 45, 46, 47]. Одна из этих работ, [44], фокусируется на подходе "движущегося горизонта"для моделей динамических игр. В этой работе представлен новый концепт решения на основе подхода "движущегося горизон-та"для бесконечно-горизонтальных дифференциальных игр с ненулевой суммой. В статье рассматривается случай линейно-квадратичной задачи с открытыми и замкнутыми стратегиями. Еще одна интересная статья, [42], исследует концепцию равновесия как для игр с дискретным временем, так и для игр с непрерывным временем при различных (симметричных и асимметричных) способах игры. В статье [43] была рассмотрена временно-изменяющаяся макроэкономическая модель, где определенные параметры колебались экзогенно на основе цепи Маркова. В статье [45] была разработана теоретическая основа для принятия решений с применением методики "rolling hoгizon"(постепенно сдвигающегося горизонта), что является общей практикой в бизнесе. Основная идея подхода "rolling horizon"заключается в том, что ценность методов с постепенно сдвигающимся горизонтом обусловлена затратами на прогнозирование будущего. Подобно подходу непрерывного обновления, статьи [46] и [47] исследовали проблему скользящих планировочных горизонтов в повторяющихся играх. В классе дифференциальных игр с непрерывным обновлением были упомянуты следующие статьи: [48, 49, 50, 51, 52, 53, 54, 55, 57, 56], где предполагалось, что процесс обновления эволюционирует непрерывно со временем. Впервые класс игр с непрерывным обновлением был рассмотрен в статьях [48] и [49]. В статье [48] авторы получили систему уравнений Гамильтона-Якоби-Беллмана для равновесия Нэша с обратной связью в контексте непрерывного обновления. Статья, указанная как [49], фокусировалась конкретно на классе автономных линейно-квадратичных дифференциальных игр с непрерывным обновлением. Исследование акцентировало внимание на рассмотрении обратной связи стратегий в данном контексте. Важным вкладом этих исследований является то, что авторы предоставили доказательство сходимости равновесных стратегий Нэша и соответствующих им траекторий в сценариях с динамическим обновлением, а также с непрерывным обновлением. Это открытие подчеркивает устойчивость и эффективность данных стратегий в процессах принятия динамических решений с непрерывными обновлениями. В последующей статье, а именно [51], основное внимание было сосредоточено на классе кооперативных дифференциальных игр с передаваемой полезностью. Авторы изу-
чили эту область, используя уравнения Гамильтона-Якоби-Беллмана. В статье были представлены различные теоремы, связанные с построением характеристической функции при непрерывном обновлении. Кроме того, авторы ввели и доказали свойство сильной временной последовательности для кооперативного решения в контексте непрерывного обновления. Еще один значительный результат, касающийся уравнений Гамильтона-Якоби-Беллмана с непрерывным обновлением, был достигнут в исследовании кооперативных дифференциальных игр с непередаваемой полезностью, как обсуждалось в статье [52]. В данной статье были представлены результаты, специфичные для этого класса игр, что ещё больше расширило понимание и инсайты в кооперативное поведение и стратегии при непрерывном обновлении. Статья, упомянутая как [56], проводит всестороннее исследование модели игры на добычу ресурсов, охватывающее как кооперативные, так и некооперативные игровые модели. В данном исследовании представлены глубокий анализ различных аспектов, связанных с добычей ресурсов, что проливает свет на динамику и стратегии, используемые в кооперативных и некооперативных условиях. В статье [53] авторы получили явную форму равновесия Нэша для дифференциальной игры с непрерывным обновлением, используя максимум-принцип Понтрягина. Этот подход позволил более полно понять оптимальные стратегии и поведение в контексте непрерывного обновления. Аналогично, в статье [57] акцент делается на изучении кооперативной среды, с использованием максимум-принципа Понтрягина. С помощью этого принципа исследование углубляется в анализ кооперативных стратегий и поведения в рамках дифференциальной игры. Дополнительные статьи, посвященные классу линейно-квадратичных дифференциальных игр с непрерывным обновлением, включают: В статье [50] акцент был сделан на стратегиях равновесия Нэша с открытой петлей обратной связи. Исследование предоставляет представление об оптимальных стратегиях в этом классе игр с учетом непрерывного обновления. Еще одна статья, а именно [54], исследовала кооперативную среду в рамках характеристической функции, используя непрерывное обновление. Исследование представляет анализ кооперативных стратегий и их последствий в данном контексте. Эти статьи вносят свой вклад в развивающуюся область исследований линейно-квадратичных дифференциальных игр с непрерывным обновлением, предоставляя ценные представления о различных аспектах оптимальных стратегий и кооперативного поведения. В самой последней статье, свя-
занной с линейно-квадратичными играми с непрерывным обновлением, а именно [55], акцент был сделан на изучении неавтономного случая. Это означает, что модель обновления зависит от текущего времени t. В данном исследовании была исследована динамика и стратегии в этом неавтономном контексте, предоставляя представление о том, как игра развивается со временем. Кроме того, в статье были представлены результаты сходимости, специально адаптированные для неавтономного случая, что способствует более глубокому пониманию поведения и концепций равновесия в линейно-квадратичных играх с непрерывным обновлением.
Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Теоретико-игровые задачи со случайной продолжительностью2016 год, кандидат наук Громова, Екатерина Викторовна
Решения кооперативных стохастических игр с трансферабельными выигрышами2019 год, доктор наук Парилина Елена Михайловна
Оптимальное управление сложными системами в задачах эколого-экономического менеджмента2025 год, кандидат наук Ву Ийлунь
Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами2016 год, доктор наук Реттиева Анна Николаевна
Динамические сетевые игры2020 год, доктор наук Седаков Артем Александрович
Введение диссертации (часть автореферата) на тему «Кооперативные решения в теоретико-игровых моделях природопользования и инвестирования с динамическим обновлением информации»
Цели работы
Целью данной диссертации было развитие области кооперативных дифференциальных игр путем разработки моделей и алгоритмов для оптимальных стратегий, предложения нового решения по согласованию интересов, изучения свойств кооперативных решений при непрерывном обновлении и демонстрации практических применений через симуляции.
Одной из целей данной диссертации было разработать теоретические модели для оптимального поведения и траекторий Парето-оптимальности в кооперативных дифференциальных играх, учитывая как передаваемую, так и непередаваемую полезность. Это включало построение оптимальных условий для кооперативных стратегий с непрерывным обновлением и разработку алгоритмов для связанных траекторий, характеристической функции и кооперативного решения с непрерывным обновлением. Еще одной целью диссертации было предложить новое решение по согласованию интересов, названное "решением минимального расстояния и применить его к дифференциальным играм. Данное решение вводит уникальный подход к разрешению конфликтов в кооперативных дифференциальных играх, предоставляя новые возможности для достижения взаимовыгодных результатов. Кроме того, диссертация углубилась в исследование особых свойств, связанных с кооперативными решениями при непрерывном обновлении, с фокусом на временной последовательности и согласованности по-дигры. Анализ этих свойств предоставляет ценные представления о динамике и устойчивости кооперативного поведения в условиях непрерывного обновления, расширяя наше понимание кооперативных стратегий в динамических средах. Кроме того, диссертация стремилась разработать приложение для подхода непрерывного обновления и продемонстрировать конкретные результаты симу-
ляции. Это включало практическую реализацию разработанных теоретических моделей и методов на реальных сценариях, демонстрируя их эффективность и выявляя потенциальные области применения. Предоставляя конкретные примеры и результаты симуляции, диссертация стремилась подтвердить применимость и полезность подхода непрерывного обновления в практических условиях.
Основные научные результаты
Поставленная цель достигается посредством выполнения следующих задач, изложенных в диссертации:
• Формулирование теоретических моделей для кооперативных дифференциальных игр с непрерывным обновлением, с учетом как непередаваемой [52, 60], так и передаваемой полезности [51, 60, 58]; (личный вклад автора диссертации составляет не менее 70%)
• Разработка оптимальных условий для кооперативных стратегий с непрерывным обновлением, чтобы определить оптимальное поведение и траектории Парето-оптимальности [52, 86]; (личный вклад автора диссертации составляет не менее 75%)
• Построение алгоритмов для связанных траекторий, характеристической функции и кооперативного решения при непрерывном обновлении для облегчения практической реализации [58, 51]; (личный вклад автора диссертации составляет не менее 70%)
• Предложение решения по принципу минимального расстояния как уникального подхода к разрешению конфликтов в кооперативных дифференциальных играх [60, 87]; (личный вклад автора диссертации составляет не менее 90%)
• Исследование специальных свойств кооперативных решений с непрерывным обновлением, таких как временная согласованность и согласованность подигры, для получения представлений о динамике и стабильности кооперативного поведения [60]; (личный вклад автора диссертации составляет не менее 70%)
• Разработка и реализация приложения, использующего подход непрерывного обновления для демонстрации его эффективности в практических сце-
нариях [60, 52]; (личный вклад автора диссертации составляет не менее 75%)
• Представление конкретных результатов моделирования для иллюстрации практических последствий и потенциальных приложений разработанных моделей и методов в реальных условиях [59]. (личный вклад автора диссертации составляет не менее 90%)
Научная новизна
Самым значительным инновационным моментом в данной работе является расширение модели дифференциальной кооперативной игры на контекст непрерывного обновления. В отличие от предыдущего подхода, который рассматривал принятие решений только на протяжении непрерывного временного интервала, новизна этого исследования заключается в возможности участников принимать решения в режиме реального времени на основе информации, полученной из текущего времени и состояния. Данная модель непрерывного обновления приближает процесс игры к реальным приложениям и предоставляет участникам более высокую гибкость и точность в принятии решений. Таким образом, данная работа предлагает новый теоретический фреймворк для кооперативных игровых проблем в реальном мире, внося значительные инновации в исследования и практическое применение в связанных областях.
Одним из значительных вкладов диссертации является представление и исследование специализированных кооперативных решений, разработанных специально для игр с непрерывным обновлением. Эти настроенные кооперативные решения предлагают новое видение и уникальные идеи о кооперативном поведении в динамических средах. Учитывая аспекты непрерывного обновления, диссертация предоставляет более точное представление о реальных сценариях, позволяя лучше понять, как сотрудничество эволюционирует со временем. Через изучение этих специализированных кооперативных решений исследование проливает свет на сложную динамику и стратегии, используемые участниками в играх с непрерывным обновлением. Этот глубокий анализ позволяет более глубоко понять процессы принятия кооперативных решений и факторы, влияющие на кооперативное поведение в изменяющихся контекстах. В целом, введение и исследование этих специализированных кооперативных решений значительно способствует развитию теории кооперативных игр, предоставляя новые
представления о кооперативном поведении в контексте непрерывного обновления. Диссертация подробно исследует свойства, связанные с кооперативными решениями в контексте непрерывного обновления, предлагая всестороннее исследование, которое включает анализ временной последовательности и согласованности подигры. Согласованность со временем (time consistency) относится к свойству, при котором кооперативное решение остается неизменным при расширении или модификации игры с течением времени. Анализируя согласованность со временем в рамках непрерывного обновления, диссертация исследует, как кооперативные решения развиваются и адаптируются по мере прогресса игры. Этот анализ предоставляет ценные представления о стабильности и надежности кооперативных решений в динамической среде. Согласованность подигры (subgame consistency), с другой стороны, относится к свойству, при котором кооперативное решение остается оптимальным даже при рассмотрении только подмножества исходной игры. В диссертации изучается согласованность поди-гры в контексте непрерывного обновления, исследуя, как кооперативные решения держатся на определенных этапах или подиграх в рамках общей игры. Это исследование проливает свет на устойчивость и оптимальность кооперативных стратегий в изменяющихся средах.
Обширное исследование этих свойств, связанных с кооперативными решениями при непрерывном обновлении, обогащает наше понимание кооперативного поведения, формирования стратегий и процессов принятия решений. Оно способствует разработке более эффективных кооперативных решений и улучшает практическое применение теории кооперативных игр в реальных сценариях с непрерывным обновлением.
Диссертация вносит прорывной вклад, предлагая новое решение по согласованию интересов, которое придает свежий взгляд на разрешение конфликтов в кооперативных дифференциальных играх. Этот инновационный подход предлагает новую рамку для переговоров и достижения взаимовыгодных результатов в кооперативных средах. Введение этого новаторского решения по согласованию интересов открывает новые возможности для понимания и решения конфликтов в контексте кооперативных дифференциальных игр, что в конечном итоге усиливает эффективность сотрудничества и процессов принятия решений.
Методы исследования
В данной диссертации автор использует различные методы исследования для
изучения предметной области. Автор конструирует дифференциальные игры и анализирует подигры в них, предоставляя рамки для изучения динамического принятия решений в конкурентных сценариях. Они исследуют кооперативные стратегии и используют характеристические функции для анализа поведения и результатов кооперативных взаимодействий. Исследована согласованность временных и подигровых решений в кооперативных решениях, а также процедура распределения импутаций, широко используемая в теории кооперативных игр. Автор также применяет концепции теории оптимального управления, такие как динамическое программирование и уравнение Гамильтона-Якоби-Беллмана. Эти инструменты позволяют анализировать оптимальные стратегии и принятие решений в динамических средах. В диссертации используются математические методы анализа для изучения сходимости как кооперативных, так и некооперативных стратегий и траекторий. Этот анализ предоставляет понимание стабильности и эффективности различных подходов к принятию решений. Кроме того, автор исследует проблему торговли, рассматривая различные варианты решений при переговорах. Более того, концепция временной согласованности изучается в контексте торговли, обеспечивая устойчивость достигнутых договоренностей со временем.
Теоретическая и практическая значимость
Исследовательские результаты, представленные в данной диссертации, имеют как теоретическое, так и практическое значение в области дифференциальных кооперативных игр. В работе предлагается новое кооперативное решение, которое применяется в области дифференциальных игр, что приводит к разработке комплексного алгоритма. Основное внимание уделяется теории дифференциальных кооперативных игр в условиях непрерывного обновления.
С теоретической точки зрения, данное исследование вносит свой вклад, рассматривая оптимальные условия как для передаваемых, так и для непередаваемых полезностей в дифференциальных кооперативных играх с непрерывным обновлением. Предоставляя соответствующие кооперативные решения, данное исследование улучшает наше понимание теории кооперативных игр в динамических средах.
В дополнение к своим теоретическим результатам, это исследование имеет значительное практическое значение. Оно рассматривает процессы управления конфликтами в реальной жизни, которые постоянно развиваются со временем,
где участникам часто не хватает полной информации и они сталкиваются с трудностями в эффективном использовании доступной информации. Введение непрерывных игровых моделей, включающих обновление информации, имеет первостепенное значение при моделировании широкого спектра инженерных, экологических и социо-экономических систем.
Путем анализа динамики различных систем принятие решений можно получить практическую пользу из результатов исследования. Например, инженеры могут использовать непрерывную игровую модель для улучшения стратегий управления в сложных системах, таких как поток движения транспорта, электросети и цепочки поставок. Это не только повышает эффективность этих систем, но и способствует общей устойчивости. Кроме того, экологические исследователи могут применять модель для анализа динамики экосистем и разработки эффективных стратегий сохранения, способствуя охране окружающей среды.
Кроме того, введение нового решения при переговорах в данном исследовании предлагает принимающим решения улучшенные результаты переговоров. Учет непрерывного обновления информации, что является важным аспектом динамических систем реальной жизни, позволяет принимающим решения получать точную и актуальную информацию во время переговоров. В результате достигнутые соглашения становятся более устойчивыми и устойчивыми со временем, принесая пользу всем заинтересованным сторонам.
Практическое применение расширяется не только на инженерные и экологические системы, но также и на социально-экономические системы. Непрерывная игровая модель может эффективно моделировать сценарии, такие как переговоры, формирование альянсов и распределение ресурсов между конкурирующими субъектами. Ее способность непрерывного обновления информации дает принимающим решения ценный инструмент для анализа реальных ситуаций. Путем адаптации стратегий в зависимости от изменяющихся обстоятельств принимающие решения могут достичь оптимальных результатов в этих сложных социально-экономических системах.
В заключение, теоретический вклад данной диссертации продвигает наше понимание теории кооперативных игр в условиях непрерывного обновления. Практическая значимость заключается в потенциале применения результатов исследования для принятия решений в различных областях, включая инжене-
рию, экологию и социально-экономические сферы. Введение непрерывной игровой модели с обновлением информации позволяет принимающим решения получать точную и актуальную информацию, что помогает им принимать обоснованные решения и эффективно управлять динамическими системами
В главе 1 было предложено новое кооперативное решение, отличное от традиционных решений при переговорах, и оно было применено в области дифференциальных игр. Был разработан комплексный алгоритм, учитывающий концепцию временной согласованности в рамках дифференциальной игры.
С теоретической точки зрения, данное исследование вносит свой вклад, представляя новые кооперативные решения, отклоняющиеся от традиционных подходов в теории кооперативных игр. Предложенные решения специально разработаны для дифференциальных игр и предоставляют понимание динамики и условий равновесия таких игр. Рассмотрение аспекта временной согласованности расширяет наше понимание теории кооперативных игр в динамических средах.
Кроме того, исследование расширяется на игры с непередаваемой полезностью при непрерывном обновлении условий в главе 2. Получены оптимальные условия для сотрудничества, сохраняя при этом учет временной согласованности в подиграх. Эти результаты вносят свой вклад в теоретическое развитие кооперативных дифференциальных игр, улучшая наше знание о играх с непередаваемой полезностью и их динамике.
Глава 3 углубляется в область кооперативных дифференциальных игр с передаваемой полезностью при непрерывном обновлении условий. В ходе исследования изучаются различные концепции, включая кооперативные стратегии, кооперативную траекторию, характеристические уравнения, кооперативные решения, процедуру распределения импутаций (Imputation Distribution Procedure - IDP) и множества выделения ресурсов. Это исследование значительно обогащает наше понимание кооперативных решений в контексте дифференциальных игр с непрерывным обновлением.
Практическая значимость данного исследования заключается в его применении к реальным сценариям. Через сравнительный анализ кооперативных и некооперативных случаев при условии непрерывного обновления, глава 4 предоставляет ценные практические выводы о потенциальных последствиях непрерывного обновления для принятия кооперативных решений. Путем тщатель-
ного изучения этих сценариев данное исследование скромно стремится внести свой вклад в существующую базу знаний в этой области. Анализ практических примеров улучшает наше понимание динамики и результатов кооперативного поведения в реалистических ситуациях.
Путем сокращения пропасти между теорией и практикой, данная диссертация предлагает ценное руководство для принимающих решения и практиков. Разработанные кооперативные решения и алгоритмы могут быть применены в различных областях, таких как экономика, социальные науки, инженерия и управление. Это позволяет принимающим решения информированно выбирать, формулировать эффективные стратегии и достигать желаемых результатов в динамических кооперативных средах.
В заключение, данная диссертация вносит значительный вклад в теоретическое развитие кооперативных дифференциальных игр. Предложенные новаторские кооперативные решения, учитывающие временную согласованность и условия непрерывного обновления, расширяют наше понимание теории кооперативных игр в динамических средах. Более того, практические последствия данного исследования проявляются в его применимости к реальным сценариям, предоставляя ценные практические выводы для принимающих решения и практиков в различных областях.
Краткое описание работы
Работа организована в несколько разделов, начиная с Введения, которое задает контекст исследования. После Введения следуют четыре главы, каждая из которых рассматривает различные аспекты темы. Первые три главы углубляются в основы, предоставляя необходимые фоновые знания через обозначения и определения. Также они содержат подробное описание модели, использованной в исследовании, а также теоретические результаты. Для улучшения понимания представлены численные примеры, иллюстрирующие рассматриваемые концепции. Каждая глава завершается кратким обзором, в котором подводятся ключевые результаты и выводы, представленные в работе. Четвертая глава использует другой подход, представляя приложение, связанное с низкоуглеродной эпохой. В этой главе акцент смещается на сравнение кооперативного и некооперативного принятия решений в условиях непрерывного обновления. Анализ практических примеров помогает более глубоко понять, как функционирует кооперативное поведение в реалистических сценариях. Эта глава предлагает цен-
ные идеи о последствиях непрерывного обновления для кооперативного принятия решений. Наконец, диссертация завершается разделом "Заключение где подводятся итоги основных результатов и их значимости. Кроме того, включена Библиография, где указаны источники, на которые ссылается работа.
Глава 1 диссертации углубляется во введение и исследование нового переговорного решения, которое применяется в дифференциальных играх. Глава начинается с представления начальной модели дифференциальной игры в разделе 1.1, предоставляя основу для дальнейших обсуждений. В разделе 1.2 автор начинает исследование классических решений по согласованию, таких как решение Нэша, решение Калая-Смородинского и решение Эгалитарное. После всестороннего анализа этих существующих решений автор предлагает новое переговорное решение, названное "решение минимального расстояния". Новое решение направлено на то, чтобы обеспечить максимально возможное приближение полезности выигрышей всех игроков к их потенциальным максимальным выигрышам. Геометрически это можно визуализировать как поиск ближайшей точки к пересечению максимальных выплат, доступных всем игрокам. Свойства решения минимального расстояния подробно обсуждаются в разделе 1.2. К ним относятся уникальность, Парето-оптимальность, симметричность, инвариантность относительно масштаба и строгая индивидуальная рациональность. Автор подчеркивает значимость этих свойств для обеспечения справедливости и эффективности в переговорном процессе. Переходя к разделу 1.4, в данной главе исследуются интересные сценарии, связанные с новым переговорным решением. Например, автор рассматривает случаи, когда множество переговорных решений не является выпуклым, что добавляет сложности в процессе переговоров. Кроме того, рассматривается расширение решения для учета п игроков, что расширяет его применимость для более широкого спектра сценариев. Для обеспечения контекста и сравнения решение утилитариста, еще одно существующее переговорное решение, рассматривается наряду с переговорным решением минимального расстояния. Раздел 1.5 фокусируется на применении нового переговорного решения в дифференциальных играх. Автор представляет полный алгоритм использования этого решения в рамках дифференциальной игровой модели. Кроме того, определяется концепция временной согласованности, подчеркивая важность поддержания последовательного принятия решений на протяжении всей игры. В разделе 1.6 диссертация исследует модель
дифференциальной игры по добыче ресурсов. Автор исследует, как решение минимального расстояния проявляет себя по сравнению с классическими переговорными решениями, когда оно применяется к этой конкретной модели. Для поддержки аргументов и теорий, представленных в работе, проводятся численные симуляции, предоставляющие эмпирические доказательства эффективности предложенного решения. В заключительном разделе 1.7 первой главы представлен краткий обзор, повторяющий основные моменты, обсуждаемые в работе. Это подготавливает почву для последующих глав, где будет проводиться дальнейшее исследование и анализ.
В главе 2 диссертации исследуется фундаментальный вопрос в теории кооперативных дифференциальных игр с непередаваемой полезностью и непрерывным обновлением. В разделе 2.1 представлена модель дифференциальной игры с непрерывным обновлением. Эта модель является основой для исследования оптимального поведения, проектирования траекторий Парето-оптимальности, вычисления соответствующих решений и анализа согласованности подигровых состояний в условиях непрерывного обновления. Раздел 2.2 фокусируется на предоставлении подробного алгоритма применения нового переговорного решения, представленного в главе 1, к дифференциальным играм с непрерывным обновлением. Этот алгоритм служит практическим руководством и предлагает пошаговые инструкции для реализации нового решения в конкретном контексте непрерывного обновления. В разделе 2.3, на основе алгоритма и обсуждений, представленных в главе, дополнительно расширяется понимание и применение кооперативного поведения в дифференциальных играх с непередаваемой полезностью. Здесь представлены ценные идеи о достижении оптимальности и согласованности в таких игровых ситуациях. Наконец, раздел 2.4 завершает Главу 2, подводя итоги основных результатов и вклада, сделанных в течение всей главы.
Глава 3 диссертации углубляется в область кооперативных дифференциальных игр с передаваемой полезностью и непрерывным обновлением. В этой главе рассматриваются различные аспекты, связанные с конструированием кооперативных стратегий и разработкой соответствующих кооперативных решений в контексте непрерывного обновления. В разделе 3.1 главы рассматриваются проблемы, возникающие в связи с непрерывным обновлением. Автор обсуждает сложности определения кооперативного поведения игроков и конструирования
кооперативных траекторий, учитывая этот динамический процесс обновления. Раздел ставит основу для дальнейшего исследования, активно преодолевая эти вызовы. В разделе 3.2 устанавливается важная связь между кооперативными траекториями, характеристическими функциями и кооперативными решениями, определенными на ограниченных интервалах, определяемых информационным горизонтом. Цель состоит в создании когерентной структуры, которая учитывает непрерывное обновление, обеспечивая при этом согласованность кооперативных решений. Понятие временной согласованности также рассматривается в рамках кооперативных решений в играх с непрерывным обновлением. На основе полученных в предыдущих разделах идей, в разделе 3.3 представлено, как конструировать кооперативные решения с непрерывным обновлением. Предоставляются пошаговые инструкции о том, как определить кооперативные стратегии и решения в конкретном контексте непрерывного обновления. В разделе 3.4 фокусируемся на конструировании формы характеристической функции в игровых моделях, которые включают непрерывное обновление. Характеристическая функция играет ключевую роль в определении выигрышей и результатов для каждого игрока на основе их стратегий и наблюдаемой траектории. Учитывая непрерывное обновление, мы тщательно формулируем характеристическую функцию, чтобы учесть эволюцию игры. Это включает в себя внедрение кооперативных стратегий, взаимодействия между игроками и доступной информации в каждый момент времени. В разделе 3.5 мы представляем новую теорему, которая устанавливает связь между кооперативным решением и характеристической функцией в игровых моделях с непрерывным обновлением. Эта теорема демонстрирует, что кооперативное решение может быть явно представлено как функция от характеристической функции, учитывая непрерывность обновления игры. Используя данную связь, мы можем анализировать и оценивать кооперативное решение на основе характеристик и динамики игры. Теорема предоставляет ценные идеи обо взаимодействии между кооперативным решением и характеристической функцией, проливая свет на то, как изменения в характеристической функции могут повлиять на полученное кооперативное решение. Этот анализ позволяет лучше понять влияние различных факторов на кооперативный результат и помогает разработать эффективные стратегии для достижения желаемых результатов в игровых моделях с непрерывным обновлением.
Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Оптимизация многоагентных систем с попарным взаимодействием в менеджменте и задачах охраны окружающей среды2026 год, кандидат наук Хе Ян
Кооперативные дифференциальные игры с динамическим обновлением информации2017 год, кандидат наук Петросян, Ованес Леонович
Модели устойчивой двухуровневой кооперации в дифференциальных играх2015 год, кандидат наук Колабутин, Николай Валерьевич
Кооперация в дискретных линейно-квадратичных играх2015 год, кандидат наук Тур, Анна Викторовна
Теоретико-игровые методы анализа устойчивости в задачах управления загрязнением окружающей среды2024 год, кандидат наук Су Шимай
Список литературы диссертационного исследования кандидат наук Ван Цзэян, 2026 год
Литература
[1] Isaacs R. Differential Games. A Mathematical Theory with Applications to Warfare and Pursuit, Control and Optimization // John Wiley and Sons. 1965. vol. 17. No. 2. DOI 10.1088/0031-9112/17/2/009
[2] Bellman R. Dynamic Programming // Princeton University Press. 1957. vol. 127 p. 550-610.
[3] Krasovskiy NN. Game tasks about the meeting of movements// M.: Nauka. 1970.
[4] Krasovsky NN, Kotelnikov AN. On the differential game for interception // Proceedings of the Mathematical Institute. V.A. Steklova. 2010. vol. 268. p.168-214.
[5] Pshenichny BN, Ostapenko VV. Differential games // Kiev: Nauk. Dumka. 1992.
[6] ontryagin LS. On the theory of differential games // Uspekhi matematicheskikh nauk. 1966. vol. 21 No. 4. p.219-274.
[7] Pontryagin LS, Boltyansky VG, Gamkrelidze RV, Mishchenko EF // Mathematical theory of optimal processes. M.: Science; 1976.
[8] Petrosyan LA, Tomsky GV. Dynamic games and their applications// Leningrad: Ed. Leningrad State University. 1982.
[9] Petrosyan LA. Differential games of pursuit // Publishing house Leningrad University. 1977.
[10] Shubik, M., Game Theory and Related Approaches to Social Behaviour,// Wiley. 1964
[11] P.Suppes, R. Atkinson, An analysis of two-person game situations in terms of statistical learning theory// Journal of Experimental Psychology, vol.55., p.369-378,1958
[12] P. Suppes and R. Atkinson. Applications of a Markov Model to Multiperson Interactions.// Stanford University Press, Stanford, 1960.
[13] P. Suppes. Some formal models of grading principles. Synthese, vol.6. p. 284306, 1966.
[14] Karatzas, Ioannis, and Steven Shreve. Brownian motion and stochastic calculus. //Springer Science and Business Media. Vol. 113. 1991.
[15] Friedman, Avner. "Stochastic differential games."//Journal of differential equations 11.1 (1972): 79-108.
[16] IoannisKaratzas, Ioannis, and William Sudderth. "Stochastic games of control and stopping for a linear diffusion."// Random Walk, Sequential Analysis And Related Topics: A Festschrift in Honor of Yuan-Shih Chow. p.100-117. 2006.
[17] Basar, Tamer. "A tutorial on dynamic and differential games."// Dynamic games and applications in economics. p. 1-25. 1986.
[18] Basar, Tamer. "Informationally nonunique equilibrium solutions in differential games."// SIAM Journal on Control and Optimization No. 15. vol. 4. p. 636660. 1977.
[19] Basar, Tamer, ed. Dynamic games and applications in economics. //Springer Science and Business Media, Vol. 265. 1986.
[20] Kalai, Ehud, and Meir Smorodinsky. "Other solutions to Nash's bargaining problem."// Econometrica: Journal of the Econometric Society p.513-518. 1975.
[21] Kalai, Ehud, and Robert W. Rosenthal. "Arbitration of two-party disputes under ignorance."// International Journal of Game Theory. vol. 7. p.65-72. 1978.
[22] Kalai, Ehud, and Dov Samet. "On weighted Shapley values."// International journal of game theory. vol.16. p.205-222. 1987.
[23] Jorgensen, Steffen, and Georges Zaccour./ Differential games in marketing.// Vol. 15. Springer Science and Business Media, 2003.
[24] Petrosjan, Leon, and Georges Zaccour. / Time-consistent Shapley value allocation of pollution cost reduction.// Journal of economic dynamics and control / NO.27. vol.3. p.381-398. 2003.
[25] J0rgensen, Steffen, Simon Pierre Sigue, and Georges Zaccour. "Dynamic cooperative advertising in a channel."// Journal of retailing. No.76. vol.1. p.71-92,. 2000.
[26] Petrosyan, Leon A., and Nikolay A. Zenkevich. Game theory. // World Scientific, Vol. 3. 1996.
[27] Petrosjan, Leon A./ "Cooperative differential games."// Advances in Dynamic Games: Applications to Economics, Finance, Optimization and Stochastic Control./ Boston, p.183-200. 2005.
[28] Yeung, D. W. K., and Leon A. Petrosyan. /"Subgame consistent cooperative solutions in stochastic differential games."// Journal of optimization Theory and Applications./ vol. 120. p.651-666. 2004.
[29] Yeung, David WK, and Leon A. Petrosyan. Cooperative stochastic differential games.// New York: Springer, Vol. 42. 2006.
[30] Yeung, David WK./ "An irrational-behavior-proof condition in cooperative differential games". // International Game Theory Review/ NO. 8. vol. 04. p. 739-744, 2006.
[31] Yeung, David WK, and Leon A. Petrosyan./ "A cooperative stochastic differential game of transboundary industrial pollution."// Automatica /No. 44. vol. 6. p. 1532-1544. 2008.
[32] Goodwin, G., Seron, M., Dona, J. / Constrained control and estimation: An optimisation approach./ Springer-Verlag, 2005.
[33] Kwon, W., Han, S./ Receding horizon control: Model predictive control for state models. //Springer-Verlag, 2005.
[34] Rawlings, J., Mayne, D. / Model predictive control: Theory and design.// Nob Hill Publishing, LLC, 2009
[35] Wang, L./ Model predictive control system design and implementation using MATLAB. // Springer-Verlag. 2009.
[36] Bemporad, A., Morari, M., Dua, V., Pistikopoulos, E. / The explicit linear quadratic regulator for constrained systems.// Automatica. vol.38(1), p.3-20., 2002.
[37] Hempel, A., Goulart, P., Lygeros, J. / Inverse parametric optimization with an application to hybrid system control.// IEEE Transactions on Automatic Control. vol.60(4)., p.1064-1069., 2015.
[38] Kwon, W., Bruckstein, A., Kailath, T./ Stabilizing state-feedback design via the moving horizon method. // 21st IEEE Conference on Decision and Control, p.234-239., 1982.
[39] Kwon, W., Pearson, A./ A modified quadratic cost problem and feedback stabilization of a linear system. // IEEE Transactions on Automatic Control. vol.22(5)., p.838-842., 1977.
[40] Mayne, D., Michalska, H./ Receding horizon control of nonlinear systems.// IEEE Transactions on Automatic Control. vol.35(7)., p.814-824., 1990.
[41] Shaw, L./ Nonlinear control of linear multivariable systems via state-dependent feedback gains.// IEEE Transactions on Automatic Control. No.24., p.108-112., 1979.
[42] Haurie, A. /Feedback equilibria in differential games with structural and modal uncertainties.// Advances in Large Scale Systems. 1984.
[43] Joao BR, Basar T./ Receding horizon control of jump linear systems and a macroeconomic policy problem. Journal of Economic Dynamics and Control.// No.23., p.1099-1131., 1999.
[44] Van Den Broek WA. /Moving horizon control in dynamic games. // Journal of Economic Dynamics and Control. vol.26., p.937-961., 2002.
[45] Sethi S, Sorger G. A/ Theory of Rolling Horizon Decision Making. Annals of Operations Research.// No.29., p.387-416., 1991.
[46] Vasin A, Divtsova A./ The repeated game modelling an agreement on protection of the environment. //In VIII Moscow International Conference on Operations Research (ORM2018), MAKS Press Moscow. No.1., p.261-263. 2017.
[47] Vasin A, Divtsova A. /Game-theoretic model of agreement on limitation of transboundary atmospheric pollution.// Mat. Teor. Igr Pril. No.9(1)., p.27-44., 2017;
[48] Petrosian, O. L., Tur, A. V. / Hamilton-Jacobi-Bellman equations for non-cooperative differential games with continuous updating.// Communications in Computer and Information Science. vol.1090., p.178-191., 2019.
[49] Kuchkarov, I. I., Petrosian, O. L. / On a class of linear quadratic non-cooperative differential games with continuous updating.// Lecture Notes in Computer Science. vol.11631., p.21-37., 2019.
[50] Kuchkarov 1.1., Petrosian, O. L.,/ Open-Loop Based Strategies for Autonomous Linear Quadratic Game Models with Continuous Updating. //Lecture Notes in Computer Science./ vol. 12095., p. 212-230., 2020.
[51] Petrosian O. L., Tur A. V., Wang, Z., /Cooperative differential games with continuous updating using Hamilton-Jacobi-Bellman equation. // Optimization Methods and Software vol. 1275., p. 256-270., 2020.
[52] Wang Z. and Petrosian O. L., On class of non-transferable utility cooperative differential games with continuous updating // Journal of Dynamics and Games., No. 4., vol. 7., p. 291-302., 2020.
[53] Petrosian O. L., Tur A. V., Zhou, J.,/ Pontryagin's Maximum Principle for Non-cooperative Differential Games with Continuous Updating. // Communications in Computer and Information Science., vol. 1275., p. 256-270., 2020.
[54] Kuchkarov, I. I., Feedback based strategies for autonomous linear quadratic cooperative differential games with continuous updating // Contributions to Game Theory and Management. vol. 13., p. 244-251., 2020.
[55] Kuchkarov I. I., and Petrosian, O. L., Non-autonomous Linear Quadratic Non-cooperative Differential Games with Continuous Updating (to be published)// Journal of Global Optimization, 2021.
[56] Petrosian O. L., Tikhomirov D. S., Gao, H., Differential Game Model of Resource Extraction with Continuous and Dynamic Updating // Journal of Systems Science and Complexity. 2021.
[57] Zhou J., and Tur A. V., Transferable Utility Cooperative Differential Games with Continuous Updating using Pontryagin Maximum Principle // Mathematics., No.2., vol. 9., 2020.
[58] Petrosyan O.L., Tur A.V., Wang Z., Gao H./ Cooperative Differential Game Model with Continuous Information Updating, // MATHEMATICAL GAME THEORY AND ITS APPLICATIONS, vol. 12, No. 2, p. 82-109. (In Russian) .
[59] Wang Z., Yao F., Petrosian O., Gao H. Differential Game Model Applied in Low-Carbon Chain with Continuous Updating. In Frontiers of Dynamic Games // Springer International Publishing: Cham. p. 279-296., 2021 doi: 10.1007/9783-030-93616-7-16.
[60] Z. Wang, O. Petrosian and H. Gao./ "Min-distance Bargaining Solution in Differential Game with Continuous Updating,// 2023 35th Chinese Control and Decision Conference (CCDC), Yichang, China, p. 3178-3182., 2023/ doi: 10.1109/CCDC58219.2023.10326684.
[61] Nash, J. F./ The bargaining problem. The Essential John Nash // Princeton University Press./ p. 7-48., 2016
[62] Kalai, E., Smorodinsky, M. (1975). Other solutions to Nash's bargaining problem. Econometrica: Journal of the Econometric Society, 513-518.
[63] Kalai, E. (1983). Solutions to the bargaining problem. Discussion Paper.
[64] Roth, A. E., et al. (1985). Game-theoretic models of bargaining. Cambridge University Press.
[65] Kultti, K., Vartiainen, H. Multilateral non-cooperative bargaining in a general utility space. International Journal of Game Theory. 2010. vol. 39. No. 4. p. 677-689.
[66] Dockner, E. J., Jorgensen, S., Long, N. V., Sorger, G. (2000). Differential games in economics and management science. Cambridge University Press.
[67] Yeung, D. W. K., Petrosyan, L. A., etal. (2016). Subgame consistent cooperation. Theory and Decision Library C. Springer.
[68] Basar, T., Olsder, G. J. (1995). Dynamic noncooperative game theory. Academic Press.
[69] Filippov, A. F. (2004). Introduction to the theory of differential equations (in Russian). Editorial URSS.
[70] Petrosian, O. L., Tur, A. V. (2019). Hamilton-Jacobi-Bellman equations for non-cooperative differential games with continuous updating. International Conference on Mathematical Optimization Theory and Operations Research (pp. 178-191). Springer.
[71] Gromova E, Petrosyan L. Strongly dynamically stable cooperative solution in one differential game of harmful emissions management. Managing large systems. 2015 vol. 55. p. 140-159.
[72] Petrosyan LA, Danilov NN. /Stability of solutions in non-zero sum differential games with transferable payoffs. //Vestnik Leningrad State University./ Series 1. Mathematics. Mechanics. Astronomy./ p.52-59., 1979.
[73] Petrosyan LA. /Time consistency of solutions for differential games with many participants. Vestnik of Leningrad University. Ser. 1: Mathematics, Mechanics, Astronomy./ No.4., p.46-52., 1977.
[74] Peterosyan LA., /The differential optimal principle of dynamic stability.// Leningrad University Press. / Mathematics, mechanics, astronomy. / No.4., p.35-40., 1993.(In Russian).
[75] Petrosian, O.; Zakharov, V./ IDP-Core: Novel Cooperative Solution for Differential Games.// Mathematics./ vol.8., p.721. 2020./ https://doi.org/10.3390/math8050721
[76] Petrosyan, L. A.; Zaccour, G. Time-consistent Shapley value allocation of pollution cost reduction. J. Econ. Dyn. Control 2003, 27 (3), 381-398.
[77] Shapley, L./ A value for n-person games.// In Contributions to the Theory of Games II, Annals of Mathematics Studies,/ Vol. 28., p.307-317., 1953.
[78] Xia, L.; Bai, Y.; Ghose, S.; Qin, J. /Differential game analysis of carbon emissions reduction and promotion in a sustainable supply chain considering social preferences// Ann. Oper. Res./ p.1-36., 2020
[79] Ma, D., Hu, J., Yao, F./ Big data empowering low-carbon smart tourism study on low-carbon tourism O2O supply chain considering consumer behaviors and corporate altruistic preferences.,// Computers amp; /Industrial Engineering, vol.153., p.107061., 2021.
[80] Giovanni, P.D., Zaccour, G./ A selective survey of game-theoretic models of closed-loop supply chains. //4OR.,/ vol.17, p1-44.,2019.
[81] Yuyan W., Zhaoqing Y., Mingzhou J., Jiafu M.,/ Decisions and coordination of retailer-led low-carbon supply chain under altruistic preference // European Journal of Operational Research./ vol. 293., No. 3., p.910-925. 2021. https://doi.org/10.1016/j.ejor.2020.12.060.
[82] Yao, F., Gao, H., Jiang, H., Zhou, Y./ Study on Low-Carbon Supply Chain Coordination Considering Reference Emission Reduction Effect.// Asia Pac. J. Oper. Res.,/ No.38, 2020.
[83] Nerlove, M.L., Arrow, K.J. / OPTIMAL ADVERTISING POLICY UNDER DYNAMIC CONDITIONS.// Economica, No.29, p.167-168. 1962.
[84] Ouardighi, Fouad El.. "Supply quality management with optimal wholesale price and revenue sharing contracts: A two-stage game approach."// International Journal of Production Economics / vol.156, p.260-268., 2014.
[85] Jonathan P. Caulkins, Gustav Feichtinger, Dieter Grass, Richard F. Hartl, Peter M. Kort, Andrea Seidl,/ Interaction of pricing, advertising and experience quality: A dynamic analysis,// European Journal of Operational Research, Vol.256., No.3., p.877-885., 2017.
[86] Zeyang W., Petrosian O./ IDP-Core Cooperative Solution in Differential Games with Continuous Updating // Frontiers of Dynamic Games./ Cham: Springer Nature Switzerland, 2024. p. 211-233.
[87] Zeyang Wang and Ovanes L. Petrosian and L. A. Petrosyan,/ Min-distance bargaining solution in differential games // Chinese Journal of Aeronautics./ p.103370., 2024. doi: https://doi.org/10.1016/j.cja.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.