Равновесие в безопасных стратегиях тема диссертации и автореферата по ВАК РФ 00.00.00, доктор наук Искаков Михаил Борисович

  • Искаков Михаил Борисович
  • доктор наукдоктор наук
  • 2025, ФГБУН Институт проблем управления им. В. А.Трапезникова Российской академии наук
  • Специальность ВАК РФ00.00.00
  • Количество страниц 378
Искаков Михаил Борисович. Равновесие в безопасных стратегиях: дис. доктор наук: 00.00.00 - Другие cпециальности. ФГБУН Институт проблем управления им. В. А.Трапезникова Российской академии наук. 2025. 378 с.

Оглавление диссертации доктор наук Искаков Михаил Борисович

ВВЕДЕНИЕ

Глава 1 Предварительное обсуждение проблемы

1.1 Общее описание понятия

1.2 Обзор литературы

Выводы по первой главе

Глава 2 Определения, концепция равновесия в безопасных стратегиях

2.1 Система определений РБС, введение понятия

2.2 Иллюстрации и матричные примеры

2.3 Свойства равновесия в безопасных стратегиях

Выводы по второй главе

Глава 3 Теория, существование равновесия в безопасных стратегиях

3.1 Общие подходы к теоремам существования

3.2 Теорема существования РБС по Дебре

3.3 Теорема существования РБС по Рени

3.4 Теорема существования РБС по Бику

Выводы по третьей главе

Глава 4 Задача пространственной конкуренции Хотеллинга

4.1 Введение и обзор литературы

4.2 Постановка задачи

4.3 Безопасные стратегии в задаче Хотеллинга

4.4 Игра с неэластичным спросом - существование решения

4.5 Решение игры с неэластичным спросом

4.6 Игра с эластичным спросом - существование решения

4.7 Решение игры цен с эластичным спросом

4.8 Решение игры расположений с эластичным спросом

4.9 Заключительные замечания

Выводы по четвертой главе

Глава 5 Разные задачи и заключение

5.1 Задача конкуренции за ренту Таллока-Скапердаса

5.2 Модель дуополии Бертрана-Эджворта

5.3 Модель страхового рынка Ротшильда-Стиглица-Вильсона

5.4 Краткий итог по всем задачам

5.5 Обсуждение итогов по всей работе, равновесие в безопасных стратегиях и ограниченная рациональность

Выводы по пятой главе

ЗАКЛЮЧЕНИЕ

СПИСОК ЛИТЕРАТУРЫ

Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Введение диссертации (часть автореферата) на тему «Равновесие в безопасных стратегиях»

ВВЕДЕНИЕ

В работе для игр в нормальной форме предложена концепция равновесия в безопасных стратегиях (РБС), обобщающая равновесие Нэша на случай осторожного поведения ограниченно рациональных игроков, что позволило построить решения для ряда классических задач без равновесия Нэша.

Актуальность темы исследования. Результаты диссертационной работы вводят в рассмотрение схему стратегической рефлексии, описывающую осторожность субъектов относительно игровой неопределенности. Это соответственно позволяет моделировать осторожное поведение игроков, которые, с одной стороны, должны учитывать угрозы, исходящие друг от друга, но, с другой стороны, не могут полагаться на стратегии наказания, договоров, убеждений и информационного воздействия на них, социально-моральных ограничений и другие виды ограниченно рациональных моделей стратегической рефлексии. Это позволяет моделировать поведение субъектов в практически важном классе ситуаций и мотиваций, не описанных другими ограниченно рациональными моделями теории игр.

Большинство известных ограниченно рациональных моделей используют рефлексию, имитирующую динамику отклонений и стратегии наказания, которые делают устойчивыми очень много профилей и дают широкое множество решений. В предлагаемой модели удалось, ограничив уровень рефлексии числом два, отразить логику осторожного поведения игрока, не рассчитывающего на стратегию наказания, а только уклоняющегося от возможных угроз. При этом множество решений существенно сокращается. Ситуация, когда при реализации угрозы встречное наказание может не произойти, до сих пор не моделировалась в известных ограниченно рациональных моделях.

Это подтверждается тем, что в задачах, где РБС-решение описывает реакцию игроков именно на такую опасность (модели Бертрана-Эджворта, Хотеллинга, Таллока-Скапердаса, Ротшильда-Стиглица-Вильсона), соответствующие аналоги решений ранее найдены не были. Дискуссия о нахождении решения данных задач

без равновесного по Нэшу решения, в рамках различных подходов, имеет весьма объемный круг литературы и продолжается до сих пор.

Степень научной разработанности темы. В самом общем смысле в теории игр понятие равновесия задает концепцию решения игровой задачи как способ устранения игровой неопределенности. В отличие от информационной неопределенности относительно объективных параметров ситуации («состояния природы»), которая описывается как интервальная, вероятностная или нечеткая (Новиков Д.А., Губко М.В.), игровая неопределенность моделирует поведение других игроков. Таким образом, определяется та или иная концепция решения игровой задачи (Crawford V.). Концепции решения задают теоретический фундамент разделов теории игр: классическая рациональность и игры в нормальной форме (Bertrand J., Cournot A., Walras L., von Neumann J., Morgenstern O., Samuelson P., Nash J.), иерархические игры (Stackelberg H., Гермейер Ю.Б.), коалиционные игры (von Neumann J., Morgenstern O., Aumann R.J., Maschler M.), кооперативные игры (Pareto V.), повторяющиеся игры (Friedman J.W.), ограниченно рациональные модели (Simon H., Kahneman D. и дальнейшие многочисленные направления) и т.д.

Базовой моделью теории игр является классическая рациональность, анализу которой посвящены работы: Bernheim D., Pearce D., Rubinstein A., Harstad R., Selten R., Crawford V. Ограниченно рациональные модели решений игр делятся (Crawford V.) на два класса: модели повторяющихся игр (Friedman J., Kahneman D., Tversky A., Smith J., Milgrom P., Roberts J., Rabin M., Selten R., Fudenberg D., Levine D., Macy M., Flache A., Müller W., Normann H.T., Aumann R.J.) и модели стратегической рефлексии (Harsanyi J., Chwe M., Цыганов В.В., Aumann R.J., Brandenburger A., McKelvey R., Palfrey T., Camerer C.F., Ho T.H., Chong J.K., Новиков Д.А., Чхартишвили А.Г., Crawford V., Costa-Gomes M., Iriberri N.). Предлагаемая модель РБС относится к моделям стратегической рефлексии, ключевым элементом модели является понятие угрозы, исходящей от другого игрока. Среди ограниченно рациональных моделей стратегической рефлексии, описывающих отношения угроз и контругроз, следует отметить модели следующих авторов: von Neumann J.,

Morgenstern O., Schelling T., Aumann R.J., Maschler M., Friedman R.W., Вайсборд Э.М., Жуковский В.И., Вилкас Э.Й., Сандомирская М.

Теоретически модель игрового решения может стать полноценной концепцией только если она будет подкреплена доказанными теоремами существования решений, что означает, что она может стать основой для решения разнообразных частных задач. Для этого из обширной литературы, посвященной существованию равновесий и методам их получения, был выбран ряд работ с теоремами существования равновесия Нэша (Debreu G., Dasgupta P., Maskin E., Reny P.J., Bagh A., Jofre A., Bich P.), а для распространения этих результатов для РН на РБС использован подход из теории активных систем (Бурков В.Н., Кондратьев В.В.) - принцип сильных штрафов, переформулированный как принцип сильных угроз.

С точки зрения практического использования, модель РБС позволила получить решение с убедительной содержательной интерпретацией ряда классических разрывных (т.е. с разрывными функциями выигрыша или наилучшего ответа) игровых задач без равновесия Нэша, до сих пор не имевших удовлетворительного решения (Bertrand J., Edgeworth F.M., Hotelling H., Dasgupta P., Maskin E., d'Aspremont C., Gabszewicz J., Thisse J.F., Tullock G., Skaperdas S., Rothschild M., Stiglitz J.E., Wilson C.). Этот класс игр является сложным, не имеет хороших свойств (таких как выпуклость, квазивогнутость, непрерывность и т.п.), позволяющих доказывать существование решений и находить их. Альтернативные подходы к решению игровых задач (решения в смешанных стратегиях, решения «ad hoc» для частных постановок задач, решения в угрозах и контругрозах, использующие логику наказания) сталкиваются на этом классе с большими трудностями и не дают удовлетворительного окончательного результата.

Таким образом, тема работы лежит на пересечении ряда направлений исследований: ограниченно рациональные модели стратегической рефлексии, теории существования равновесий, игровых задач без РН. Каждое из этих направлений активно развивается, и в рамках каждого предлагаемая концепция РБС является новым существенным результатом.

Объектом исследования являются ограниченно рациональные модели принятия решений без равновесия Нэша в ситуациях игровой неопределенности, в том числе - разрывные задачи, предметом исследования - концепции принятия решений (равновесия) в таких ситуациях.

Цель работы состоит в создании, разработке и обосновании новой концепции принятия решений в ситуациях игровой неопределенности - РБС, предназначенной для моделирования осторожного поведения, и теоретических условий его существования, в особенности для игр без равновесия Нэша с континуальными множествами стратегий, разрывными функциями выигрыша и наилучшего ответа.

Реализация поставленной цели предполагает решение следующих основных задач:

1. Формулировка системы определений РБС.

2. Интерпретация определения РБС как обобщения равновесия Нэша.

3. Определение места РБС среди ограниченно рациональных теоретико-игровых моделей принятия решения.

4. Исследование общих условий существования РБС и разработка формальных методов построения теорем его существования.

5. Формулировка конкретных критериев, доказательство теорем существования РБС.

6. Применение этих критериев к хрестоматийным нерешенным разрывным игровым задачам.

7. Нахождение РБС в этих задачах.

Основным методом исследования является математическая теория управления социально-экономическими и организационными системами, принятия решений и теория игр, в частности теория рациональности, теория игровых равновесий, теория активных систем.

Научная новизна работы заключается в разработке новой концепции равновесия и ее обоснования с точки зрения различных аспектов: анализа существующих моделей, системы определений, теории и теорем существования

решений, решения известных нерешенных игровых задач. На основе этой концепции:

1. Сформулирована и обоснована система определений новой концепции игрового равновесия - РБС, предложена ее интерпретация как обобщение определения равновесия Нэша.

2. Показано, что РБС является ограниченно рациональной моделью решения игры, описывающей осторожное поведение игроков.

3. Разработан метод формулирования и доказательства теорем существования РБС.

4. Теоремы существования применены к двум хрестоматийным нерешенным задачам (пространственной конкуренции Хотеллинга и конкуренции за ренту Таллока-Скапердаса). Доказано, что данные задачи всегда имеют решение РБС.

5. Модель РБС применена и позволила получить решение ряда классических задач без равновесия Нэша: дуополия Бертрана-Эджворта, пространственная конкуренция Хотеллинга, конкуренция за ренту Таллока-Скапердаса, рынок страхования Ротшильда-Стиглица-Вильсона.

Теоретическая и практическая значимость. Проведенное исследование является значимым так как: 1) в рамках общего развития ограниченно рациональных моделей принятия решения и теории игр предложен новый подход в рамках активно развивающейся области моделей стратегической рефлексии; 2) с теоретической точки зрения, предложен метод конструирования теорем существования равновесий; 3) предложены решения практически важных игровых моделей, в особенности в классе разрывных задач без равновесия Нэша; 4) для содержательных интерпретаций промоделированы ранее не исследованные ситуации осторожного поведения игроков.

Соответствие паспорту специальности 2.3.1. «Системный анализ, управление и обработка информации, статистика»:

1. Теоретические основы и методы системного анализа, оптимизации, управления, принятия решений, обработки информации и искусственного интеллекта.

2. Формализация и постановка задач системного анализа, оптимизации, управления, принятия решений, обработки информации и искусственного интеллекта.

3. Разработка критериев и моделей описания и оценки эффективности решения задач системного анализа, оптимизации, управления, принятия решений, обработки информации и искусственного интеллекта.

Основные положения, выносимые на защиту:

1. Система определений РБС формирует новую концепцию принятия решений в социально-экономических и организационных системах в ситуациях с игровой неопределенностью (п. 2 паспорта специальности).

2. Система определений РБС является расширением определения равновесия Нэша для принятия решений осторожными игроками в рамках классической теории рациональности (п. 2 паспорта специальности).

3. Трактовка РБС как ограниченно рациональной модели стратегической рефлексии второго уровня (угроза-контругроза) позволяет описать осторожное поведение без возможности стратегии наказания и получить для ряда классических задач дискретное конечное множество решений малой мощности с убедительной содержательной интерпретацией (п. 3 паспорта специальности).

4. Предложенный общий метод позволяет применить известные теоремы существования равновесия Нэша для формулировки и доказательства теорем существования РБС (п. 1 паспорта специальности).

5. При помощи предложенного общего метода сформулированы и доказаны теоремы существования РБС (по Дебре, Рени, Бику) (п. 1 паспорта специальности).

6. Доказано существование РБС в классических задачах пространственной конкуренции Хотеллинга и конкуренции за ренту Таллока-Скапердаса в том числе при отсутствии равновесия Нэша (п. 1 паспорта специальности).

7. Получены РБС-решения с единообразной содержательной интерпретацией для ряда классических задач, где не всегда существует равновесие Нэша: дуополия Бертрана-Эджворта, пространственная конкуренция Хотеллинга, конкуренция за ренту Таллока-Скапердаса, рынок страхования Ротшильда-Стиглица-Вильсона (п. 1 паспорта специальности).

Степень обоснованности и достоверности полученных научных результатов подтверждена приведенными доказательствами лемм и теорем; решением ряда задач, корректностью проведенных математических преобразований; а также дополнительно проверена результатами математического и компьютерного моделирования, согласующимися с теоретическими результатами. Все основные результаты работы были опубликованы в рецензируемых журналах.

Апробация. Основные результаты докладывались и обсуждались на конференциях: международной научно-практической конференции «Теория активных систем» (Москва 2005, 2007, 2011, 2014, 2019); Международной научно-практической конференции «Современные сложные системы управления» (Тверь, 2008); IV Всероссийской школы-семинара молодых ученых «Проблемы управления и информационные технологии» (Казань 2008); Всероссийской конференции и секции Математической экономики XIV Байкальской международной школы-семинара «Методы оптимизации и их приложения» (Иркутск, Байкал, 2008, 2011); VI всероссийской школы-семинара молодых ученых «Управление большими системами» (Ижевск, 2009); IV, VII Международной конференции «Game Theory and Management» (Санкт-Петербург 2010, 2013); XIII, XIV, XVI Апрельской международной научной конференции по проблемам развития экономики и общества (Москва 2012, 2013, 2015); Международной конференции «European Meeting on Game Theory» (SING11-GTM2015) (Санкт-Петербург 2015); семинарах Института проблем управления

РАН, Высшей школы экономики, Российской экономической школы, Центрального экономико-математического института РАН и ряде других семинаров.

Публикации. По теме диссертации опубликована 41 работа, в том числе 1 монография [18], 16 статей в рецензируемых научных изданиях, из них 4 в журналах Перечня ВАК по специальности 2.3.1 (физ.-мат.) , категория К1 [25, 30, 36, 200], 7 статей в научных изданиях, индексируемых в международных базах данных (приравнены к журналам Перечня ВАК, категория К1) [16, 20, 29, 33, 35, 117, 125], 5 статей в иных рецензируемых журналах не вошедших в Перечень ВАК по специальности 2.3.1 (физ.-мат.) и научные издания, индексируемые в международных базах данных (приравненные к журналам Перечня ВАК, категория К1) [15, 19, 24, 27, 34], 7 препринтов [118, 119, 122, 124, 126, 127, 128], 1 раздел в монографии [13], 16 работ в сборниках трудов конференций [12, 13, 17, 21, 22, 23, 26, 28, 31, 32, 37, 116, 120, 121, 123, 202].

Личный вклад соискателя. Все основные результаты получены автором самостоятельно.

Связь с планами научных исследований. Результаты работы были получены в рамках планов фундаментальных научных исследований ИПУ РАН и при выполнении следующих проектов:

1. 2007-2008 - Грант РФФИ № 07-07-00079-а, «Синтез неманипулируемых механизмов активной экспертизы на многомерных множествах», (исполнитель).

2. 2007-2009 - Грант РФФИ № 07-07-00078-а, «Математические модели и методы поиска оптимальных иерархических структур», (исполнитель).

3. 2008-2010 - Грант РФФИ № 08-07-00081-а, «Механизмы комплексного оценивания в сложных системах», (исполнитель).

4. 2009-2011 - Грант РФФИ № 09-07-00093-а «Методы решения теоретико-игровых задач распределения ресурсов» (исполнитель).

5. 2010-2012 - Грант РФФИ № 10-07-00063-а, «Равновесие в безопасных стратегиях в теоретико-игровых задачах принятия решений», (руководитель проекта).

6. 2010-2012 - Грант РФФИ № 10-07-00129-а «Модели оптимизации многоуровневых организаций» (исполнитель).

7. 2014-2016 - Грант РФФИ № 14-01-00131-а, «Равновесия в безопасных стратегиях в разрывных экономических играх», (руководитель проекта).

Структура и объем диссертации. Диссертационная работа состоит из введения, пяти глав, заключения, списка литературы. Работа содержит 378 страниц текста, 53 иллюстрации, 6 таблиц. Список литературы содержит 202 наименования.

Основное содержание работы:

Во введении обоснована актуальность и значимость исследуемой проблематики, дан обзор литературы, сформулированы цель и задачи исследования, основные положения, выносимые на защиту, приведены данные о структуре и объеме диссертационной работы.

В главе 1, в разделе 1.1 приводится общее качественное описание понятия РБС без формальных конструкций, которое далее обсуждается в сравнении с равновесием Нэша-Курно, с точки зрения теорем существования равновесий, теории рациональности, динамических игр, в связи с другими моделями, а также рассматриваются ограничения концепции. В разделе 1.2, обзоре литературы, разбираются: игровые задачи без равновесия Нэша, решения в смешанных стратегиях, ad hoc решения, решения в возражениях-контрвозражениях (угрозах-контругрозах), концепции дальновидных решений, существование равновесий Нэша в разрывных играх, статические и динамические модели олигополистического поведения, концепции рациональности, эволюционные и рефлексивные модели.

Глава 2 посвящена формальному определению РБС. В разделе 2.1 оно дается в кратком базовом варианте и в эквивалентном расширенном, выводящем понятие

РБС из определения равновесия Нэша, показано, что равновесие Нэша всегда является РБС. Раздел 2.2 иллюстрирует понятие безопасных стратегий на матричных примерах, дано четыре серии примеров. В разделе 2.3 рассматриваются свойства РБС. Ряд утверждений этого раздела непосредственно следуют из системы определений, и фактически являются комментариями, проясняющими понятие с разных точек зрения. Здесь рассматривается РБС в соревновательных играх, вводятся понятия: наилучшего безопасного ответа, слабого равновесия в безопасных стратегиях, игры угроз, игры с неопределенным инсайдером, игры с неопределенностью динамики, используемые в дальнейших рассуждениях и теоремах. Далее обсуждаются: гипотезы о поведении осторожного (ограниченно) рационального субъекта, игры с участием более двух игроков, РБС в разрывных и неквазивогнутых играх, е-РБС.

В главе 3, которая является центральной во всей работе, разрабатываются теоремы существования РБС. В разделе 3.1 рассматриваются разные подходы к конструированию теорем существования решения. Теорема 1 формулирует связь существования РБС в исходной игре и равновесия Нэша в соответствующей игре угроз. Далее, как альтернативный подход, формулируется метатеорема 2, задающая метод получать теоремы существования РБС из известных теорем существования равновесия Нэша. Для этого формулируется условие сильных угроз, которое делает игру устойчивой в том смысле, что множества безопасных стратегий становятся предпочтительными для осторожных игроков, учитывающих в своем выборе соображения безопасности. Тогда для существования РБС достаточно требовать выполнения условий теорем существования равновесия Нэша не на всем множестве возможных стратегий, а только на множестве безопасных стратегий. Теорема 3 формулирует локальный вариант теоремы 2, еще более сужая множество, на котором должны выполняться ограничения необходимых условий равновесия, этот вариант метатеоремы достаточно сильный, его можно применять для исследования задач.

В разделе 3.2 из теоремы существования социального равновесия Дебре получена теорема 4 существования РБС. В разделе 3.3 аналогично получены

теоремы существования РБС 5, 6, 7, 8 на основе теоремы Рени существования равновесия Нэша и следствия из этой теоремы. Локальные варианты теорем 4, 7, 8 являются рабочими, то есть их можно применять к задачам. В разделе 3.4 из теоремы Бика существования равновесия Нэша так же получена теорема 9 существования РБС.

Следующие две главы посвящены исследованию РБС решений для ряда известных хрестоматийных задач без равновесия Нэша. В главе 4 рассматривается задача пространственно-ценовой конкуренции Хотеллинга, которая была взята как базовая эталонная задача для проверки концепции решения. Раздел 4.1 содержит обзор литературы, 4.2 - постановку задачи. В разделе 4.3 сформулировано утверждение, содержащее систему неравенств, задающих множества безопасных стратегий для задачи. Далее для задачи с неэластичным спросом раздел 4.4 содержит проверку условий существования решения для теорем 4, 7, 8, а в разделе 4.5 получено само решение. В разделах 4.6-8 аналогично исследуется более технически сложный вариант задачи с эластичным спросом. Раздел 4.9 посвящен заключительному обсуждению результатов решения задачи, а также там приведены численные расчеты.

Глава 5 посвящена другим задачам без равновесия Нэша: раздел 5.1 -конкуренции за ренту Таллока-Скапердаса, раздел 5.2 - дуополии Бертрана-Эджворта и модели страхового рынка Ротшильда-Стиглица-Вильсона. Первые две задачи исследованы по полной схеме, аналогично задаче Хотеллинга. Для модели страхового рынка доказано, что предлагаемый в качестве решения страховой контракт Ротшильда-Стиглица-Вильсона, который не всегда является равновесием Нэша, всегда является РБС.

Глава 1 Предварительное обсуждение проблемы

1.1 Общее описание понятия

В квалификационной работе представляется новый подход - в безопасных стратегиях - к решению игровых задач в нормальной форме, описывающий ситуации, когда в логике поведения участников присутствует осторожность, то есть учёт такого явления, как угрозы со стороны других участников. Часто в таких задачах не существует равновесия Нэша, по крайней мере, при каких-то значениях параметров.

Вводится система определений равновесия в безопасных стратегиях (РБС), дается ряд иллюстративных примеров. Новое понятие сравнивается с концепциями решения в угрозах и контругрозах, динамических игр, иерархических игр, теорий олигополистического поведения, рациональности. В рамках предложенного подхода формулируются и доказываются базовые теоремы существования равновесий. Этот результат актуален, так как класс игр, для которых значим способ решения в безопасных стратегиях, являются разрывными, в разных смыслах (разрывны целевые функции выигрышей или функции наилучшего ответа), и именно из этого их свойства вытекает отсутствие решений при обычных подходах. Далее исследуется, в качестве приложений, ряд классических игровых задач -модели: пространственной конкуренции Хотеллинга, соревнования за ренту Таллока-Скапердасаа, дуополии Бертрана-Эджворта, страхового рынка Ротшильда-Стиглица-Вильсона и другие.

Постановка проблемы. В некоторых хорошо известных экономических моделях не существует равновесий Нэша-Курно. Примеры включают модели ценового соревнования Хотеллинга на отрезке, когда продавцы расположены близко (Hotelling 1929; d'Aspremont, Gabszewicz, Thisse 1979, [115, 57]), модель Ротшильда-Стиглица соревновательных рынков страхования с неблагоприятным отбором (Rothschild, Stiglitz 1976; Wilson 1977, [168, 198]), игру конкуренции за ренту Таллока-Скапердаса, когда степенной параметр жесткости конкуренции больше двух и игра становится антагонистической (Tullock 1967; 1980, Skaperdas

1994, [193, 194, 185]), дуополии Бертраиа-Эджворта, когда одна производственная мощность мала по сравнению с другой (Bertrand 1883; Edgeworth 1925, [74, 102]). Эта проблема существования была поднята Дасгуптой и Маскиным в их известной статье (Dasgupta, Maskin 1986, [90, 91]). Они доказали существование равновесия Нэша в смешанных стратегиях для семейства игр с разрывными функциями выигрышей, которое покрывает все упомянутые выше модели (кроме модели Таллока, где разрывность функции наилучшего ответа создает те же проблемы). Однако, эти решения в большинстве случаев найти в явном виде и охарактеризовать не просто. В явном виде получить решение в смешанных стратегиях (по известным публикациям) для указанных задач не удалось. Их также обычно трудно интерпретировать в приложении к конкретным экономическим контекстам.

С другой стороны, в некоторых контекстах возникает интуитивное ожидание, что устойчивые положения в чистых стратегиях должны существовать. В поддержку такой гипотезы говорит ряд ad hoc концепций равновесия, разработанных для описания, определённого поведения игроков в конкретных моделях. Например, Вильсон (Wilson, 1977, [198]) и Райли (Riley, 1979, [167]) предложили две различные концепции псевдо-равновесий для модели страхового рынка. Итон и Липси (Eaton, Lipsey, 1978, [99]) предложили равновесие с нулевой предполагаемой вариацией (zero conjectural variation equilibrium), чтобы восстановить существование равновесия в модели Хотеллинга. В (D'Aspremont, Gabszewicz, 1980, [56]) была предложена концепция квази-монополии, которая гарантирует существование псевдо-равновесия в модели дуополии Бертрана-Эджворта, в указанном выше случае. Общая черта этих и многих других концепций состоит в том, что они описывают определённую логику рационального поведения, учитывающую взаимодействие игроков. Возникает концептуальный вопрос. Существует ли общее обоснование, стоящее за этими интуитивно воспринимаемыми положениями равновесия и не зависящее от специфики конкретной модели, возникающее непосредственно из рационального анализа и рефлексии игроков?

Общее качественное описания понятия. Попытаемся ответить на этот вопрос и поищем некоторый естественный способ рассуждения независимых игроков, который возникает непосредственно из их стратегической рефлексии (strategic thinking). При этом предполагается, что поведение игроков не связано с формированием коалиций, соглашений или каких-либо других предварительных договоров об общих правилах. В качестве критерия для анализа поведения и взаимных отношений предлагается использовать безопасность, осторожность игроков относительно неопределенности поведения партнеров. Во многих практических ситуациях соображения безопасности не менее важны, чем увеличение прибыли. Например, рациональные игроки не нарушают правила, если среднее ожидаемое наказание превосходит выигрыш, получаемый от нарушения правил. Аналогичным образом естественно предположить, что осторожные игроки не станут увеличивать свой выигрыш, если это создаёт для них угрозу потерять больше. Они предпочтут наибольший возможный безопасный выигрыш при заданных стратегиях других игроков. Главное обоснование в основе предлагаемой концепции (не исключая возможности других концепций, основанных на другой логике) состоит в предположении, что игроки стремятся к безопасным положениям, т.е. к таким положениям, в которых им не могут угрожать другие игроки. Рассматривая такую логику поведения, можно обнаружить равновесные позиции, которые невозможно выявить с помощью стандартной логики максимизации выигрыша и наилучших ответов Нэша-Курно.

Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Список литературы диссертационного исследования доктор наук Искаков Михаил Борисович, 2025 год

/ /

1 1

Л1 = П1ОД

с 0-е

Х1

Рисунок 41 - Безопасные и небезопасные профили для двух одинаковых игроков в состязании Таллока при а < 1 (слева) а > 1 (справа)

Доказательство. Будем использовать следующий критерий. Пара стратегий в соревновании за ренту безопасна тогда и только тогда, когда ни один из игроков не может увеличить выигрыш, увеличивая свое усилие, всегда уменьшает выигрыш другого игрока.

Рассмотрим сначала случай 0 < а < 1. Функции выигрыша игроков щ вогнутые и однопиковые по своим стратегиям X;. Поэтому никто не может увеличить свой выигрыш за счет увеличения усилий тогда и только тогда, когда

х1 > 5^1(х2),х2 > 5^2(^1). Согласно (5.7) при 0 < а < 1 это условие можно записать как х1 > ^-1(х2),х2 > ^-1(х1). Поэтому множество безопасных стратегий в игре можно записать как {(х1,х2):х1 > С-1(х2),х2 > ^-1(х1)|. Оно закрашено серым в плоскости стратегий (х1, х2) в левой части рисунка 41. Профили представляющие угрозу для игрока 2, заштрихованы горизонтально, а профили представляющие угрозу для игрока 1 заштрихованы вертикально.

Рисунок 42 - Стратегии игрока 1, содержащие угрозы игроку 2 при а > 1, когда х2 < х (верхний график), и когда х < х2 < х (нижний график) (а = 1.5, х = Ь « 0.529, х = с « 0.609, х2 = 0.45 < х,х < х2 = 0.57 < х)

Рассмотрим случай, когда а > 1. Рассмотрим, например, множество профилей содержащих угрозу для игрока 2. Профиль с х1 = х2 = 0 всегда содержит угрозу для игрока 2, поскольку его конкурент всегда может произвоьно увеличить свою стратегию и уменьшить вознаграждение игрока 2 с Уг до 0. Другие профили представляют угрозу для игрока 2 тогда и только тогда, когда игрок 1 может увеличить свое вознаграждение и1 увеличив свое усилие х1. Как было замечено ранее, функция выигрыша п.1(х1,х2) может иметь два пика по Х1 в

зависимости от значения х2 (смотри рисунок 42). Левый пик возникает при х1 = 0, а правый при х1 = ^-1(х2). Когда 0 < х2 < х, правый пик выше левого, и профиль представляет угрозу для игрока 2 тогда, когда х1 < <^-1(х2) (верхний график на рисунке 42). Когда х < х2 < х, левый пик выше правого, и небезопасные профили для игрока 2 лежат в интервале ^-1(х2) < х1 < ^-1(х2) (нижний график на рисунке 42). Наконец, когда х2 > х, функция и1 монотонно убывает по х1, и все профили безопасны для игрока 2. Набор профилей, представляющих угрозу для игрока 2, заштрихован горизонтально в правой части рисунка 41. Профили, представляющие угрозу для игрока 1, заштрихованы вертикальными линиями соответственно. Множество профилей (х1(х2), безопасных для игрока 2, можно формально записать в следующем виде.

{х2 < х,х1 > г1^)} и {х < х2 < х,х1 < ^-1(х2) ух1 > гч*2)} и {х2 > x}

Соответственно, множество профилей, безопасных для игрока 1, можно записать симметрично. {Х1 < Х,Х2 > С-1(Х1)} и {х < Х1 < Х,Х2 < ^-1(Х1) УХ2 > Г1 СО) и {Х1 > х)

Пересечение этих множеств определяет множество безопасных профилей в игре. Оно закрашено серым цветом в правой части рисунка 41. Легко проверить, что его можно записать в виде (5.14). □

Замечание. Отдельно следует отметить пограничный случай а = 1. Если + +

при а > 1 функция ^+(х)—> + то, то при а = 1 эта функция конечна, £+(0) = 1. Обратная функция имеет вид: ^-1(х) = V* _ х.

Имея формулы множеств безопасных профилей, можно определить функции наилучшего безопасного ответа. Для этого обозначим функцию верхней границы небезопасного множества и стратегию игрока, в которой его выигрыш на верхней границе опасных стратегий равен нулю:

(5.16)

хо:и;(хо,0(хо)) = 0

(5.17)

Положение х0 определяется условием: х0=х(1— где х = 0(х0). В качестве

рабочей гипотезы примем пока, что такая точка единственна, и что ^¿(х, 0(х)) положительна при х < х°, отрицательна при х > х0. В любом случае Зх° < х.

Непосредственной проверкой можно убедиться, что: при а < 1: и_;(х;,<Г(х;)) > и-(х;,^+ (х;)); при а = 1: =

при а > 1: < Собирая эти соображения и

предположения можно получить формулы функций наилучшего безопасного ответа.

„ ч 0 < х— < х*

а = =

с±(х-;),0<х-;<х* ^-1(х-;),х- > х*

(5.18)

(5.19)

^(Х-;),0 < X < у

1 < а < 2: В5Я((х-,) = \ * <*'_

£ 1(х-^),х < X < X

0,х > х

(5.20)

а > = <

^(х-^), 0 < х < тт(х0,у) ^+(х-^),;у < х < х0 0,х>х0

(5.21)

Существование решения. Рассмотрим задачу конкуренции за ренту, используя подход теоремы Рени. Единственным профилем негарантирующим лучший ответ или точкой перескока в данной задаче является профиль (х, х), точка, в которой функция лучшего ответа перескакивает в ноль для обоих игроков. Соответственно, для задачи в целом теорему Рени применить нельзя. Если же применять теорему Рени к обрезанной игре с выигрышами игроков, обрезанными за пределами их множеств безопасных стратегий, тогда точкой негарантирующей лучший ответ будет профиль (х0,х0),х0 < х.

Таким образом, чтобы применить локальный вариант теоремы существования РБС, требуется выбрать такой прямоугольник В = Б1 X

который содержит все значения функций наилучшего безопасного ответа G Vx-j G i G {1,2}, но при этом в него не попадает точка перескока (х0,х0) £ Б.

Связные множества игрока 2 с самыми выгодными безопасными стратегиями можно выбрать в виде (?2(х1) = (х2 > ^(x-J} при х1 < х0 ив виде (?2(х1) = {0 < х2 < 5} при х1 < х0, где ô достаточно малая положительная величина. Когда Xi — X 0 любое выбранное подмножество (?2(х1) оказывается разрывным. Таким образом, условие лучшей безопасной альтернативы (BSA условие) не может удовлетворяться для точки перескока (х°, х°).

Приведенный анализ показывает, что в качестве области B естественно выбрать следующее множество профилей с произвольно малым s > 0.

В = Б1 X Я2 = [0, х0 - г] X [х0 + £, 1] (5.22)

Теперь можно утверждать существование РБС для случая а > 2, для которого не существует равновесий по Нэшу. Для нахождения прямоугольника B по существу использовалась теорема 8 существования по Рени, но по соображениям простоты формально докажем, что поставленная задача удовлетворяет условиям теоремы 5 существования РБС по Дебре.

Утверждение 5.2. При а > 2 состязание Таллока (5.4) удовлетворяют условиям теоремы 5 в области B, и в нем существует РБС.

Рисунок 43 - Расположение областей и точек на кривой f 1 (t) при различных

значениях параметра t

Доказательство. В качестве BSA множеств Çj(x_j) в B выберем замкнутые отрезки:

Q2(XI) = {0(*i) < х2 < 1), (?i(x2) = {0 < xi < 5} (5.23)

где 8 > 0 достаточно мало, чтобы и1(х1,х2) всегда убывала по х1 на отрезке (?1(х2). Покажем, что рассматриваемая G игра является BSA игрой в B.

(1). Рассмотрим сначала область D1 = {0 < х1 < х0, 0 < х2 < f-(x1)} безопасных стратегий игрока 2, и докажем, что ему всегда выгодно из нее отклониться в х2 = 0(х1) (смотри рисунок 43). Выберем произвольное х1 < х0. Так как функция и2(х1,х2) в области D1 квазивыпукла по х2 и и2(х1, 0) = 0 < и2(х1,0(х1)), то для выполнения условия в области D1 достаточно показать, что

^2(*1,<г01)) < ^2(Х1,0(Х1)),Х1 < х0 (5.24)

(1.A). Рассмотрим случай, когда х1 < у. Введем обозначения х2 = f-(x1),

(*1 = Г1^)), -^2 = 0(^1), *1 = Г1^), 4 = ^2(^1, ГС^)) = —l+t^ - *2, uf =

х а

и2(х1,0(х1)) = а2 „ а — х2. Из определения (5.16) функции 0(х1) при х1 < х(

- Х1 = 1Г1ГГ-Га - Отсюда получаем „ а2 а = 1 + Х1 - Х1 - „ * а и

^^ 1 2 ТЛ* Л* ТЛ2 Л* ТЛ2

~ а

ц2 ~ ~ Х1 + ~ а1 ~ а ~ *2, где = С-1(х2). Кривую х1 = <^-1(х2) удобно задать параметрически с помощью монотонно растущей вдоль нее переменной 0 < 1 <

0, "+1

а-1.

а+1 аС ,1/ ~ аС ~ ~1/ ~ , ~ _

-так, что х-. = -——, х2 = t /а • х., а х. = -——, х2 = 1 • х-,, где

а-1 ' 1 (1+С)2 2 (1+С)2 2 1

Введем функцию

+ (5.25)

' к у С+1 (С+1)^ а-1 4 '

В таких обозначениях получаем: и2 — и2 = /(?) — /(О, где - квазивогнутая и имеет максимум в точке 1тах = 1, а допустимые диапазоны параметров: <

t <-, 0 < 1 <-. Заметим, что t <- и /(*:) < / I-I (так как, если бы t >

а-1 а+1 ' а-1 7 \а-1/ 4 '

1 а-1 1 и—1

то x1(t) > то есть при а > 2: *-,_(*:)>- (а — 1) « = х, и согласно (5.7) это означает, что и2(х1,х2) < 0 при любых х2 в противоречии с условием и2(х1,0(х1)) > 0). Непосредственной подстановкой можно проверить, что

для всех а >2,и яо ^ 1 Ш < * Таким обРазом,

< min {/ ,/ (^17)] и ^17,^17]. Отсюда в силу квазивогнутости функции /(¿) получаем неравенство /(¿) < /(?) и требуемое неравенство (5.24).

(1.В). Рассмотрим случай, когда х1 > у. В этом случае из определения (5.16) функции 0(х1):и| = М2 (^1,0(^1)) = ^(х^+С^)), а = ^(д^, С-(*1)). Используем снова переменную t = ~ 2х1 — ^а2 — 4ах1). Тогда, согласно

(5.4) и (5.5)

п _1 г t 1 а

-г — х^ «,^2=---х^«,^ = ^-гт--—, 0 < С < 1.

2 1 + 1-1 1 , 2 1 + 1 1,1 (1 +1)(1 + С-1),

Отсюда и2 — = — Ь ") _ " _ ^ ^^ При t = 0 функция Ф =

= 0, а = ¿((^ + Г- а + Г1)^. Если а > 2 ^ 0<1<1^:0<£<

{а < 1 ^ й + < 1 + ¿—1 и ^ < 0, Ф > 0, > . Неравенство (5.24) доказано.

(2). Рассмотрим сначала область = {0 < х1 < х0, ^-(х1) < х2 < 0(х1)},

где стратегии игрока 2 небезопасны, и докажем, что в любой ее точке против игрока

1

2 существует угроза игрока 1 (выгодно) отклониться: х1 ^ х1 на кривую (5.5) своего правого пика х1 = <^—1(х2), и при этом и2(х1,0(х1)) > и2(х1,х2) (смотри рисунок 43).

(2.А). Рассмотрим случай, когда х1 < у. Рассмотрим обозначения, введенные в пункте (1.2) доказательства, а также переменную ? а также функцию ДО в (5.25).

сЛ' 1

Дополнительно обозначим х1 = -—Г2,х2 = при зачении параметра t =

(Д + С )

Тогда

Л^2 = М2(^1,0(^1)) -^2(Х1,Х2) = /(0 + " "

Докажем, что Ди2 > 0. Рассмотрим случай > Т. Заметим, что ? > (так

как х2 > х2) и функция и2(0 ~ ~ (С+1)2 в03Растает ПРИ £ ^ Т. Поэтому

^2(х1,х2) = ^2(0 < ^С?) = ^2(^1,^2) < "2(^1,^2) = "2(^1,0(^1)), то есть Ди2 > 0.

1 ^—1

Рассмотрим случай ^ < < Т. При этом хКО > то есть при а > 2:

1 а-1

х1 > ^ (а — 1)— = х, и согласно (5.7), это означает, что и2(х1, х2) < 0. Поскольку и2(х1,0(х1)) >0, то получаем, что Ди2 > 0.

Рассмотрим последний случай: t < < 1 Тогда Ли2 > и2(х1,0(х1)) — тах и2(г). Функция является квазивогнутой на отрезке t £ [0,1].

с<т<

а-1

Обозначим положение ее максимума как t. Если t G [0, t], то max и2(т) =

t<T<-

а-1

= и2(х1, £ (х1)), и условие Ди2 > 0 сразу следует из условия (5.24), доказанного в первом пункте. Если же £ £ 1], то справедлива оценка £ <

-,-f. Она следует из непосредственной проверки, что —

^ i 1 ^ 1j

t—a_i _a+i

G+i)" " 2 < 0 при а > 2, и 1 = (а - 1)1 - (а - 1) < 0 при а > 2.

а-1

Поэтому max и2(т) = n2(x1(t),x2(t)) = u2(t), и

t<z<-а-i

А^2 > Ц2(*1, в(*1)) ~ = ЯО + (1 + ~ (1 + ¿)2 ~ ЯО > ЯО ~ /(¿).

Так как возрастает при 1 < 1, то из полученной оценки:

Так как /(£) квазивогнутая и I £ , т0 отсюда получаем /(?) > /(Т),

и неравенство Ли2 > 0 доказано.

(2.В). Рассмотрим случай, когда х1 > у. В этом случае доказываемое неравенство принимает вид и2(х1,^+(х1)) > и2(х1,х2). Используем введенные

а-1

нами обозначения для t, t' и t. Так как t = argmaxu2(t) <-, то функция u2(t) =

0<t<1 a+1

1

"а-1 а+1

t+1 (t+1)

at^ta

-2 квазивыпукла на отрезке

. Тогда, учитывая оценку ^^ <t<

.a+1 a-1

^ | 1

t' < t-1 < ^-j-, получаем u2(t') < max{u2(t),u2(t-1)}. Нов пункте (1.B)

доказательства было показано, что u2(t) < u2(t-1) при t < 1. Отсюда получаем u2(t') < u2(t-1) или, возвращаясь к исходным обозначениям, и2(х!,х2) < u2(x1; f+(х1)), что и требовалось доказать.

(3). Докажем BSA условие для множества (х2). Для удобства иллюстрации проведем доказательство для симметричного множества (?2(х1) = (?1(х2) = {0 < х2 < 5),х1 > .£1 — х0. Рассмотрим произвольное х2 > 5. Там где и2(х1(х2) <

0, BSA условие выполняется в силу того, что u2(x1(x2) < и2(х1( 0) = 0.

Рассмотрим область D3 = {(х1(х2)| х1 > х0,х2 > и2(х1(х2) > 0). В пункте (1)

доказательство неравенства u2(x1( f-(x1)) < u2(x1( 0(х1)) никак не использовало

условие х1 < х0 и потому остается справедливым также и при х1 > х0. Поэтому из

условия и2(х1( 0(х1)) < 0 при х1 > х0 следует, что u2(x1( f-(x1)) <

u2(x1,0(x1)) < 0. Так как и2(х1(х2) квазивогнута по х2 при f-(x1) < х2 < 0(х1),

то все точки (х1; х2) G D3 должны лежать в интервале f-(x1) < х2 < 0(х1) (смотри

рисунок 43). Это означает, что в любом профиле стратегий из D3 против игрока 2

1

существует угроза игрока 1 (выгодно) отклониться: х1 ^ х1 на кривую (5.5) своего

1

t at-ta

правого пика х1 = <f 1(х2). Рассмотрим снова параметризацию u2(t) =--

t i 1 i û i 1 )

и определим для параметра t значения t, t' и t так, что u2(x1( f-(x1)) = U2(t),U2(x1,x2) = M2(t') И U2 (f-1(0(x1)),0(x1)^ = U2(t). Так как U2

a+1l , . a+1 ^ r t ¡л

квазивыпукла на интервале H и t < t <t< -, то u2(t ; = u2(x1,x2; <

max{u2(t'),u2(t)} < max{u2(x1,f-(x1)),u2(x1,0(x1))} < 0 = ^2(^1,0), и

следовательно BSA условие выполняется также для области D3.

(4). Проверим выполнение других условий теоремы 5. Очевидно, что графики функций Çj(x_j) являются замкнутыми множествами. Функции выигрышей игроков непрерывны на этих множествах (как и везде, кроме точки (0,0)). Функции максимальных выигрышей игроков 0j(x_j) на множествах Çj(x_j) непрерывны, а границы множеств меняются непрерывно. Наконец, множества Мх_. состоят из единственной точки в силу строгой квазивогнутости функций выигрыша на множествах Çj(x_j). Поэтому они стягиваемы. По теореме 5 в множестве B существует РБС. □

Решение задачи Таллока-Скапердаса теперь можно сформулировать в основном результате.

Утверждение 5.3. Если 0 < а < 1, то в задаче конкуренции Таллока (5.4) двух игроков имеет следующее единственное РБС, которое также является

равновесием Нэша

к**,**)Н(!,|)} (526)

Если 1 < а < 2, то в задаче конкуренции Таллока (5.4) существуют следующие РБС

, 4 (5.27)

{(0, х), (х, 0)}, х = 1(а-1)«,а>1

и все другие РБС лежат на кривой

{(^гм:^ < * < и {(гс^):2-1 < *2 <

1

= (^т;—— 2х£ + v«2 — ] ,тах{0,^4-1} < x; < ^

При а > 2 в задаче конкуренции Таллока (5.4) существуют только два РБС {(0,х),(х,0)} (5.29)

Х2

1

о.в

0.8 X

0.4

0.2 О

Рисунок 44 - Безопасные профили и РБС при значениях параметра 0 < а < 1, 1 <

а < 2, а > 2

Безопасные профили и РБС показаны в плоскости стратегий (х^х2) на рисунке 44. Закрашенная (серая) область соответствует безопасным профилям. Выделенные точки и кривые показывают РБС.

Доказательство. (1) Для доказательства потребуются оценки для функций выигрышей игроков и^ (5.4) на верхней и нижней границах их опасных зон (5.5) %-(.хд> СЭти оценки кратко упоминались при выводе формул (5.18-21) наилучших безопасных ответов. Теперь докажем их подробно.

а < 1: 0 < х; < 4: и-1(х1, ГМ) > <Г+ (*;)), £ = 1,2 (5.30)

а > 1: (х;)) < ^-¿(х;, ^+ (х;)), I = 1,2 (5.31)

1

Пусть I = 1. Тогда <^±(х1) = _ 2х1 + ^а2 — . Заметим, что

х2+х2- = С+(х1)^-(х1) = х12. Поэтому для удобства введем переменную t = — (а — 2х1 + ^а2 — 4ах1). Если 0 < х1 < -, то получаем 0 < t < +о>. Тогда

2^1 v /4

1 _1 х2+ = х^«, х- = х^ а

1.

1.

Заметим также, что 1 + 1 1 = — — 2 или (1 + ¿)(1 + 1 1) = —. Тогда

+ _ (*2+)" + _ * _ *

" х1- + (*2+)« х2 " 1 + t х1 ^

- _ оо"

" х1- + (х-)« х2 " 1 + ¿-1 "

= -(^2 - х2 ) +

(1 + t)(1 + t2l)

= х1 ( 1 - - - 1 « )).

Если а = 1, то функция Ф = = 0.

х1

^Ф 1 Л 14 ( 1 -1

Если 0<а<1 (->1), то ¿«>¿>1 ^ +1 + ^ и — < >

\а Р <И

Если а

/ 1 \ 1 1 ^Ф

> 1 I 0 < - < 1 1, то <1 ^ + 1 а<t + t2l и- >0^>

V а ) М

Поскольку Ф(t = 1) = 0 V« > 0, то если 0 < а < 1, то < и- , а если а > 1, то > и-. Оценки доказаны.

(2) Если а > 2, то профиль (х*,х*) является РБС в соответствии утверждением 1.1, поскольку он является равновесием Нэша [Ти11оск 1980].

(3) Докажем, что профили (0, х), (х, 0) являются РБС при а > 1. Рассмотрим, например первый профиль. Игрок 1 не может увеличить свой выигрыш никаким отклонением. Поэтому профиль (0, х) удовлетворяет определению РБС для игрока 1. Рассмотрим игрока 2. Любое отклонение в профиль с х2 > х невыгодно для него. Отклонение в х2 = 0 небезопасно для игрока 2, поскольку игрок 1 может в ответ уменьшить его выигрыш до нуля произвольно малым отклонением. Докажем, что

1 а-1

отклонение игрока 2 в х2:0<х2<х = -(а — 1)~ < 1 также не является безопасным отклонением. Действительно, игрок 1 в ответ может отклониться в положение, произвольно близкое к х1 > 4-1: и1(х1,х2) = 0. Выражая х2 через х1;

а

±

получаем: х2 = х1 (■Г, х1 = 4-1. Докажем, что в этом случае и2(х1,х2) —

V У #

и2(0, х) = х — х1 — х2 < 0 для всех х2 £ (0, х), или

1(а - 1Г? < Х1 + (1= /(Х1),УХ1 £ р-1,1] (5.32)

i

Можно легко проверить, что /"(xi) = < 0 ПРИ а > 2.

# xi (1—^ij V ^i J

Поэтому a_mm /(xi) = min {/ (у—, /(1)} = min {y—1 + £ (a - 1)~ l} и

a <xl<-*-

оценка (5.32) выполняется. Отклонение игрока 2 в 0 < х2 < х не является безопасным отклонением. Таким образом, ни один игрок не может сделать безопасное отклонение в профиле (0, х) если а > 2, и он является РБС по определению. Рассуждая симметрично, получаем, что профиль (х, 0) также является РБС.

(4) Если а < 1, то все РБС профили должны лежать на границе множества безопасных профилей (5.12), найденной в Утверждении 5.1 (иначе любой игрок может безопасно увеличить свой выигрыш произвольно малым отклонением). Выберем произвольный профиль на этой границе, за исключением точки (х*,х*).

Согласно утверждению 5.1 он должен быть либо (^-1(х2),х2),х2 > х*, либо (х1,^-1(х1)),х1 > х*. Рассмотрим, например, первый случай. Поскольку х2 > х*, то х2 в соответствии с (5.6) может быть выражено как х2 = ^+(х1). Профиль (С-1(х2),х2) можно записать в виде (х1,^+(х1)). Тогда существует безопасное отклонение игрока 2 в профиль (х1, ^-(х1)). Действительно, согласно (5.30), получаем и2(х1,^-(х1)) > и2(х1,^+(х1)) при а < 1, и профиль (х1,^-(х1)) оказывается безопасным для игрока 2 (поскольку игрок 1 получает в этом профиле максимум своего выигрыша и не создаёт угрозы игроку 2). Таким образом, профиль (^-1(х2),х2),х2 > х* не является РБС. Рассуждая симметрично, получаем, что профиль (х1, С-1(х1)),х1 > х* также не является РБС. Поэтому при а < 1 не существует РБС профилей, отличных от (х*, х*).

(5) Если а > 1, то все РБС профили должны лежать на границе множества безопасных профилей (5.14), найденной в утверждении 5.1 (иначе любой игрок может безопасно увеличить свой выигрыш путём произвольно малого отклонения). С другой стороны, все РБС должны лежать в множестве {(х1, х2): тах(х1, х2) < х) (иначе по крайней мере один игрок получает отрицательный выигрыш и может безопасно отклониться в нулевую стратегию). Из этих двух условий следует, что при а>1 все РБС, кроме (0,х), (х, 0), должны лежать на кривой (5.28). В частности, это означает, что не существует других РБС, кроме (0, х), (х, 0) при а > 1. □

Рисунок 45 - Проверка множественных РБС

Замечание. Проведенные численные оценки подтвердили, что все точки на кривой (5.28) действительно являются множественными РБС.

Численное квази-доказательство. Согласно утверждению 5.3, когда 1 < а< 2, все РБС за исключением (х*,х*), (0,х), (х, 0) лежат на кривых в1 =

{(х1,^+(х1)):^-1 < х± < = {(С+(Х2),Х2):^-1 < Х2 < 1}. Рассмотрим,

например профили на кривой 62. Эти профили являются наилучшими ответами для игрока 2, который не может сделать выгодного отклонения. Поэтому определение РБС удовлетворяется для игрока 2. Рассмотрим игрока 1. В каждой точке 62 построим кривую безразличия для игрока 1 (смотри рисунок 45: С1, 62 изображены непрерывными линиями, кривая безразличия ¿7 пунктирной линией). Любое отклонение х]пах —> х1 первого игрока может быть эффективно наказано ответным отклонением второго игрока х2 —> х2(х1) + £ в малой окрестности чуть выше кривой безразличия первого игрока б. Формула кривой безразличия: 6(х2) =

I (х, Х2 (х)): Щ (х, Х2 (х)) = ~^+(Х1)=и0 О2) |,

а-1 1

-< х2 < -

а а

х = и0= таХла—а ~ х™ . Отсюда получаем явное выражение для

х<*+(х2(х)) 0 (х™ахГ+х:

1

кривой безразличия: ^2(х1) = х1

Вт"1)5

. Это строго вогнутая однопиковая

функция с максимум на кривой С1. Требуется доказать, что при любом (выгодном) отклонении х1 игрока 1 игрок 2 может сделать (выгодное) отклонение в окрестность ¿7 и эффективно «наказать» игрока 1 (так, что в новой позиции и1 < и0). Формально необходимо доказать, что ^2(х1,^2(х1)) > и2(х1,х2) для всех х1 таких, что и1(х1,х2) > и0. Тогда определение РБС будет удовлетворяться также для игрока 1. Для функции Ф(х1) = ^2(х1,^2(х1)) — и2(х1,х2) нужно проверить следующее условие:

Ф(х1) > 0: х™п < х1 < (х2),х2) = < х2 < 1 < а < 2.

Это условие было проверено численно для всех величин параметров (х1,х2,а) на равномерной сетке 500x500x500 точек Для вычисления очень малых величин функции Ф использовалось разложение Тейлора. Профили функции Ф(х1) для разных х2 при а = 1.0001,1.01,1.1,1.2,1.4,1.9 построены на рисунке 46. Функция Ф(х1) достаточно мала, но не имеет особенностей на плоскости (х1, х2). Она уменьшается резко до нуля, когда а —» 1.

0X001

0,00001

0.1

0.01

ОЛИ

000001

0.1 о.а ол ал а --.0001

ОЛ 0.7

но*

1>-|<Гг

(/ х;

Л \ \

г\ \

II

п.1 ол 1а 04 ал не от ■ ■ 1.01

VI (Г7

0-Р1

О.ОСП

икг* -

пит

01

0Л1

О.ОСП

0X001

С 30001 1*10* 1*1 о*

7/ f/ '-О \\

Ш У

И

Ц . 1.11....

0Л1

сом

04001

О 0.1 0.2 0.Э 0.4 0.5 0« 0.7 в-1.4

0.00001 1исг<

»ЯГЦГ* 1*1 (Г* 1*10«

О 0.1 0.2 0.2 0.4 0.Е 04 0.7 В-1.0

Рисунок 46 - Профили Ф(х1) для различных х1

Таким образом, произвольный профиль на кривой является РБС. Симметрично все профили на кривой являются РБС. Квази^

Как и равновесия Нэша, РБС могут быть ранжированы по Парето. Вычисляя и сравнивая выигрыши игроков в РБС, найденных в утверждении 5.3, можно установить следующий результат.

Следствие.

- Если 1 < а < а*, то все РБС доминируются по Парето равновесием Нэша (х*(а),х*(а)) = (4,-4), где а* « 1.08 находится из условия щ(х(а*),0) ==

(¿(а* - 1Г*Г,0) = щ(х*(а*),х*(а*)).

- Если а* < а < а**, то все РБС на кривой (5-28) доминируются по Парето равновесием Нэша (х*(а),х*(а)), где а** « 1.22 находится из условия

( Л а**-г „**_1\

щ(х(а**Ша*1) = [£;(«** - = щ(х*(а**),х*(а**)).

- Если а** < а < а***, то все РБС лежащие на некотором интервале кривой (5-28) доминируются по Парето равновесием Нэша (х*(а),х*(а)), где а*** =

_ диг(х£+(х))

у2 « 1.41 находится из условия-----

дх

= 0.

х=---0

4

- Если 1<а<2, то существуют два РБС, (х(а), (('+)_1(х(а))), (((+)_1(х(а)), х(а)), которые доминируются по Парето «монополистическими» РБС (0, х(а)), (х(а),0) соответственно.

- Если а = 2, то существует только одно РБС типа (5.28), (0.5,0.5), которое доминируется по Парето «монополистическими» РБС (0,х(а)),{х(а),0).

- Если 1 < а или а < 2, то все РБС оптимальны по Парето.

Когда а < 1.08, среди всех РБС парето-оптимальным является равновесие Нэша (х*,х*). Когда 1.08 < а<2, два «монополистических» РБС (0,х), (х, 0) сосуществуют с симметричным равновесием Нэша, но не доминируются им. Это

подобно равновесиям, которые сосуществуют в иллюстративном примере 2.3, матричной игры, рассмотренной ранее в главе 2.2:

а Ь с

А (0,0) (0,4) (0,3) В (4,0) (2,2) (-1,-1) С (3,0) (-1,-1) (-2,-2)

Равновесие Нэша (В,В) в этой игре соответствует симметричному равновесию Нэша, найденному Таллоком в состязании за ренту (Ти11оск 1980 [194]). Два других равновесия (А,С) и (С,А) соответствуют «монополистическим» равновесиям в игре борьбы за ренту. В этих равновесиях выигравший монополист устанавливает достаточно высокую плату за ренту, чтобы создать входной барьер для другого игрока, делая для него невыгодным участие в конкуренции. Отличие от матричной игры заключается, однако, в появлении промежуточных РБС, которые лежат на кривой (5-28). Когда а < 1.22, все эти равновесия доминируются по Парето равновесием Нэша (х*,х*). Однако, когда 1.22 < а < 2, они могут интерпретироваться как промежуточный тип решений, когда игроки участвуют в соревновании несимметрично. Один («более сильный») игрок с большим уровнем усилий выбирает свою стратегию х, а другой («более слабый») игрок корректирует свою стратегию, выбирая наилучший ответ (^+)-1(х) при заданном х. При этом слабый игрок всегда получает меньше, чем сильный игрок, и меньше, чем он получил бы в симметричном равновесии Нэша. Выигрыш слабого игрока монотонно уменьшается от величины его выигрыша в равновесии Нэша до нуля с увеличением усилий более сильного игрока. Можно показать, что если а > « 1.41, то выигрыш более сильного игрока монотонно возрастает вдоль кривой (5-28) с увеличением его усилий. Поэтому промежуточные РБС, лежащие на кривой (5.28), можно рассматривать как положения, которые по прибыльности находятся между симметричным равновесием Нэша и монопольным РБС. Когда сильный игрок постепенно увеличивает своё усилие и выигрыш, выигрыш слабого игрока

постепенно уменьшается до точки (у,х) = _ 1)~), в которой слабый

игрок покидает состязание, а сильный игрок устанавливает «монопольное» РБС.

Какова степень диссипации ренты в найденных РБС? Диссипация (растрачивание) ренты определяется как отношение суммарных усилий обоих игроков к стоимости приза, которая в нашем случае равна единице. Чем выше степень диссипации ренты, тем ниже эффективность равновесия.

0.8 0.6 0.4

0.2 о

0 0.5 1 01 15 2 25

Рисунок 47 - Минимальная и максимальная диссипация ренты в зависимости от а

о.

Для симметричного равновесия Нэша диссипация ренты х1 + х2 = - линейно

возрастает с ростом а и достигает единицы при а = 2 (смотри рисунок 47, сплошная линия). Когда 1 < а < 2, существуют множественные РБС на кривой

а а—1 1 а_1

(5.28) с диссипацией ренты в интервале ^ < + < + ~ (я _ 1) а , который

закрашен на рисунке 47 серым цветом. Видно, что все эти РБС менее эффективны, чем равновесие Нэша. Диссипация ренты для двух монополистических РБС

1 а-1

одинаково и задается как х1 + х2 = - (а — 1)~. Это показано на рисунке пунктирной линией. Видно, что при а < а < 2 (где а « 1.23 является решением

а 1 _

уравнения ^ — ^ (а ~ 1) а ) монополистическое РБС более эффективно, чем

равновесие Нэша. При а > 2 не существует равновесий Нэша в чистых стратегиях, а диссипация ренты в смешанных равновесиях равна единице, так что рента полностью диссипируется. Однако, при этом все еще существуют два

Х1+Х2 V ^ (

\ \ > \ у \ /

а

монополистических РБС, в которых диссипация ренты значительно меньше единицы. Следовательно, при а> 2 концепция РБС предлагает более эффективное решение, чем равновесие Нэша в смешанных стратегиях.

Случай многих игроков. Обобщим результат утверждения 5.3 на случай нескольких одинаковых игроков. В этом случае, однако, полностью характеризовать множество РБС в игре Таллока мы можем только для определенных значений а.

Утверждение 5.4. Рассмотрим задачу конкуренции за ренту п игроков с функциями выигрышей (5.3).

- Если а < то существует симметричное РБС (которое также является равновесием Нэша)

Х1 = Е У-'-'™} (5 33)

Если

k+l

К

< а < j- для некоторого 2 <к <п, то существует симметричное РБС (которое также является равновесием Нэша)

x¡ = к игроков, х* = 0 для всех остальных (5.34)

- Если а> 1, то существуют «монополистические» РБС

l а-1

Xi = х = i(a — 1)~, 3! i, Xj = 0, Vj ф i (5.35)

- Если а> 2, то в игре не существует РБС отличных от «монополистических» (5.35).

- Любое другое РБС х* при а < 2 удовлетворяет следующим условиям:

x¡ > rKzUlzU = $j*iXja)*,vi е {i.....п} (5.36)

Здесь задается (5.6) и, по крайней мере для одного i неравенство (5.36)

выполняется как равенство.

Доказательство. (1) Симметричное равновесие Нэша (5.33) было найдено Таллоком (Ти11оск 1980 [194]). Оно всегда существует при а < , и в

соответствии с утверждением 2-1, оно также является РБС.

(2) РБС (5.34) соответствует симметричному равновесию Нэша в игре к

к

игроков. Условие а < — гарантирует существование равновесия Нэша в игре к

к 1

&+1

игроков. Условие а > — гарантирует, что вхождение в игру невыгодно для

остальных (п-к) игроков. Можно непосредственно проверить, что (5.34) являются равновесиями Нэша (и следовательно также РБС) в игре п игроков.

(3) Определение РБС для профиля (5.35) может быть проверено непосредственно так же, как и в доказательстве утверждения 5.3.

(4) Докажем, что при а > 2 в игре не существует РБС отличных от «монополистических» (5.35). Пусть х* РБС. Согласно утверждению 2.3, х* также является НБО-профилем. Предположим, что

31,у * ** > 0,х;* > 0 (5.37)

Если х— > х, то должно быть х* = 0 (поскольку любые другие стратегии дают отрицательный выигрыш игроку /, и поэтому х* не мог бы быть НБО-профилем). Следовательно, х;* < х— < х. Рассуждая симметрично, получаем х* <

х. Если а < 2, получаем х < - и поэтому х* < х < -. При таких неравенствах

условие безопасности игрока у от угроз игрока I принимает вид: х* > ^-1(х-;) или ^-(х*) > х—. Используя определение (5-5) для это условие можно записать как

(х-;)* + (х*)а < ^-р- — — Поскольку 1 - VT^~t <1 при 0 < г < 1,

то следовательно (х-;)а + (х*)а < 2(х*)а, то есть (х;*)а < (х-;)а < (х*)а. Рассуждая симметрично, получаем (х*)а < (х;*)а. Это противоречие, и наше предположение (5.37) было неверным. Поэтому V/ Ф V. х;* = 0. Если х* < х, то всегда существует угроза со стороны других игроков выбрать ненулевую стратегию и получить положительный выигрыш с одновременным уменьшением

выигрыша игрока ¡. Если > х, то игрок I всегда может безопасно увеличить свой выигрыш, уменьшив свою стратегию до х. Поэтому единственное возможное РБС задаётся в виде (5.35).

(5) Неравенства (5.36) являются условиями безопасности всех игроков ] Ф I от угроз игрока ¡. Поэтому, согласно определению РБС, они должны быть выполнены для любого РБС. Если все эти неравенства строгие, то произвольный игрок может слегка уменьшить свою стратегию, не нарушая ни одного из них. Это безопасное отклонение и потому исходный профиль не может являться РБС.

Поэтому хотя бы для одного игрока неравенство (5.36) должно выполняться строго.

а а

Рисунок 48 - Выигрыши игроков и диссипация ренты в конкурентном и монопольном равновесии для случаев одного и многих игроков

В любом равновесии Нэша (5.34) есть два типа игроков: те, кто прилагают нулевое усилие, и те, кто прилагают положительное усилие, одинаковое для всех таких игроков. Монопольное равновесие (5.35) аналогично монопольному равновесию в игре двух игроков: один игрок прилагает ненулевое усилие, причём такое, что другие игроки не могут улучшить свою полезность, участвуя в состязании, и потому они выбирают нулевой уровень усилий. Когда а <1, все игроки заинтересованы в участии в игре (то есть VI: > 0). Когда а > 2, могут существовать только монопольные равновесия. Когда а Е [1,2], существует

промежуточная ситуация. Как и в случае с двумя игроками, монопольные равновесия могут сосуществовать с равновесиями, в которых все игроки выбирают ненулевые усилия. Графически выигрыши игроков и диссипация ренты в конкурентном и монопольном равновесии для случаев одного и многих игроков в зависимости от степенного параметра а представлены на рисунке 48.

Нечестная конкуренция двух игроков. Кларк и Рийс (Clark Riis 1996 [85]) расширили аксиоматическую характеристику функции успеха состязания Скапердаса (Skaperdas 1994 [185]) на случай нечестного конкурса, ослабив аксиому анонимности. Они показали, что функция успеха, которая монотонна по собственным усилиям игроков, не зависит от посторонних альтернатив и обладает однородностью нулевой степени, может быть определена однозначно. Соответствующая функция выигрышей для двух игроков может быть записана в виде аналогичном (5.4)

(^2^2 /С ООЧ

= а а ^2 = а а ^2 (5.38)

#2 Я1^1 + а2х?

Здесь а,а1,а2. Обозначим 7:l=—>у2=— и введем обозначения аналогичные (5.5, 5.6) (i £ {1,2})

1

f+Oi) = - 2xi+ 'max^^--1} < <4

1

= 2xi - v«2 -4axi)) , 0 < x; < ^

(5.39)

Xi = % l(x_i) =

r _ 1 a

(^+)-1(х_;),х_; > /¿a -

(f")"1(x_i),x_i < /¿a 7

(5.40)

4

Тогда функция наилучшего ответа игрока I принимает форму, подобную

(5.7):

гчх^о < а < 1

1 1 а-1

В я ¿(х- ¿) = \ г1 (х- > < а - 1)~ (5.41)

1 i а-1

0, а > 1, х_ j > /¿а1 ( а —

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.