Развитие методов управления многоагентными системами в условиях конфликта (заключительный)

08.04.2025

Впервые показано, что в дифференциальных сетевых играх со многими участниками и с предписанной продолжительностью первоначальная сеть, определяющая оптимальное с точки зрения получения суммарного выигрыша агентами (игроками) в какой-то промежуточный момент развития процесса взаимодействия, может быть перестать быть таковой, и потребуется пересмотр сети, определяющей взаимодействие агентов (игроков). Предложен новый способ кооперативного поведения, учитывающий возможность изменения сети и обеспечивающий больший суммарный выигрыш игроков. Проверена его динамическая устойчивость (временная состоятельность), что является важнейшим свойством оптимальных решений. В случае, когда агенты (игроки), связанные в сеть, демонстрируют различные формы поведения (кооперативное, индивидуально-рациональное, безразличное), предложен принцип оптимальности, учитывающий данную ситуацию, показана его реализуемость и временная состоятельность. В конкретных дифференциальных играх на сетях с попарным взаимодействием типа охраны окружающей среды и оптимального распределения ресурсов в явном виде построены характеристические функции, вычислены значения векторов Шэпли и Тау вектора, доказана непустота ядра и в ряде случаев его выпуклость. В задачах с возможностью изменения сетевой структуры во времени с целью повышения эффективности МАС построен субоптимальный способ кооперативного поведения, корректирующего в конечные моменты изменения сетевой структуры. В этих же задачах построен субоптимальный способ кооперативного поведения, являющийся композицией локально-оптимальных кооперативных поведений на интервалах постоянства сетевой структуры. Исследована возможность построения аналога характеристической функции и вектора Шепли для указанных выше двух субоптимальных способах кооперативного поведения. Предложена математическая модель МАС со сложной сетевой структурой, в которой агенты связаны многоуровневой сетью, где они могут создавать или удалять связи на любом из уровней. Функции полезностей агентов заданы в общем и частных формах, которые отражают многоуровневость связей игроков. Рассмотрены различные подходы к определению устойчивых многоуровневых сетей, получены условия, гарантирующие устойчивость некоторых специальных многоуровневых сетей, включая звезду, полный граф и структуры, одинаковые на каждом уровне. В качестве примера простой МАС рассмотрена модель конечно повторяющейся игры типа «Дилемма заключенного». Для поддержания кооперации предлагается новый класс стратегий агентов таких, что отклонение игроков наказывается не до конца игры, а на период заданной продолжительности в зависимости от шага игры. Доказано существование приближенного равновесия в данных стратегиях, и найдено максимальное значение выигрыша агента при отклонении от данной ситуации приближенного равновесия. Разработана обобщенная модель динамики мнений в МАС, названная обобщенная модель скрытого избирателя (GCVM). Модель применима для любой двухслойной сети (с внутренним и внешним слоями). Проведена серия численных экспериментов с различными сетевыми структурами и получены результаты о взаимосвязи времени достижения консенсуса и вероятности победы определенного мнения от количественных характеристик сети. Также проведена серия численных экспериментов для наблюдения за тем, как динамика мнений зависит от структуры внутреннего слоя. Предложена математическая модель взаимодействия между странами или компаниями, загрязняющими общий регион, когда страны по-разному относятся к проблеме охраны окружающей среды. Рассмотрены все возможные сценарии кооперации или ее отсутствие. Сформулированы условия устойчивости всех возможных коалиционных структур. В случае, когда структура или сценарий не являются устойчивыми, предложено несколько способов создания устойчивой коалиционной структуры. Предложенные подходы могут быть основаны на трансферных платежах, ограничениях на формирование коалиций и введении дополнительных издержек при переходе игроков из одной коалиции в другую. В качестве примера МАС, функционирующей в экономической среде в присутствии неопределенности, рассмотрена система фирм, конкурирующих на рынке при неизвестном предложении. Агенты или фирмы (ритейлеры) принимают свои решения о продажах и заказах товаров в условиях неопределенности в параметрах спроса и предложения. Модель описывается игрой, разыгрываемой на дереве событий. Найдено нормализованное равновесие для данной игры, описана двухэтапная процедура поиска этого равновесия, получены необходимые условия равновесия и исследованы различные сценарии неопределенности в МАС с помощью численного моделирования. Разработаны методы управления многоагентными динамическими системами, находящимися под влиянием нескольких несимметричных участников с собственными интересами, выраженными векторными функциями выигрыша. Кооперативное и некооперативное поведение агентов получены в динамических бикритериальных моделях управления ресурсами. Для поддержания кооперативного поведения использована концепция регулируемого равновесия, где контроль над соблюдением кооперативного договора является стратегией центра. В многокритериальной динамической задаче управления ресурсами показано, что при применении предложенного подхода наказание отклоняющих от кооперативного договора участников линейно зависит от величины отклонения. Предложена новая концепция динамически стабильных по Нэшу коалиционных разбиений в динамических играх, которая определяется с использованием процедуры распределения дележа в кооперативной динамической игре.

ГРНТИ

28.29.05 Теория игр и ее применение в кибернетических системах

Ключевые слова

МНОГОАГЕНТНАЯ СИСТЕМА

СЕТЕВОЕ ВЗАИМОДЕЙСТВИЕ

УПРАВЛЕНИЕ

ДИНАМИЧЕСКАЯ ИГРА

РАВНОВЕСИЕ

КООПЕРАЦИЯ

Детали

НИОКТР

№ 122061000035-2