РИД
№ 625011000639-9Программный компонент для реализации функции наград в мультиагентной системе составления расписания в реальном времени с независимой оценкой
10.01.2025
Программа представляет собой симуляционную среду с заданным набором действий, состояний и функцией наград для обучения агентов искусственного интеллекта планированию совместного использования ресурсов. В обмен на пару состояние и действие среда возвращает агенту награду и определяет функцию перехода в следующее состояние. Среда поддерживает симуляцию одновременной работы нескольких агентов. В процессе обучения в среде участники извлекают оптимальные или субоптимальные эвристики коллективного поведения, которые можно передать новым агентам того же типа посредством дистилляции знаний. Цель среды – предоставить исследователям в области обучения с подкреплением платформу для численных экспериментов в области оптимизации расписаний коллективного использования ограниченных ресурсов.
ГРНТИ
28.23.02 Общие проблемы искусственного интеллекта
28.23.20 Формирование решений в интеллектуальной среде. Модели рассуждений
28.23.25 Модели и системы обучения
Ключевые слова
искусственный интеллект
обучение агентов
мультиагентная система
Детали
Тип РИД
Программа для ЭВМ
Сферы применения
Обучение агентов искусственного интеллекта планированию совместного использования ресурсов.
Ожидается
Исполнитель
Исполнители
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ ИТМО"
Заказчик
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Похожие документы
Программа для моделирования поведения интеллектуальных агентов на основе адаптивных нечетких ситуационных сетей
0.869
РИД
Программа для моделирования распределенных сообществ интеллектуальных агентов
0.868
РИД
Программная библиотека агентного моделирования проектной деятельности в распределённых интеллектуальных системах
0.860
РИД
«Программное обеспечение для оптимизации многоагентных систем на основе метаэвристических методов»
0.859
РИД
Исследование возможностей операционной системы Linux для реализации мультиагентного обучения с подкреплением
0.856
НИОКТР
Программный комплекс оптимизации процесса выполнения композитных приложений на основе обучения с подкреплением и нейронных сетей (NNS)
0.855
РИД
Методы мультиагентного обучения с подкреплением в условиях частичной наблюдаемости и динамических сред
0.855
Диссертация
Программа для автоматической генерации базы знаний агентов в редакторе мультиагентных нейрокогнитивных архитектур
0.851
РИД
Программный модуль настройки иерархической композиции алгоритмов обучения с подкреплением
0.850
РИД
Модуль моделирования поведения группы интеллектуальных подвижных объектов с элементами самообучения и информационного обмена
0.848
РИД