»

Базы данных научно-технической информации

»

РИД: Загрузка...

РИД

№ 625011000639-9

Программный компонент для реализации функции наград в мультиагентной системе составления расписания в реальном времени с независимой оценкой

10.01.2025

Программа представляет собой симуляционную среду с заданным набором действий, состояний и функцией наград для обучения агентов искусственного интеллекта планированию совместного использования ресурсов. В обмен на пару состояние и действие среда возвращает агенту награду и определяет функцию перехода в следующее состояние. Среда поддерживает симуляцию одновременной работы нескольких агентов. В процессе обучения в среде участники извлекают оптимальные или субоптимальные эвристики коллективного поведения, которые можно передать новым агентам того же типа посредством дистилляции знаний. Цель среды – предоставить исследователям в области обучения с подкреплением платформу для численных экспериментов в области оптимизации расписаний коллективного использования ограниченных ресурсов.

ГРНТИ

28.23.02 Общие проблемы искусственного интеллекта

28.23.20 Формирование решений в интеллектуальной среде. Модели рассуждений

28.23.25 Модели и системы обучения

Ключевые слова

искусственный интеллект

обучение агентов

мультиагентная система

Детали

НИОКТР

№ АААА-А20-120032090063-2

Тип РИД

Программа для ЭВМ

Сферы применения

Обучение агентов искусственного интеллекта планированию совместного использования ресурсов.

Ожидается

Исполнитель

Исполнители

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ ИТМО"

Заказчик

МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

Похожие документы

Программа для моделирования поведения интеллектуальных агентов на основе адаптивных нечетких ситуационных сетей

Программа для моделирования распределенных сообществ интеллектуальных агентов

Программная библиотека агентного моделирования проектной деятельности в распределённых интеллектуальных системах

«Программное обеспечение для оптимизации многоагентных систем на основе метаэвристических методов»

Исследование возможностей операционной системы Linux для реализации мультиагентного обучения с подкреплением

Программный комплекс оптимизации процесса выполнения композитных приложений на основе обучения с подкреплением и нейронных сетей (NNS)

Методы мультиагентного обучения с подкреплением в условиях частичной наблюдаемости и динамических сред

Диссертация

Программа для автоматической генерации базы знаний агентов в редакторе мультиагентных нейрокогнитивных архитектур

Программный модуль настройки иерархической композиции алгоритмов обучения с подкреплением

Модуль моделирования поведения группы интеллектуальных подвижных объектов с элементами самообучения и информационного обмена