Диссертация
№ 524112900134-6

Методы и алгоритмы нейросимвольного обучения и планирования поведения когнитивных агентов

29.11.2024

В диссертации предложены и теоретически обоснованы новые математические модели, методы и алгоритмы генерации поведения когнитивного агента в динамической среде. В работе впервые предложен единый подход к проблеме привязки символов за счет разработки методов нейросимвольной интеграции в обучении и планировании. Основные результаты исследования заключаются в следующем. Была разработана нейросимвольная архитектура управления поведением когнитивного агента, включающая в себя компоненты одновременного планирования и обучения, а также компонент концептуального планирования с использованием языковых моделей. Были разработаны модели и методы интеграции планирования и обучения с подкреплением, в том числе с использованием модели среды, для решения сложных визуальных и векторных задач управления поведением когнитивным агентом, в том числе в многоагентной постановке. Были созданы модели и методы объектно-центричного подхода к представлению сенсорной информации о статических сценах для использования в нейросимвольной архитектуре управления поведением когнитивного агента. Были разработаны модели и методы объектно-центричного обучения с подкреплением с использованием динамической модели среды для интеграции планирования и обучения в нейросимвольной архитектуре управления поведением когнитивного агента. Был усовершенствован ряд существующих моделей и методов обучения с подкреплением на основе модели мира, с моделями внутренней мотивации и с использованием эвристических планировщиков. Была разработана программная реализация системы управления робототехническими платформами с использованием языковых моделей для подзадачи планирования.
ГРНТИ
28.23.01 Общие вопросы искусственного интеллекта
27.47.23 Математические проблемы искусственного интеллекта
Ключевые слова
мобильная робототехника
когнитивные агенты
планирование поведения
нейросимвольная интеграция
обучение с подкреплением
Детали

Автор
Панов Александр Игоревич
Вид
Докторская
Целевое степень
Доктор физико-математических наук
Дата защиты
14.11.2024
Организация защиты
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "МОСКОВСКИЙ ФИЗИКО-ТЕХНИЧЕСКИЙ ИНСТИТУТ (НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ)"
Организация автора
Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук"
Похожие документы
Обучение с подкреплением с использованием сетевых векторно-символьных представлений в задаче интеллектуальной навигации когнитивных агентов
0.919
НИОКТР
Иерархическое обучение с подкреплением в задаче приобретения концептуальных процедурных знаний когнитивными агентами
0.904
НИОКТР
Разработка методов и алгоритмов нейросимвольного представления сцен в мультимодальных задачах
0.903
Диссертация
Исследование механизмов и построение моделей обучения, основанных на знаковых представлениях, в задаче планирования коллективного поведения
0.899
ИКРБС
Обобщение, обучение и эволюция в моделях автономных когнитивных агентов
0.899
НИОКТР
Разработка теоретических основ имитационного моделирования рассуждений и синтеза целенаправленного поведения интеллектуальных программных и робототехнических систем на основе мультиагентных нейрокогнитивных архитектур
0.899
НИОКТР
Разработка теоретических основ принятия решений и управления поведением автономных программных и робототехнических систем на основе мультиагентного моделирования нейрокогнитивных процессов.
0.898
НИОКТР
Обучение с подкреплением с использованием сетевых векторно-символьных представлений в задаче интеллектуальной навигации когнитивных агентов
0.897
НИОКТР
РАЗРАБОТКА МЕТОДОЛОГИИ МОДЕЛИРОВАНИЯ КОГНИТИВНЫХ ФУНКЦИЙ НА ОСНОВЕ ДАННЫХ НЕЙРОПСИХОЛОГИИ И НЕЙРОФИЗИОЛОГИИ, КОГНИТИВНОЙ ПСИХОЛОГИИ, ЛИНГВИСТИКИ
0.894
ИКРБС
Методология коллективного взаимодействия агентов интеллектуальных иерархических систем в процессе обучения с подкреплением при исследовании окружающего пространства
0.891
Диссертация