Методы и алгоритмы нейросимвольного обучения и планирования поведения когнитивных агентов

29.11.2024

В диссертации предложены и теоретически обоснованы новые математические модели, методы и алгоритмы генерации поведения когнитивного агента в динамической среде. В работе впервые предложен единый подход к проблеме привязки символов за счет разработки методов нейросимвольной интеграции в обучении и планировании. Основные результаты исследования заключаются в следующем. Была разработана нейросимвольная архитектура управления поведением когнитивного агента, включающая в себя компоненты одновременного планирования и обучения, а также компонент концептуального планирования с использованием языковых моделей. Были разработаны модели и методы интеграции планирования и обучения с подкреплением, в том числе с использованием модели среды, для решения сложных визуальных и векторных задач управления поведением когнитивным агентом, в том числе в многоагентной постановке. Были созданы модели и методы объектно-центричного подхода к представлению сенсорной информации о статических сценах для использования в нейросимвольной архитектуре управления поведением когнитивного агента. Были разработаны модели и методы объектно-центричного обучения с подкреплением с использованием динамической модели среды для интеграции планирования и обучения в нейросимвольной архитектуре управления поведением когнитивного агента. Был усовершенствован ряд существующих моделей и методов обучения с подкреплением на основе модели мира, с моделями внутренней мотивации и с использованием эвристических планировщиков. Была разработана программная реализация системы управления робототехническими платформами с использованием языковых моделей для подзадачи планирования.

ГРНТИ

28.23.01 Общие вопросы искусственного интеллекта

27.47.23 Математические проблемы искусственного интеллекта

Ключевые слова

мобильная робототехника

когнитивные агенты

планирование поведения

нейросимвольная интеграция

обучение с подкреплением

Детали

Автор

Панов Александр Игоревич

Вид

Докторская

Целевое степень

Доктор физико-математических наук

Дата защиты

14.11.2024

Организация защиты

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "МОСКОВСКИЙ ФИЗИКО-ТЕХНИЧЕСКИЙ ИНСТИТУТ (НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ)"

Организация автора

Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук"

Похожие документы

Обучение с подкреплением с использованием сетевых векторно-символьных представлений в задаче интеллектуальной навигации когнитивных агентов

0.919

НИОКТР

Иерархическое обучение с подкреплением в задаче приобретения концептуальных процедурных знаний когнитивными агентами

0.904

НИОКТР

Разработка методов и алгоритмов нейросимвольного представления сцен в мультимодальных задачах

0.903

Диссертация