РИД
№ 625122200380-1

Прототип программного агента с архитектурой глубокого обучения с подкреплением ADAM-альфа

22.12.2025

Программа для решения задач в области сильного искусственного интеллекта методами глубокого обучения с подкреплением. Создание роботов и программных агентов, способных самостоятельно обучаться решению новых классов задач, планировать и принимать самостоятельные решения. Принцип работы: получение входных сигналов (наблюдения и подкрепления) из внешней среды и выдача управляющих сигналов - действий. Планирование действий производится одновременно на многих временных масштабах, соответствующих количеству обучающихся вычислительных слоев. Используется дискретное символьное обучение.
ГРНТИ
28.23.25 Модели и системы обучения
Ключевые слова
искусственная психика роботов
самообучающиеся роботы
глубокое обучение с подкреплением
сильный искусственный интеллект
Детали

Тип РИД
Программа для ЭВМ
Сферы применения
Системы принятия решений, операционные системы самообучаемых роботов, нейроморфные чипы искусственной психики роботов
Ожидается
Исполнитель
Исполнители
Федеральное государственное автономное образовательное учреждение высшего образования "Московский физико-технический институт (национальный исследовательский университет)"
Заказчик
ФОНД ПОДДЕРЖКИ ПРОЕКТОВ НАЦИОНАЛЬНОЙ ТЕХНОЛОГИЧЕСКОЙ ИНИЦИАТИВЫ
Похожие документы
Программный Агент глубокого иерархического обучения с подкреплением ADAM Deep Control
0.976
РИД
Управление интеллектуальным агентом в условиях неполной информации
0.840
РИД
Программа для ЭВМ «АКТИВСНАП» для реализации машинного обучения машинно-обучаемого потенциала SNAP с активным обучением
0.832
РИД
Базовый класс Agent фреймворка для тренировки роботов методами машинного обучения Fluctio Sim
0.830
РИД
Комплекс для создания моделей физически-обоснованного обучения с подкреплением EPDE-RL
0.829
РИД
Методы мультиагентного обучения с подкреплением в условиях частичной наблюдаемости и динамических сред
0.824
Диссертация
Программа обучения робота шаговым движениям
0.823
РИД
Реализация отдельных компонент механизма обучения с подкреплением, основанного на моделях, в импульсных нейронных сетях
0.821
НИОКТР
Разработка прототипа многоагентной системы искусственного интеллекта
0.820
НИОКТР
Исследование динамики и управления мобильными роботами с использованием элементов интеллектуального управления
0.820
НИОКТР