НИОКТР
№ 125100611207-6

Реализация отдельных компонент механизма обучения с подкреплением, основанного на моделях, в импульсных нейронных сетях

26.09.2025

Проект направлен на разработку структур импульсных нейронных сетей (ИмНС), решающих задачу обучения с подкреплением на основе моделей (model-based reinforcement learning). Такие ИмНС способны эффективно и непрерывно обучаться, взаимодействуя со сложной динамической окружающей средой на основе подаваемых на них сигналов поощрения и наказания, и влияния на внешний мир генерируемых сетью управляющих воздействий. В рамках данного проекта основное внимание будет уделено трем компонентам: 1. Оцениватель близости текущего состояния к целевому (в терминах регрессии или классификации), необходимый для системы планирования действий и определения промежуточных целей. 2. Построитель модели динамики внешнего мира (в терминах недетерминированных Марковских моделей). 3. Модуль нахождения ассоциаций между командами сети и сигналами оценки (как внешними, так и генерируемыми подсистемой промежуточных целей). Этот модуль может быть использован как самостоятельная обучающаяся сеть для решения простейших задач обучения с подкреплением.
ГРНТИ
28.23.37 Нейронные сети
Ключевые слова
нейрон - пороговый интегратор с утечкой
нейропроцессоры
хеббовское обучение
синаптическая пластичность
нейроморфные вычисления
обучение с подкреплением
импульсные/cпайковые нейронные сети
Детали

Начало
09.01.2025
Окончание
30.12.2026
№ контракта
25-21-00126
Заказчик
Российский научный фонд
Исполнитель
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "ЧУВАШСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИМЕНИ И.Н. УЛЬЯНОВА"
Бюджет
Средства фондов поддержки научной и (или) научно-технической деятельности: 3 000 000 ₽
Похожие документы
Изучение систем адаптивного контроля на основе нейронных сетей с предиктивной коррекцией клеточной активности
0.907
НИОКТР
Исследование и разработка алгоритмов генерации вознаграждения в задачах обучения с подкреплением на основе модели мира
0.901
Диссертация
Разработка принципов нейроморфного обучения с подкреплением в реальном времени на основе импульсных мемристивных систем
0.898
НИОКТР
Разработка принципов нейроморфного обучения с подкреплением в реальном времени на основе импульсных мемристивных систем
0.894
НИОКТР
Разработка методов и алгоритмов представления информации в обучении с подкреплением с использованием биологических принципов
0.884
Диссертация
Иерархическое обучение с подкреплением в задаче приобретения концептуальных процедурных знаний когнитивными агентами
0.877
НИОКТР
Методы мультиагентного обучения с подкреплением в условиях частичной наблюдаемости и динамических сред
0.876
Диссертация
Программа событийного моделирования импульсных моделей нейронных сетей с синаптической задержкой
0.873
РИД
Фундаментальные междисциплинарные исследования в нано-, био-, инфо- и когнитивных технологияхПо теме 1.3 МОДЕЛИРОВАНИЕ ПРИНЦИПОВ РАБОТЫ МОЗГА И ОБУЧЕНИЯ НЕЙРОСЕТЕВЫХ АЛГОРИТМОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ПО ОБРАБОТКЕ И АНАЛИЗУ ДАННЫХ (промежуточный, этап 2019 года)
0.873
ИКРБС
Методы и алгоритмы нейросимвольного обучения и планирования поведения когнитивных агентов
0.872
Диссертация