РИД
№ АААА-Г18-618120390040-4

Программа, реализующая математическую модель на основе рекуррентных двунаправленных LSTM-сетей, для решения задачи подавления шума музыки в данных с речью, полученных с микрофонной решётки

03.12.2018

В составе программы применяются алгоритмы, основанные на нейронных сетях: mask prediction, обучающий нейронную сеть предсказывать бинарную маску полезного сигнала по входной спектрограмме смеси; deep clustering, выполняющий отделение речевого сигнала от музыкального шума. Надежность работы программы характеризуется отношением количества правильно распознанных слов к их общему количеству в произвольной выборке из аудиофайла в %: при ОСШ более 20 дБ, расстоянии до микрофона 2 м и времени реверберации до 700 мс, не менее 60 %; при ОСШ более 15 дБ, расстоянии до микрофона 2 м и времени реверберации до 700 мс, не менее 51 %.
ГРНТИ
28.23.33 Аппаратная реализация интеллектуальных систем
28.23.37 Нейронные сети
28.23.29 Программная реализация интеллектуальных систем
Ключевые слова
ШУМ МУЗЫКИ
МИКРОФОННАЯ РЕШЁТКА
РАСПОЗНАВАНИЕ РЕЧИ
Детали

Тип РИД
Программа для ЭВМ
Сферы применения
Развитие технологий интеллектуального распознавания речи в сложных акустических условиях с использованием массива удаленных микрофонов и нейронных сетей.
Ожидается
Исполнитель
Исполнители
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ ИТМО"
Заказчик
Министерство образования и науки Российской Федерации
Похожие документы
Программа фильтрации речевого сигнала, полученного с микрофонной решетки, применяемая для распознавания речи при наличии тональных помех
0.910
РИД
Программа, обеспечивающая подавление помехи, исходящей от точечного источника шума, в речевом сигнале на данных, полученных с массива микрофонов
0.901
РИД
Программа распознавания аудио сигналов на основе MFCC-признаков и глубокой свёрточной модели с фиксированными параметрами
0.889
РИД
Разработка прикладного решения применения современных нейросетевых методов с использованием различных архитектур нейронных сетей для решения задачи выделения и записи речи заданного источника в шумовом окружении с использованием массива удаленных микрофонов
0.884
НИОКТР
Разработка и верификация алгоритмов разделения источников звукового сигнала на основе глубоких нейронных сетей. Этап 2
0.876
ИКРБС
Разработка новых методов улучшения качества речевых сигналов с использованием глубоких нейронных сетей
0.874
НИОКТР
Программа аудиоклассификации с гиперпараметрической оптимизацией и визуальной интерпретацией
0.870
РИД
Музыкально-речевая акустическая база данных для обучения алгоритма, производящего шумоочистку данных, полученных с массива удаленных микрофонов
0.868
РИД
Разработка новых методов улучшения качества речевых сигналов с использованием глубоких нейронных сетей
0.867
ИКРБС
Разработка методов и алгоритмов обработки звука методами спектрального анализа высокого разрешения и нейронных сетей глубокого обучения
0.866
ИКРБС