Программа, реализующая математическую модель на основе рекуррентных двунаправленных LSTM-сетей, для решения задачи подавления шума музыки в данных с речью, полученных с микрофонной решётки

03.12.2018

В составе программы применяются алгоритмы, основанные на нейронных сетях: mask prediction, обучающий нейронную сеть предсказывать бинарную маску полезного сигнала по входной спектрограмме смеси; deep clustering, выполняющий отделение речевого сигнала от музыкального шума. Надежность работы программы характеризуется отношением количества правильно распознанных слов к их общему количеству в произвольной выборке из аудиофайла в %: при ОСШ более 20 дБ, расстоянии до микрофона 2 м и времени реверберации до 700 мс, не менее 60 %; при ОСШ более 15 дБ, расстоянии до микрофона 2 м и времени реверберации до 700 мс, не менее 51 %.

ГРНТИ

28.23.33 Аппаратная реализация интеллектуальных систем

28.23.37 Нейронные сети

28.23.29 Программная реализация интеллектуальных систем

Ключевые слова

ШУМ МУЗЫКИ

МИКРОФОННАЯ РЕШЁТКА

РАСПОЗНАВАНИЕ РЕЧИ

Детали

НИОКТР

№ АААА-А17-117103070072-3

Тип РИД

Программа для ЭВМ

Сферы применения

Развитие технологий интеллектуального распознавания речи в сложных акустических условиях с использованием массива удаленных микрофонов и нейронных сетей.

Ожидается

Исполнитель

Исполнители

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ ИТМО"

Заказчик

Министерство образования и науки Российской Федерации

Похожие документы

Программа фильтрации речевого сигнала, полученного с микрофонной решетки, применяемая для распознавания речи при наличии тональных помех

0.910

РИД

Программа, обеспечивающая подавление помехи, исходящей от точечного источника шума, в речевом сигнале на данных, полученных с массива микрофонов

0.901