ИКРБС
№ 225040914587-1

ОТЧЕТ о выполнении НИОКР по теме: «Разработка и тестирование прототипа программно-аппаратного комплекса интеллектуальной голосовой аналитики в условиях зашумленного звукового окружения для офлайн-бизнеса» (договор Nº259ГС1ИИС12-D7/101251 от 11.10.2024) Этап Nº1 «Разработка аппаратной части прототипа интеллектуальной голосовой аналитики в условиях зашумленного звукового окружения. Сбор и разметка 250 часов аудио данных для дообучения моделей машинного обучения, представляющих аудио записи диалогов в естественных условиях звукового окружения. Дообучение и отладка лингвистических моделей на собранных данных для обеспечения доменной адаптации модуля распознавания речи. Разработка акустической модели предварительной обработки речевых сигналов для улучшения качества распознавания русскоязычной речи при воздействии фонового шума. Валидация и оценка качества разработанного решения по предварительной обработке речевых сигналов на тестовых данных и в реальных условиях.» (промежуточный)

08.04.2025

Отчет 34 с., 14 рис., 1 табл., 2 источн. ГОЛОСОВАЯ АНАЛИТИКА, МАШИННОЕ ОБУЧЕНИЕ, ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ, РАСПОЗНАВАНИЕ РЕЧИ, АКУСТИЧЕСКАЯ МОДЕЛЬ, ШУМОПОДАВЛЕНИЕ, БОЛЬШИЕ ЯЗЫКОВЫЕ МОДЕЛИ, ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА, ДООБУЧЕНИЕ МОДЕЛЕЙ, РАЗМЕТКА ДАННЫХ, SAAS Цель работы – разработать прототип программно-аппаратного комплекса интеллектуальной голосовой аналитики в условиях зашумленного звукового окружения для офлайн бизнеса. В результате выполнения первого этапа были выполнены следующие работы: - разработка аппаратной части прототипа интеллектуальной голосовой аналитики в условиях зашумленного звукового окружения; - сбор и разметка 250 часов аудио данных для дообучения моделей машинного обучения, представляющих аудио записи диалогов в естественных условиях звукового окружения; - дообучение и отладка лингвистических моделей на собранных данных для обеспечения доменной адаптации модуля распознавания речи; - разработка акустической модели предварительной обработки речевых сигналов для улучшения качества распознавания русскоязычной речи при воздействии фонового шума; - валидация и оценка качества разработанного решения по предварительной обработке речевых сигналов на тестовых данных и в реальных условиях. Объем работ, запланированный по первому этапу, выполнен в полном объеме и в срок в соответствии с техническим заданием и календарным планом.
ГРНТИ
20.53.19 Средства обработки и поиска информации
Ключевые слова
ГОЛОСОВАЯ АНАЛИТИКА
МАШИННОЕ ОБУЧЕНИЕ
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
РАСПОЗНАВАНИЕ РЕЧИ
ШУМОПОДАВЛЕНИЕ
ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА
РАЗМЕТКА ДАННЫХ
SAAS
Детали

НИОКТР
Заказчик
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ "ФОНД СОДЕЙСТВИЯ РАЗВИТИЮ МАЛЫХ ФОРМ ПРЕДПРИЯТИЙ В НАУЧНО-ТЕХНИЧЕСКОЙ СФЕРЕ"
Исполнитель
ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "КАРМА АНАЛИТИКА"
Бюджет
Средства фондов поддержки научной и (или) научно-технической деятельности: 2 000 000 ₽
Похожие документы
Разработка и тестирование прототипа программно-аппаратного комплекса интеллектуальной голосовой аналитики в условиях зашумленного звукового окружения для офлайн-бизнеса (заключительный)
0.944
ИКРБС
ОТЧЕТ о выполнении НИОКР по теме: "Разработка и испытание прототипа сервиса гиперперсонализированного синтеза речи с обучением модели психометрического профилирования по речевым признакам и модели вариативного нейросетевого синтеза речи под психометрический профиль." (договор №41ГС1ИИС12-D7/71344 от 17.12.2021) Этап №1"Поиск, сбор и очистка аудиоданных датасета голосов звучащей речи. Перекрестная разметка датасета звучащей речи по психометрическим профилям с контролем уровня согласованности. Разведочный анализ датасета по извлеченным характеристикам речи, проверка адекватности распределения каждого из признаков, корректировка и фильтрация датасета. Обучение нейросетевой модели на задаче разделения речи по психометрическим профилям. Обучение модели синтеза речи с исследованием оптимальной нейросетевой архитектуры с использованием предобученного энкодера." (промежуточный)
0.942
ИКРБС
ОТЧЕТ о выполнении НИОКР по теме: «Разработка и испытание прототипа сервиса гиперперсонализированного синтеза речи с обучением модели психометрического профилирования по речевым признакам и модели вариативного нейросетевого синтеза речи под психометрический профиль.» (договор №41ГС1ИИС12-D7/71344 от 17.12.2021) (заключительный)
0.929
ИКРБС
Отчет о выполнении НИОКР по теме: "Доработка и тестирование прототипа программного решения по автоматической разметке аудиопротоколов телефонных коммуникаций для контроля и обучения сотрудников отделов продаж" (договор №4024ГС2/45429 от 11.05.2021). Этап №1 "Разработка и испытание модуля шумоподавления для улучшения качества транскрибации и диаризации аудиозаписей телефонной коммуникации. Разработка и испытания алгоритма объединения результатов транскрибации, полученных от различных провайдеров, для улучшения качества транскрибации. Разработка форм отчетов на основе анализа данных речевой аналитики. Разработка прототипов интерфейсов отчетов на основе анализа данных речевой аналитики."(промежуточный)
0.928
ИКРБС
ОТЧЕТ о выполнении НИОКР по теме: "Разработка прототипа ядра для системы интеллектуального анализа текста, полученного в результате автоматизированного анализа аудио-потока и проведение испытания платформы разработки голосовых диалоговых интерфейсов" (договор No3730ГС2/63287 от 02.12.2020) Этап №1"Разработка структуры прототипа ядра для интеллектуального анализа текста, полученного в результате автоматизированного анализа аудио-потока. Разработка классификаторов для анализа сообщений пользователей (на базе регулярных выражений, на базе принципов дистрибутивной семантики). Разработка прототипа классификатора для обеспечения переключения между нейросетевыми и прочими алгоритмами анализа информации. Разработка прототипа модуля работы с ошибками, допускаемыми пользователями. Разработка прототипа системы автоматического тестирования диалогов." (промежуточный)
0.927
ИКРБС
Доработка прототипа Платформы голосовых роботов в части разработки и интеграции в платформу прототипов сервиса распознавания речи, поддерживающего адаптацию под акустическую специфику спикера, сервиса синтеза речи, реализующего автоматическую расстановку ударений в словах, а также сервиса обработки естественного языка." (договор №15ГС2ИИС12-D7/48669 от 01.12.2021) Этап №1"Обработка набора данных для обучения русскоязычной модели нейросети, синтезирующей речь, с двумя разными спикерами. Обучение моделей синтезирующей речь нейросети с мужским и женским голосами. Подготовка набора данных для обучения нейросети, расставляющей ударения в словах. Разработка прототипа сервиса синтеза речи, включающего модуль автоматической расстановки ударений. Разработка прототипа сервиса обработки естественного языка, включающего модуль вопросов-ответов. Доработка прототипа сервиса распознавания речи в части реализации потокового режима обработки. Интеграция в прототип платформы голосовых роботов прототипов сервиса синтеза речи, включающего модуль автоматической расстановки ударений в словах, и сервиса обработки естественного языка, включающего модуль вопросов-ответов" (промежуточный)
0.926
ИКРБС
ОТЧЕТ о выполнении НИОКР по теме: "Разработка усовершенствованной системы разговорного машинного интеллекта Robovoice." (договор №686ГРНТИС5/71095 от 19.11.2021) Этап №1 "Разработка архитектуры программного модуля дообучения нейросетей и классификации намерений.Разработка модуля дообучения нейросетей и классификации намерений, включая первичное обучение сети. Разработка методик предварительных испытаний (тестирования) модуля дообучения нейросетей и классификации намерений. Проведение предварительных испытаний (тестирования) модуля дообучения нейросетей и классификации намерений. Корректировка модуля дообучения нейросетей и классификации намерений по результатам испытаний (тестирования). Разработка программной документации для модуля дообучения нейросетей и классификации намерений. Разработка архитектуры логического модуля дозапросов блока «Диалоговый менеджер». Разработка логического модуля дозапросов блока «Диалоговый менеджер». Разработка методик предварительных испытаний (тестирования) логического модуля дозапросов блока «Диалоговый менеджер». Проведение предварительных испытаний (тестирования) модуля логического модуля дозапросов блока «Диалоговый менеджер».Корректировка логического модуля дозапросов блока «Диалоговый менеджер». Разработка программной документации для логического модуля дозапросов блока «Диалоговый менеджер»." (промежуточный)
0.925
ИКРБС
ОТЧЕТ о выполнении НИОКР по теме: «Разработка и тестирования прототипа платформы речевой аналитики по тематике продаж с простым пользовательским интерфейсом» (договор №130ГС1ИИС12-D7/76687 от 14.06.2022) Этап №1 «Разработка модуля диаризации (разделения голосов дикторов) для записей, сделанных в один аудиоканал. Разработка модуля определения эмоций говорящих на основе анализа звуковой волны. Разработка модуля выделения интентов (намерений) говорящих.» (промежуточный)
0.925
ИКРБС
Разработка алгоритмов предобработки аудио-речевой информации для выделения признаков аудиосигнала в зашумленной аудиосреде. Разработка архитектуры искусственной нейронной сети акустической модели для обработки зашумленных данных. Разработка лингвистической модели прототипа системы распознавания речи. Создание обучающего набора данных для обучения прототипа системы распознавания речи в зашумленной акустической среде на конечных устройствах пользователей, включающего зашумленные аудиозаписи, путем транскрибации аудиозаписей. Тестирование качества работы алгоритма прототипа системы распознавания речи в аудиофайлах, полученных в зашумленной акустической среде на конечных устройствах пользователей.
0.925
ИКРБС
Отчет о выполнении НИОКР по теме: Доработка и тестирование прототипа программного решения по автоматической разметке аудиопротоколов телефонных коммуникаций для контроля и обучения сотрудников отделов продаж. Этап первый (промежуточный) по договору №4024ГС2/45429 от 11.05.2021 г. (код 0068117) на выполнение НИОКР от 11 мая 2021 г. Заявка №С2-100353
0.921
ИКРБС