ИКРБС
№ 221032300348-0Этап №1"Разработка и техническая реализация (программный код и интерфейс) прототипа программного комплекса на основе нейронных сетей для анализа данных, полученных в результате использования систем отслеживания звонков и распознавания речи. Распознавание речи для создания первичного набора данных." (промежуточный)
09.03.2021
На данном этапе целью исследований ставилась подготовка акустической модели на базе нейронной сети для собственной системы распознавания речи (программный код и необходимый интерфейс). Это решение позволит в дальнейшем, совместно с внешней языковой моделью получить достаточное качество распознавания, чтобы с высокой точностью справляться с записями телефонных звонков, которые изобилуют специфическими терминами из различных отраслей. На следующих этапах хорошо распознанный текст может быть преобразован в различные признаки более высокого порядка и быть использован системой наряду с другими параметрами для предсказания вероятности заключения сделок.
Для выполнения данной задачи необходимо было решить базовые проблемы организации сбора и разметки собственных данных, собрать тестовый набор данных для определения качества моделей и получить базовый результат подтверждающий работоспособность модели.
Кроме того, необходимо было определиться с архитектурой сети, гиперпараметрами тренировки и запустить обучение, каждый цикл которого занимает несколько недель.
Еще одной задачей в рамках данного этапа было создание внутреннего сервиса для апробации натренерованых моделей.
В результате работы был налажен сбор данных пригодных для обучения системы распознавания речи.
Подготовлен процесс разметки, который для ускорения обработки был разбит на 2 этапа:
1) автоматизированный перевод
2) ручная чистка от ошибок
Разработана платформа для упрощения работы разметчиков. Создан минимальный базовый тестовый набор данных, сбалансированный по темам и отраслям.
Получен результат на бейзлайн системе. Была выбрана end-to-end модель, показывающая очень хорошие результаты на публичных академических наборах данных. Для обучения модели использовался открытый фреймверк Nemo и библиотека Pytorch для языка Python. Экспериментальным путем подобраны гиперпараметры сети и параметры для препроцессинга данных. Был найден и загружен большой, открытый корпус русского языка OpenSTT, насчитывающий 20000 часов аудиозаписей. На этом наборе была запущена предтренировку модели с целью последующего файнтьюнинга модели на внутреннем наборе аудио.
Была создана система, интегрирующая наши модели с сервисом компании, и позволяющая качественно оценивать её точность, с точки зрения пользователя.
Таким образом, все цели этапа могут считаться выполненными успешно.
ГРНТИ
28.23.37 Нейронные сети
Ключевые слова
прогнозирование поведенческих эффектов
система поддержки принятия решений
большие данные
коллтрекинг
искусственный интеллект
распознавании речи
анализ данных
нейронная сеть
Детали
Заказчик
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ "ФОНД СОДЕЙСТВИЯ РАЗВИТИЮ МАЛЫХ ФОРМ ПРЕДПРИЯТИЙ В НАУЧНО-ТЕХНИЧЕСКОЙ СФЕРЕ"
Исполнитель
ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "АЛЛОКА АНАЛИТИКА"
Бюджет
Средства фондов поддержки научной и (или) научно-технической деятельности: 3 000 000 ₽
Похожие документы
Разработка и тестирование прототипа программного комплекса на основе нейронных сетей для анализа данных, полученных в результате использования систем отслеживания звонков и распознавания речи. Заключительный.
0.960
ИКРБС
Этап №1 "Сбор и анализ исходных данных для формирования dataset. Формирование dataset для обучения нейронной сети. Обучение нейронной сети. Разработка подсистемы по транскрибированию аудиопотока в реальном времени. Разработка графического интерфейса". (Промежуточный).
0.937
ИКРБС
Сбор и разметка крупного набора данных.
Проведение экспериментов с обучением нейронной сети на собранном датасете и открытых датасетах для улучшения качества компоненты выделения ключевой информации и суммаризации.
Проведение экспериментов с обучением нейронной сети на собранном датасете и открытых датасетах для улучшения качества алгоритмов диаризации и распознавания речи.
Проведение функциональных испытаний качества работы продукта и его соответствия необходимым техническим характеристикам.
(промежуточный)
0.937
ИКРБС
Разработка прототипов движка для сервиса распознавания речи, работающего с русскоязычными моделями, модуля автоматического дообучения моделей, модели для фармацевтического рынка и универсальной модели (Договор №3117ГС1/48669 от 30.07.2019).Этап №2 "Подготовка данных для обучения универсальной модели. Разработка прототипа универсальной модели. Тестирование прототипа универсальной модели." (промежуточный)
0.921
ИКРБС
Разработка омниканальной системы разговорного искусственного интеллекта для ведения коммуникаций (заключительный)
0.919
ИКРБС
"Разработка и тестирование прототипа веб-приложения с инструментами речевой аналитики и оценкой эффективности переговоров"
(договор №10ГС1ИИС12-D7/71352 от 30.11.2021)
Этап №1"Сбор базы данных записей переговоров с сегментацией на реплики и фразы. Анализ реплик по строгим разработанным алгоритмам. Определение характеристик речи: вербальных (конкретные фразы и стоп-слова скриптов, тригеры) и невербальных (темп, тон, подача). Разработка прототипа веб-приложения с инструментами речевой аналитики и оценкой эффективности переговоров."
(промежуточный)
0.918
ИКРБС
Этап №1 «Разработка архитектуры программно-аналитического комплекса автономного сбора и обработки подходящей для анализа информации.
Разработка алгоритмов сбора и идентификации информации посредствам аудио и видео каналов с использование искусственного интеллекта.
Разработка модуля анализа, систематизации, классификации данных.
Разработка одностраничного web-приложения (single page applications, SPA) с доступом к аналитическим данным и дашборд доске для трёх уровней пользователей.
Формирование разметки данных.»
0.916
ИКРБС
Промежуточный научно-технический отчет по научно-исследовательской работе опытно-конструкторской работе (НИОКР). “Разработка технологического решения - интеллектуального программного модуля оценки эмоционального состояния диктора для поддержки принятия решений в контакт-центрах, на основе технологий искусственного интеллекта по распознаванию речи”. Этап 1.
0.916
ИКРБС
Разработка и тестирование прототипа аппаратно-программного комплекса для осуществления контроля за деятельностью сотрудников с помощью аудиоаналитики
0.916
ИКРБС
Этап №1"Сбор обучающей выборки (фото и видео людей перед камерой).Ручная разметка данных (направление взгляда, курение, распитие напитков, взаимодействие с телефонами, определение мимики человека, определения закрытых и открытых глаз). Разработка алгоритма определения направления взгляда человека.Разработка алгоритмов классификации открытого рта, а также промежутков времени, когда человек разговаривает, определение факта зевания.Разработка алгоритма определения курения.Разработка алгоритма определения распития напитков.Разработка алгоритма определения взаимодействия с телефоном.Комплекс работ по повышению точности и скорости функционирования имеющихся алгоритмов:
- Повышение точности и скорости работы алгоритма классификации открытых/закрытых глаз.
- Повышение точности и скорости работы алгоритма определения мимики человека.
Реализация алгоритмов в виде SDK (разработка ядра системы, на языке программирования С++). Составление ТЗ на веб- сервис с учетом характеристик разработанных алгоритмов, анализа запросов на рынке. Проектирование веб-сервиса.Начало разработки веб-сервиса (с «заглушками» вместо недостающих еще алгоритмов)." (промежуточный)
0.915
ИКРБС