ИКРБС
№ 223121100070-1

Разработка и тестирование прототипа модулей извлечения поручений и вопросно-ответного поиска для программного обеспечения по транскрибации аудио- и видеозаписей профессиональных коммуникаций в рамках систем видеоконференцсвязи (договор №186ГС2ИИС12-D7/64243 от 23.12.2022) (заключительный)

10.12.2023

Сведение об отчете: Объем: 62 страницы Количество иллюстраций: 12 иллюстраций Количество приложений: 12 приложений Количество глав отчета: 8 глав Количество используемых источников: 25 источников Ключевые слова: распознование речи, извлечение поручений, вопросно-ответный поиск, машинное обучение, обработка естественного языка, автоматическое протоколирование, аналитика видеозвонков, natural language processing, LLM, large language models, большие языковые модели Цель работы: Разработка набора данных для обучения нейросетевой модели для выполнения задач вопросно-ответного поиска. Разработка архитектуры нейросетевой модели для выполнения задач вопросно- ответного поиска для обучения на собранном датасете. Разработка прототипа модуля вопросно-ответного поиска. Тестирование модуля вопросно-ответного поиска в рамках программного обеспечения по транскрибации аудио- и видеозаписей профессиональных коммуникаций в рамках систем видеоконференцсвязи. Разработка набора данных для обучения нейросетевой модели для выполнения задач по извлечению поручений. Разработка архитектуры нейросетевой модели для выполнения задач по извлечению поручений для обучения модели на собранном датасете. Разработка прототипа модуля извлечения поручений. Тестирование модуля извлечения поручений в рамках программного обеспечения по транскрибации аудио- и видеозаписей профессиональных коммуникаций в рамках систем видеоконференцсвязи. В рамках разработки модуля вопросно-ответного поиска и извлечения поручений и задач были разработаны алгоритмы для автоматизированного вопросно-ответного поиска, реализована программная архитектура. Внедрение алгоритмов извлечения embeddings и их сравнения позволило ускорить обработку запросов и повысить качество поиска. Извлечение embeddings было оптимизировано и вынесено на высокопроизводительный узел, что улучшило общую производительность. Переход на использование фреймворка Flax, JAX сократил время обработки запросов, что положительно сказалось на работе модуля. Внутренние испытания показали улучшение качества поиска по сравнению с исходной моделью. С применением больших языковых моделей был сгенерирован и размечен набор данных стенограмм видеозвонков. Была разработана методика, позволяющая учитывать контекст всей стенограммы и удалять дубликаты при извлечении поручений. Дообучение предтренированной модели OpenChat3.5 позволило достичь показателя точности в 92%. Оптимизация модели с использованием алгоритма AWQ и оптимизация графа выполнения нейронной сети позволили увеличить скорость обработки запросов модулем извлечения поручений. Будущие шаги включают проведения завершающих этапов тестирования и интеграцию модулей вопросно-ответного поиска и извлечения поручений и задач для улучшения производительности и удобства пользователей сервиса Teamlogs. Задачи данной НИОКР выполнены успешно, в соответствии календарным планом и техническим заданием. В результате НИОКР были разработаны алгоритмы вопросно-ответного поиска и извлечения поручений, подготовлены наборы данных, обучена нейросетевая модель, а также проведено дополнительное обучение большой языковой модели, произведена доработка заложенной архитектуры, разработан интерфейс пользователя.
ГРНТИ
20.19.29 Обработка изобразительных и аудиовизуальных документов
20.23.25 Информационные системы с базами знаний
20.19.19 Аннотирование и реферирование
28.23.29 Программная реализация интеллектуальных систем
28.23.39 Интеллектуальные базы знаний
Ключевые слова
большие языковые модели
large language models
natural language processing
аналитика видеозвонков
автоматическое протоколирование
обработка естественного языка
машинное обучение
вопросно-ответный поиск
извлечение поручений
распознавание речи
Детали

НИОКТР
Заказчик
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ "ФОНД СОДЕЙСТВИЯ РАЗВИТИЮ МАЛЫХ ФОРМ ПРЕДПРИЯТИЙ В НАУЧНО-ТЕХНИЧЕСКОЙ СФЕРЕ"
Исполнитель
ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "ТУДИЛАБ"
Бюджет
Средства фондов поддержки научной и (или) научно-технической деятельности: 8 000 000 ₽
Похожие документы
Этап №1 «Разработка набора данных для обучения нейросетевой модели для выполнения задач вопросно-ответного поиска. Разработка архитектуры нейросетевой модели для выполнения задач вопросно-ответного поиска для обучения на собранном датасете. Разработка прототипа модуля вопросно-ответного поиска. Тестирование модуля вопросно-ответного поиска в рамках программного обеспечения по транскрибации аудиои видеозаписей профессиональных коммуникаций в рамках систем видеоконференцсвязи.» (промежуточный)
0.960
ИКРБС
Сбор и разметка крупного набора данных. Проведение экспериментов с обучением нейронной сети на собранном датасете и открытых датасетах для улучшения качества компоненты выделения ключевой информации и суммаризации. Проведение экспериментов с обучением нейронной сети на собранном датасете и открытых датасетах для улучшения качества алгоритмов диаризации и распознавания речи. Проведение функциональных испытаний качества работы продукта и его соответствия необходимым техническим характеристикам. (промежуточный)
0.929
ИКРБС
Разработка и тестирование прототипа ИИ-ассистента для автоматизации транскрибации встреч, создания саммари, назначения задач и поиска информации по базе знаний (заключительный)
0.919
ИКРБС
Разработка омниканальной системы разговорного искусственного интеллекта для ведения коммуникаций (заключительный)
0.913
ИКРБС
ОТЧЕТ о выполнении НИОКР по теме: "Разработка и испытание прототипа сервиса гиперперсонализированного синтеза речи с обучением модели психометрического профилирования по речевым признакам и модели вариативного нейросетевого синтеза речи под психометрический профиль." (договор №41ГС1ИИС12-D7/71344 от 17.12.2021) Этап №1"Поиск, сбор и очистка аудиоданных датасета голосов звучащей речи. Перекрестная разметка датасета звучащей речи по психометрическим профилям с контролем уровня согласованности. Разведочный анализ датасета по извлеченным характеристикам речи, проверка адекватности распределения каждого из признаков, корректировка и фильтрация датасета. Обучение нейросетевой модели на задаче разделения речи по психометрическим профилям. Обучение модели синтеза речи с исследованием оптимальной нейросетевой архитектуры с использованием предобученного энкодера." (промежуточный)
0.910
ИКРБС
ОТЧЕТ о выполнении НИОКР по теме: "Разработка усовершенствованной системы разговорного машинного интеллекта Robovoice." (договор №686ГРНТИС5/71095 от 19.11.2021) Этап №1 "Разработка архитектуры программного модуля дообучения нейросетей и классификации намерений.Разработка модуля дообучения нейросетей и классификации намерений, включая первичное обучение сети. Разработка методик предварительных испытаний (тестирования) модуля дообучения нейросетей и классификации намерений. Проведение предварительных испытаний (тестирования) модуля дообучения нейросетей и классификации намерений. Корректировка модуля дообучения нейросетей и классификации намерений по результатам испытаний (тестирования). Разработка программной документации для модуля дообучения нейросетей и классификации намерений. Разработка архитектуры логического модуля дозапросов блока «Диалоговый менеджер». Разработка логического модуля дозапросов блока «Диалоговый менеджер». Разработка методик предварительных испытаний (тестирования) логического модуля дозапросов блока «Диалоговый менеджер». Проведение предварительных испытаний (тестирования) модуля логического модуля дозапросов блока «Диалоговый менеджер».Корректировка логического модуля дозапросов блока «Диалоговый менеджер». Разработка программной документации для логического модуля дозапросов блока «Диалоговый менеджер»." (промежуточный)
0.910
ИКРБС
Этап №1 «Разработка алгоритма автоматического обучения искусственного интеллекта, работающего на широком диапазоне размеченных данных. Разработка набора данных для автоматической корректировки ошибок, допускаемых алгоритмами распознавания текста (машинописного, машинопечатного и рукописного). Доработка модуля распознавания адресов, ФИО, названий организаций в документах для программного обеспечения.» (промежуточный)
0.909
ИКРБС
Разработка программного компонента «Управление базой знаний» и обучение нейросетевой модели распознавания русского языка
0.908
ИКРБС
Доработка прототипа Платформы голосовых роботов в части разработки и интеграции в платформу прототипов сервиса распознавания речи, поддерживающего адаптацию под акустическую специфику спикера, сервиса синтеза речи, реализующего автоматическую расстановку ударений в словах, а также сервиса обработки естественного языка." (договор №15ГС2ИИС12-D7/48669 от 01.12.2021) Этап №1"Обработка набора данных для обучения русскоязычной модели нейросети, синтезирующей речь, с двумя разными спикерами. Обучение моделей синтезирующей речь нейросети с мужским и женским голосами. Подготовка набора данных для обучения нейросети, расставляющей ударения в словах. Разработка прототипа сервиса синтеза речи, включающего модуль автоматической расстановки ударений. Разработка прототипа сервиса обработки естественного языка, включающего модуль вопросов-ответов. Доработка прототипа сервиса распознавания речи в части реализации потокового режима обработки. Интеграция в прототип платформы голосовых роботов прототипов сервиса синтеза речи, включающего модуль автоматической расстановки ударений в словах, и сервиса обработки естественного языка, включающего модуль вопросов-ответов" (промежуточный)
0.907
ИКРБС
Разработка и тестирование прототипа программного обеспечения для распознавания и обработки документов с помощью искусственного интеллекта (заключительный)
0.906
ИКРБС