РИД
№ АААА-Г18-618110790031-9«Программа вычисления вероятности появления мультиграмм слов в русской речи»
07.11.2018
Программа предназначена для использования в составе систем распознавания и обработки (автоматического перевода, распознавания языка) русской речи. Основная функция программы заключается в определении оценки вероятности совместного появления наборов (мультиграмм) слов в русской речи. Программа реализована в виде библиотеки. Входной информацией являются наборы слов(отдельные слова, пары слов, тройки и т.д.) в виде орфографической записи. Выходной информацией является численная оценка вероятности входного набора слов. Для ускорения вычислений и экономии памяти используются кратковременная хэш-память, а частоты мульиграмм и вероятности отступов кодируются 6-8 битами. Программа позволяет работать со словарями объемом более двух миллионов слов.Использование корректной модели языка обеспечивает эффективность автоматического распознавания речи.
ГРНТИ
28.01.05 Материалы общего характера
27.01.05 Материалы общего характера
20.01.07 Теория и методология информатики
Ключевые слова
АВТОМАТИЧЕСКОЕ РАСПОЗНАВАНИЕ РЕЧИ
МОДЕЛИРОВАНИЕ ЯЗЫКА
СТАТИСТИЧЕСКАЯ МОДЕЛЬ РУССКОГО ЯЗЫКА
МУЛЬТИГРАММНАЯ МОДЕЛЬ ЯЗЫКА
Детали
Тип РИД
Программа для ЭВМ
Сферы применения
Программа реализует статистическую модель русского языка, то есть производит оценку вероятности совместного появления заданных наборов (мультиграмм, триграмм, биграмм и униграмм) слов в русской речи. Эти вероятности далее используются в программном обеспечении для обработки и автоматического распознавания речи. Основное предполагаемое направление использования программы - в составе алгоритмического и программного обеспечения систем обработки (распознавания, выделения ключевых слов, речевой аналитики) русской устной речи.
Ожидается
Исполнитель
Исполнители
Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук"
Заказчик
Федеральное агентство научных организаций
Похожие документы
«Программа вычисления оптимального словаря псевдоморфем»
0.908
РИД
«Программа, реализующая склонение существительных на русском языке»
0.886
РИД
«Программа вычисления уровня пословных ошибок автоматического распознавания речи»
0.879
РИД
Программа формирования частотно-характеристической модели русскоязычных текстов
0.878
РИД
«Программа для лексического анализа текста»
0.876
РИД
«Программа сравнения распознанных текстов с помощью n-грамм»
0.873
РИД
«Программа выявления лингвистических признаков для анализа психологических характеристик автора текста»
0.872
РИД
«Программа поиска соответствия слов распознанного документа и множества ключевых слов»
0.868
РИД
Компьютерная программа оценки связности текстов на русском языке
0.866
РИД
«Программа оценки достоверности печати текстовых параграфов в образах документов»
0.862
РИД