РИД
№ АААА-Г18-618110790031-9

«Программа вычисления вероятности появления мультиграмм слов в русской речи»

07.11.2018

Программа предназначена для использования в составе систем распознавания и обработки (автоматического перевода, распознавания языка) русской речи. Основная функция программы заключается в определении оценки вероятности совместного появления наборов (мультиграмм) слов в русской речи. Программа реализована в виде библиотеки. Входной информацией являются наборы слов(отдельные слова, пары слов, тройки и т.д.) в виде орфографической записи. Выходной информацией является численная оценка вероятности входного набора слов. Для ускорения вычислений и экономии памяти используются кратковременная хэш-память, а частоты мульиграмм и вероятности отступов кодируются 6-8 битами. Программа позволяет работать со словарями объемом более двух миллионов слов.Использование корректной модели языка обеспечивает эффективность автоматического распознавания речи.
ГРНТИ
28.01.05 Материалы общего характера
27.01.05 Материалы общего характера
20.01.07 Теория и методология информатики
Ключевые слова
АВТОМАТИЧЕСКОЕ РАСПОЗНАВАНИЕ РЕЧИ
МОДЕЛИРОВАНИЕ ЯЗЫКА
СТАТИСТИЧЕСКАЯ МОДЕЛЬ РУССКОГО ЯЗЫКА
МУЛЬТИГРАММНАЯ МОДЕЛЬ ЯЗЫКА
Детали

Тип РИД
Программа для ЭВМ
Сферы применения
Программа реализует статистическую модель русского языка, то есть производит оценку вероятности совместного появления заданных наборов (мультиграмм, триграмм, биграмм и униграмм) слов в русской речи. Эти вероятности далее используются в программном обеспечении для обработки и автоматического распознавания речи. Основное предполагаемое направление использования программы - в составе алгоритмического и программного обеспечения систем обработки (распознавания, выделения ключевых слов, речевой аналитики) русской устной речи.
Ожидается
Исполнитель
Исполнители
Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук"
Заказчик
Федеральное агентство научных организаций
Похожие документы