РИД
№ 623032200075-0«Библиотека результатов интервального оценивания качества нейронного машинного перевода (версия 1.0)»
22.03.2023
База данных библиотеки включает 3000 аннотаций с нейронным машинным переводом (НМП) текстовых фрагментов с русского на французский.
Машинные переводы сформированы на основе 250 авторских аннотаций в надкорпусной базы данных (НБД) коннекторов: на протяжении года (01.03.2019-07.02.2020) с шагом в один месяц в НБД происходила фиксация машинных переводов, полученных с помощью системы НМП Google Translate.
База данных предназначена для хранения результатов интервальной оценки качества НМП. Она содержит информацию о количестве и видах допущенных системой НМП ошибок, а также позволяет проследить изменение качества НМП с учетом временного показателя. В результате проведения интервальной оценки качества НМП для каждой аннотации приписывается рубрика, характеризующая стабильность/нестабильность НМП.
НБД включает фасетную классификацию, что позволяет классифицировать машинные переводы коннекторов и целых текстовых фрагментов по широкому спектру признаков и осуществлять детализированный поиск по ним, а также формировать статистические таблицы распределения двуязычных аннотаций по одному признаку или их сочетаниям.
ГРНТИ
20.01.07 Теория и методология информатики
20.15.05 Информационные службы, сети, системы в целом
50.33.04 Перспективные архитектуры. Архитектуры параллельной обработки
20.19.23 Перевод научных текстов
Ключевые слова
лингвистическое аннотирование
интервальная оценка
надкорпусная база данных
нестабильность машинного перевода
нейронный машинный перевод (НМП)
Детали
Тип РИД
База данных
Сферы применения
Осуществление двуязычного поиска аннотаций по коннекторам, лексическим единицам, а также признакам других кластеров;
Формирование экспериментального корпуса для последующих лингвистических исследований;
Сопоставление полученных результатов интервального оценивания качества НМП с результатами НМП, полученных с помощью других систем машинного перевода и/или выполненных в других направлениях перевода;
Использование результатов интервального оценивания качества НМП в преподавании студентам лингвистических и переводческих специальностей.
Ожидается
Исполнитель
Исполнители
Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук"
Заказчик
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Похожие документы
«Библиотека аннотаций для интервального оценивания качества нейронного машинного перевода (версия 1.0)»
0.959
РИД
«Библиотека аннотаций переводов коннекторов в русско-французских и французско-русских параллельных текстах (версия 2.0)»
0.903
РИД
«Библиотека аннотаций переводов коннекторов в русско-французских параллельных текстах (версия 1.0)»
0.899
РИД
«Библиотека моноэквиваленций лингвоспецифичных единиц в русско-французских параллельных текстах (версия 1.0)»
0.895
РИД
«Библиотека аннотаций дискурсивных слов в русско-французских параллельных текстах (версия 2.0)»
0.880
РИД
«Библиотека аннотаций дискурсивных слов в русско-французских параллельных текстах (версия 1.0)»
0.872
РИД
«Библиотека аннотаций модальных глаголов и их переводов в немецко-русских параллельных текстах (версия 1.0)»
0.869
РИД
Библиотека классов для определения семантических связей между информационными объектами
0.854
РИД
База аннотированных научно-технических текстов для обучения мультиязычных методов поиска и извлечения информации.
0.853
РИД
База данных результатов экспериментального исследования когнитивной обработки текстов ТРКИ инофонами
0.852
РИД