РИД
№ 621123000061-2

«Программа извлечения множества реквизитов в распознанном документе»

30.12.2021

Программа может быть использована в системах электронных архивов в части ввода оцифрованных документов в компьютер. Целью работы программы является извлечение реквизитов из распознанных документов. Особенностями программы является возможность извлечения из распознанного текста массива реквизитов, ограниченных одинаковыми ключевыми словами. Программа обеспечивает выполнение следующих функций: - загрузка описания документа в форме набора пар ключевых слов (ключевых фраз), ограничивающих реквизит справа и слева; - загрузка одностраничного изображения в виде результатов распознавания символов и слов; - поиск ключевых слов (ключевых фраз) из описания документа; - извлечение однострочных или многострочных значений реквизитов, ограниченных парами ключевых слов (ключевых фраз); - вычисление оценки надежности извлечения каждого из реквизитов; - выгрузка извлеченных реквизитов.
ГРНТИ
20.53.19 Средства обработки и поиска информации
20.23.19 Процессы информационного поиска
28.23.15 Распознавание образов. Обработка изображений
27.47.15 Математическая теория управляющих систем
Ключевые слова
ключевая фраза
реквизиты
распознавание документов
Детали

Тип РИД
Программа для ЭВМ
Сферы применения
Системы анализа изображений
Ожидается
Исполнитель
Исполнители
Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук"
Заказчик
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ