РИД
№ 621123000061-2«Программа извлечения множества реквизитов в распознанном документе»
30.12.2021
Программа может быть использована в системах электронных архивов в части ввода оцифрованных документов в компьютер. Целью работы программы является извлечение реквизитов из распознанных документов. Особенностями программы является возможность извлечения из распознанного текста массива реквизитов, ограниченных одинаковыми ключевыми словами. Программа обеспечивает выполнение следующих функций:
- загрузка описания документа в форме набора пар ключевых слов (ключевых фраз), ограничивающих реквизит справа и слева;
- загрузка одностраничного изображения в виде результатов распознавания символов и слов;
- поиск ключевых слов (ключевых фраз) из описания документа;
- извлечение однострочных или многострочных значений реквизитов, ограниченных парами ключевых слов (ключевых фраз);
- вычисление оценки надежности извлечения каждого из реквизитов;
- выгрузка извлеченных реквизитов.
ГРНТИ
20.53.19 Средства обработки и поиска информации
20.23.19 Процессы информационного поиска
28.23.15 Распознавание образов. Обработка изображений
27.47.15 Математическая теория управляющих систем
Ключевые слова
ключевая фраза
реквизиты
распознавание документов
Детали
Тип РИД
Программа для ЭВМ
Сферы применения
Системы анализа изображений
Ожидается
Исполнитель
Исполнители
Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук"
Заказчик
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Похожие документы
«Программа извлечения множества образов реквизитов из распознанного зашумленного документа»
0.973
РИД
«Программа извлечения адресата из изображения документа»
0.944
РИД
«Программа сортировки распознанных многостраничных текстовых документов с гибкой структурой»
0.944
РИД
«Программа машинного анализа текстов для выявления ключевых фраз»
0.942
РИД
«Программа классификации строк распознанного документа»
0.942
РИД
«Программа лингвистического дораспознавания полей документа»
0.939
РИД
«Программа создания карточки распознанного текстового делового документа»
0.937
РИД
«Программа распознавания многостраничной таблицы»
0.933
РИД
«Программа сортировки документов»
0.932
РИД
«Программа многозначной классификации распознанной страницы текстового документа с гибкой структурой»
0.931
РИД