РИД
№ 622012500162-7

«Программа сортировки документов»

25.01.2022

Программа может быть использована в системах электронных архивов в части ввода оцифрованных документов в компьютер. Целью работы программы является разбиение последовательности страниц цветных отсканированных документов на сегменты, соответствующие одному документу документов. Особенностями программы является возможность классификации последовательности многостраничных документов. Основными функциями программы являются: - загрузка описаний нескольких документов в виде совокупностей дизъюнктивной нормальной формой (ДНФ) над ключевыми словами; - загрузка одностраничных изображений в виде результатов распознавания слов и символов с альтернативами и оценками распознавания; - загрузка признаков найденных печатей и подписей в каждом их отсканированных цветных изображений; - поиск в результатах распознавания ДНФ; - классификация с помощью ДНФ; - комбинирование результатов классификации с помощью ДНФ и признаков найденных печатей и подписей, - принятие решения об отнесении страницы к одному из классов (первая, промежуточная, последняя) - сохранение результатов разбиения последовательности страниц в формате XML для передачи в архив.
ГРНТИ
20.53.19 Средства обработки и поиска информации
20.23.19 Процессы информационного поиска
28.23.15 Распознавание образов. Обработка изображений
27.47.15 Математическая теория управляющих систем
Ключевые слова
страница
классификация
распознавание документов
Детали

Тип РИД
Программа для ЭВМ
Сферы применения
Системы анализа изображений
Ожидается
Исполнитель
Исполнители
Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук"
Заказчик
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Похожие документы
«Программа сортировки распознанных многостраничных текстовых документов с гибкой структурой»
0.964
РИД
«Программа сортировки большого потока документов»
0.961
РИД
«Программа классификации строк распознанного документа»
0.957
РИД
«Программа многозначной классификации распознанной страницы текстового документа с гибкой структурой»
0.944
РИД
«Программа лингвистического дораспознавания полей документа»
0.937
РИД
«Программа извлечения множества реквизитов в распознанном документе»
0.932
РИД
«Программа машинного анализа текстов для выявления ключевых фраз»
0.929
РИД
«Программа определения разделяющих линий на изображении документа»
0.927
РИД
«Программа многозначной классификации распознанной страницы многостраничного текстового документов с гибкой структурой в условиях ашумления»
0.926
РИД
«Программа извлечения множества образов реквизитов из распознанного зашумленного документа»
0.924
РИД