РИД
№ 621042800162-2

«Программа многозначной классификации распознанной страницы текстового документа с гибкой структурой»

28.04.2021

Программа может применяться для ввода оцифрованных документов в электронные архивы. Целью работы программы является отнесение образа страницы к одному или нескольким классам документов. Особенностями программы является возможность многозначной классификации документов.
ГРНТИ
20.53.19 Средства обработки и поиска информации
20.23.19 Процессы информационного поиска
28.23.15 Распознавание образов. Обработка изображений
27.47.15 Математическая теория управляющих систем
Ключевые слова
распознание текстов
Детали

Тип РИД
Программа для ЭВМ
Сферы применения
Программа обеспечивает выполнение следующих функций: - загрузка описаний нескольких документов в виде совокупностей дизъюнктивной нормальной формой (ДНФ) над ключевыми словами; - загрузка одностраничного изображения в виде результатов распознавания слов и символов с альтернативами и оценками распознавания; - поиск в результатах распознавания ДНФ; - классификация с помощью ДНФ; - сохранение результатов в формате XML для передачи в архив. Область применения программы: системы анализа изображений.
Ожидается
Исполнитель
Исполнители
Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук"
Заказчик
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ