РИД
№ 621122900397-6«Программа классификации строк распознанного документа»
29.12.2021
Программа может быть использована в системах электронных архивов в части ввода оцифрованных документов в компьютер. Целью работы программы является разбиение массива текстовых строк цветных отсканированных документов на сегменты, соответствующие логическим зонам документа. Особенностями программы является возможность классифицировать зоны различной природы, такие как колонки текста, абзацы, ограниченные линиями области. Основными функциями программы являются:
- загрузка распознанных строк страницы документа,
- загрузка описаний зон в виде массивов слабых классификаторов, состоящих из ключевых слов и стоп-слов,
- формирование альтернатив соответствия зонам массива строк,
- формирование кандидатов-зон документа,
- устранение конфликтов расположения кандидатов-зон документа,
- сохранение результатов формирования зон в формате XML
ГРНТИ
20.53.19 Средства обработки и поиска информации
20.23.19 Процессы информационного поиска
28.23.15 Распознавание образов. Обработка изображений
27.47.15 Математическая теория управляющих систем
Ключевые слова
признак
зона
строка
распознавание документов
Детали
Тип РИД
Программа для ЭВМ
Сферы применения
Системы анализа изображений
Ожидается
Исполнитель
Исполнители
Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук"
Заказчик
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Похожие документы
«Программа сортировки документов»
0.957
РИД
«Программа многозначной классификации распознанной страницы текстового документа с гибкой структурой»
0.953
РИД
«Программа сортировки распознанных многостраничных текстовых документов с гибкой структурой»
0.950
РИД
«Программа лингвистического дораспознавания полей документа»
0.947
РИД
«Программа машинного анализа текстов для выявления ключевых фраз»
0.942
РИД
«Программа извлечения множества реквизитов в распознанном документе»
0.942
РИД
«Программа многозначной классификации распознанной страницы многостраничного текстового документов с гибкой структурой в условиях ашумления»
0.941
РИД
«Программа извлечения множества образов реквизитов из распознанного зашумленного документа»
0.940
РИД
«Программа сортировки большого потока документов»
0.938
РИД
«Программа классификации распознанных текстовых деловых документов»
0.937
РИД