РИД
№ 621123000050-6

«Программа распознавания многостраничной таблицы»

30.12.2021

Программа предназначена для извлечения информации из образов таблиц в отсканированных документах. Особенностью программы является работа с многостраничными документами. Область применения программы: системы анализа образов документов. Программа обладает следующей функциональностью: - загрузка описаний таблиц в виде столбцов и строк, - загрузка набора горизонтальных и вертикальных линий, - фильтрация загруженных линий, - формирование горизонтальных зон нахождения таблиц, - проверка соответствия описаний таблиц массиву линий в предполагаемых зонах нахождения таблиц, - определение параметров наложенных таблиц, - анализ продолжения найденной таблице в образе следующей страницы документа, принятие решение о продолжении таблицы или о создании новой таблицы, - определение зон ячеек найденных таблиц с учетом многостраничности, - сохранение поименованных ячеек найденных таблиц.
ГРНТИ
20.53.19 Средства обработки и поиска информации
20.23.19 Процессы информационного поиска
28.23.15 Распознавание образов. Обработка изображений
27.47.15 Математическая теория управляющих систем
Ключевые слова
страница
линия
распознавание документов
Детали

Тип РИД
Программа для ЭВМ
Сферы применения
Системы анализа изображений
Ожидается
Исполнитель
Исполнители
Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук"
Заказчик
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ