НИОКТР
№ АААА-А16-116080510002-8

Разработка локальной версии системы ретроконверсии документов на основе технологий оптического распознавания и семантического анализа данных, ее программная реализация и отладка

13.07.2016

Разрабатываемая "Система ретроконверсии документов на основе технологий оптического распознавания и семантического анализа данных" предназначена для автоматизации потокового ввода печатных документов в учетные информационные системы. Использование продукта на предприятии сократит время затрачиваемое на ввод информации из печатной документации и освободит сотрудников от рутинной работы по наполнению информационной базы данными, что позволит более эффективно задействовать человеческие ресурсы в отделе бухгалтерского учета и прочих отделах организации. Помимо автоматического создания и наполнения карточек электронных документов в информационной базе, система будет прикреплять к ним исходное изображение отсканированного документа что позволит сформировать электронный архив.Разрабатываемый продукт будет производить обработку информации с печатных носителей загруженных в систему с помощью любых сканеров поддерживающих протокол сканирования TWAIN или ISIS, с возможностью поточного сканирования, а также обработку уже отсканированных изображений документов в форматах: tif, png, jpg, bmp, dcx, pcx, jp2, jpc, jpeg, jfif, pdf, tiff, gif, djvu, djv, jb2, wdp.По окончанию первого этапа разработки система должна поддерживать сканирование и распознавание документов вида: "Счет-фактура", "Товарная-накладная", "Счет", "Акт", "Универсальный передаточный документ". Помимо типовых шаблонов первичной документация система будет активно пополняется различными вариантами форм документов встречающихся в документообороте у покупателей системы, что позволит использовать систему для распознавания более 90% входящих первичных документов. На последующих этапах разработки планируется охватить такие документы как "Договор", "Письмо" и т.д. имеющие ряд обязательных реквизитов: название, дата, номер, получатель, отправитель и пр., что позволит автоматизировать создание электронных карточек с преобразованием данных реквизитов в объектный тип.Разрабатываемая система должна производить классификацию данных из печатного документа и наполнение учетной системы. После распознавания документа будет осуществляться поиск уже существующих в информационной базе элементов – контрагентов, организаций, материальных запасов, единиц измерения и т.д., а так же автоматическое заполнение справочников недостающими элементами на основании данных из печатного носителя.На основании анализа информационной базы пользователя будет происходить автоподбор счетов учета и прочих данных косвенно связанных с содержанием первичного документа. В процессе загрузки документов в систему учета, пользователь должен иметь возможность самостоятельно корректировать все данные полученные из печатного документа.В случае если наименования позиций в документе полученном от контрагента не соответствует наименованию данных позиций в базе пользователя система будет производить гибкий поиск основанный на использовании ряда сложных математических алгоритмов, позволяющих с заданной погрешностью подбирать соответствующие элементы из информационной базы по ключевым словам. Даже в том случае если названия сильно отличаются, пользователю достаточно будет один раз указать соответствие между ними, после чего система запомнит привязку и будет использовать ее при дальнейшей работе, что ускорит процесс поиска и позволит максимально автоматизировать процедуру подбора необходимых элементов. Система должна поддерживать возможность разноски данных из исходного документа по различным типам документов учетной системы с распределением номенклатуры по различным счетам учета, кодам финансового обеспечения и т.д.На выходе пользователь системы будет получать полностью заполненные документы созданные в информационной базе. "Система ретроконверсии документов на основе технологий оптического распознавания и семантического анализа данных" должна быть ориентирована на работу с различными конфигурациями учетных систем, а так же поддерживает специфику работы не только в коммерческих организациях , но и в государственных учреждениях.На первом этапе планируется разработка локальной версии системы рассчитанной на установку на рабочем месте пользователя и лицензируемая за каждое рабочее место, требующее функционал распознавания. На втором этапе планируется выпуск клиент-серверной версии для полноценной многопользовательской работы с движком распознавания, а так же облачная версия системы доступ к которой предоставляется в режиме аренды, при этом в краткосрочной перспективе имеющая достаточно низкую стоимость.Процесс обработки изображений (поступивших со сканера, либо из папки) будет основан на прохождения документом нескольких этапов (отраженных в пользовательском интерфейсе системы):1.Изображения – находятся отсканированные, но еще не распознанные изображения (не обязательный этап)2.Распознано – можно посмотреть результат распознавания (не обязательный этап)3.Подготовлено – можно посмотреть сверку с существующими элементами базы и внести корректировки (обязательный этап)4.Электронные Документы – на основании подготовленных документов возможно создание документов 1С (обязательный этап)5.Архив – на данный этап можно помещать отработанные документы (не обязательный этап).Доступность этапов в целом и видимость для отдельных пользователей должны определятся настройками системы, возможно разграничение этапов при многопользовательском режиме, например: Офис-менеджер – доступно только Изображения и Распознано, для загрузки документов в систему. Сотрудники бухгалтерии – только этап Подготовлено, для подготовки документов. Зам. гл. бухгалтера, главный бухгалтер – Электронные Документы и Архив, для просмотра, редактирования, проведения документов и перемещения отработанных документов в архив. Будет поддерживаться полностью автоматическое прохождение всех этапов, при этом если данных не достаточно система запросит недостающую информацию у пользователя."Система ретроконверсии документов на основе технологий оптического распознавания и семантического анализа данных" должна обладать дружественным интерфейсом интегрированным в учетную систему, простотой использования, небольшим размером, а также высокой скоростью обработки информации, что будет являться оптимальным решением задачи ввода печатных документов в учетные системы, существенно сокращая объем нагрузки на пользователя, позволяя обойтись без многих операций, традиционно выполняемых вручную, включая предварительную сортировку, клавиатурный набор и последующую ручную проверку. Благодаря сокращению затрат на ручной ввод данных пользователи быстро окупят свои вложения в систему.
ГРНТИ
20.19.27 Автоматизация знаковой обработки текста
Ключевые слова
РЕТРОКОНВЕРСИЯ ДОКУМЕНТОВ
РАСПОЗНАВАНИЕ ДОКУМЕНТОВ
РАСПОЗНАВАНИЕ ПЕРВИЧНЫХ ДОКУМЕНТОВ
АВТОМАТИЧЕСКИЙ ВВОД ДОКУМЕНТОВ В 1С
СКАНИРОВАНИЕ И РАСПОЗНАВАНИЕ ПЕРВИЧНЫХ ДОКУМЕНТОВ
ПОТОКОВЫЙ ВВОД ДОКУМЕНТОВ
СКАНИРОВАНИЕ И РАСПОЗНАВАНИЕ ТОВАРНОЙ-НАКЛАДНОЙ
СКАНИРОВАНИЕ И РАСПОЗНАВАНИЕ СЧЕТ-ФАКТУРЫ
СКАНИРОВАНИЕ И РАСПОЗНАВАНИЕ АКТА
СКАНИРОВАНИЕ И РАСПОЗНАВАНИЕ УНИВЕРСАЛЬНОГО ПЕРЕДАТОЧНОГО ДОКУМЕНТА
ЭЛЕКТРОННЫЙ АРХИВ
Детали

Начало
08.06.2016
Окончание
07.06.2017
№ контракта
1284ГС1/21753
Заказчик
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ "ФОНД СОДЕЙСТВИЯ РАЗВИТИЮ МАЛЫХ ФОРМ ПРЕДПРИЯТИЙ В НАУЧНО-ТЕХНИЧЕСКОЙ СФЕРЕ"
Исполнитель
Общество с ограниченной ответственностью "СКАНИ"
Бюджет
Средства фондов поддержки научной и (или) научно-технической деятельности: 2 000 000 ₽
Похожие документы
Разработка локальной версии системы ретроконверсии документов на основе технологий оптического распознавания и семантического анализа данных, ее программная реализация и отладка
1.000
НИОКТР
Разработка облачной и клиент-серверной версии системы ретроконверсии документов на основе технологий оптического распознавания и семантического анализа данных, и программная реализация интеграции ее с основными учетными информационными системами.
0.961
НИОКТР
Разработка локальной версии системы ретроконверсии документов на основе технологий оптического распознавания и семантического анализа данных, ее программная реализация и отладка
0.950
ИКРБС
"Разработка облачной и клиент-серверной версии системы ретроконверсии документов на основе технологий оптического распознавания и семантического анализа данных, и программная реализация интеграции ее с основными учетными информационнымисистемами."
0.931
ИКРБС
Проектирование и разработка общей архитектуры системы. Проектирование и разработка API для интеграции модулей в платформе. Разработка общего ядра технологической платформы документооборота. Разработка модуля полнотекстового распознавания (Full Text OCR) .
0.904
ИКРБС
Программный модуль для распознавания атрибутов в документах
0.893
РИД
Разработка алгоритма и модуля классификации и сепарации скан-образов по типу документов. Разработка инструмента обучения системы классификации новых типов документов. Разработка алгоритма и модуля извлечения индексных атрибутов из неструктурированных документов и настройки локаторов для их поиска. Обучение системы классификации первому типу документа. (промежуточный)
0.891
ИКРБС
Разработка системы электронного документооборота на основе искусственного интеллекта
0.876
ИКРБС
Система ретроконверсии документов на основе технологий оптического распознавания и семантического анализа данных ДОКНЕТ
0.873
РИД
Проектирование программного обеспечения, осуществляющего управление аппаратной частью сканирующей системы и интеллектуального программного обеспечения для обработки, управления и использования электронных архивов массивов данных
0.870
ИКРБС