НИОКТР
№ 123101300183-9

Разработка и тестирование прототипа программного обеспечения для распознавания и обработки документов с помощью искусственного интеллекта

07.11.2023

Проект посвящен доработке программного обеспечения для распознавания и обработки документов с помощью искусственного интеллекта. Программное обеспечение предназначено для улучшения бизнес-процессов корпоративного документооборота. Программа обеспечивает: получение документов в различных форматах; распознавание документов с помощью внешних компонент; разделение сканов на отдельные документы; классификация типов документов по типам; извлечение информации из различных типов документов; выполнение проверок и бизнес-правил; отображение документов и результатов выполнения бизнес правил в графическом интерфейсе пользователя; получение обратной связи от пользователя. Таким образом, станет возможным обеспечить автоматизацию документооборота на каждом его жизненном цикле. Разрабатываемое решение предназначено к использованию, в первую очередь, в следующих отраслевых решениях: банки, страховые компании, ритейл, финансовые компании, госсектор, логистика, медицина, авиакомпании. Внедрение программы DreamDocs в информационную среду позволит осуществить: 1. Использование LLM для анализа и распознавания полей в документах без предварительного обучения на большом объеме данных. LLM, как мощная языковая модель, способна понимать естественный язык и контекст, что делает ее полезным инструментом для обработки и анализа текста в документах. Мы планируем использовать способности LLM для распознавания структуры и семантики текста, а также для выделения и извлечения полей, таких как имена, даты, адреса и другие важные элементы информации, без предварительного обучения модели на большом количестве размеченных данных. Это позволит нам сократить время и усилия, затрачиваемые на подготовку и обучение модели, и обеспечит возможность быстрого и точного извлечения полей из документов с помощью LLM.
ГРНТИ
50.41.29 Программное обеспечение пользовательского интерфейса
Ключевые слова
LLM
обработка документов
распознавание документов
неструктурированные документы
Детали

Начало
03.07.2023
Окончание
02.07.2024
№ контракта
210ГС2ИИС12-D7/70630
Заказчик
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ "ФОНД СОДЕЙСТВИЯ РАЗВИТИЮ МАЛЫХ ФОРМ ПРЕДПРИЯТИЙ В НАУЧНО-ТЕХНИЧЕСКОЙ СФЕРЕ"
Исполнитель
ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "АПЭРБОТ"
Бюджет
Средства фондов поддержки научной и (или) научно-технической деятельности: 8 000 000 ₽
Похожие документы
Разработка системы электронного документооборота на основе искусственного интеллекта
0.899
НИОКТР
DreamDocs
0.895
РИД
Разработка интеллектуальной системы для распознавания и извлечения данных из структурированных и неструктурированных документов.
0.888
НИОКТР
Разработка платформы для извлечения данных из документов при помощи алгоритмов машинного обучения и системы верификации данных.
0.884
НИОКТР
Разработка и тестирование прототипа программного обеспечения для автоматической классификации, извлечения данных и пост-обработки документов.
0.883
НИОКТР
Программный модуль для распознавания атрибутов в документах
0.880
РИД
Разработка системы электронного документооборота на основе искусственного интеллекта
0.879
ИКРБС
Доработка прототипа цифровой платформы для настройки и реализации потокового ввода, сортировки , классификации и выверки данных из изображений.
0.879
НИОКТР
Разработка опытного образца сервиса для автоматизированного анализа и согласования документов с помощью Искусственного интеллекта
0.873
НИОКТР
Проектирование и разработка общей архитектуры системы. Проектирование и разработка API для интеграции модулей в платформе. Разработка общего ядра технологической платформы документооборота. Разработка модуля полнотекстового распознавания (Full Text OCR) .
0.871
ИКРБС