Разработка и тестирование прототипа программного обеспечения для распознавания и обработки документов с помощью искусственного интеллекта

07.11.2023

Проект посвящен доработке программного обеспечения для распознавания и обработки документов с помощью искусственного интеллекта. Программное обеспечение предназначено для улучшения бизнес-процессов корпоративного документооборота. Программа обеспечивает: получение документов в различных форматах; распознавание документов с помощью внешних компонент; разделение сканов на отдельные документы; классификация типов документов по типам; извлечение информации из различных типов документов; выполнение проверок и бизнес-правил; отображение документов и результатов выполнения бизнес правил в графическом интерфейсе пользователя; получение обратной связи от пользователя. Таким образом, станет возможным обеспечить автоматизацию документооборота на каждом его жизненном цикле. Разрабатываемое решение предназначено к использованию, в первую очередь, в следующих отраслевых решениях: банки, страховые компании, ритейл, финансовые компании, госсектор, логистика, медицина, авиакомпании. Внедрение программы DreamDocs в информационную среду позволит осуществить: 1. Использование LLM для анализа и распознавания полей в документах без предварительного обучения на большом объеме данных. LLM, как мощная языковая модель, способна понимать естественный язык и контекст, что делает ее полезным инструментом для обработки и анализа текста в документах. Мы планируем использовать способности LLM для распознавания структуры и семантики текста, а также для выделения и извлечения полей, таких как имена, даты, адреса и другие важные элементы информации, без предварительного обучения модели на большом количестве размеченных данных. Это позволит нам сократить время и усилия, затрачиваемые на подготовку и обучение модели, и обеспечит возможность быстрого и точного извлечения полей из документов с помощью LLM.

ГРНТИ

50.41.29 Программное обеспечение пользовательского интерфейса

Ключевые слова

LLM

обработка документов

распознавание документов

неструктурированные документы

Детали

Начало

03.07.2023

Окончание

02.07.2024