ИКРБС
№ 223121900001-7Этап 1. Разработка архитектуры доработанного прототипа сервиса поиска норм и расценок на основе технологий искусственного интеллекта для групповой обработки запросов и поиска "лишних" и "пропущенных строк". Сбор датасета, состоящего из набора смет. Обучение модели с маскированными токенами на базе архитектуры трансформеров, где маскируемым токеном выступит код из сметы. Построение векторного пространства отражающую связь между элементами сметы. Разработка механизма кластеризации смет. Проектирование интерфейса.(промежуточный)
15.12.2023
Перечень ключевых слов: ФСНБ, Федеральная сметно-нормативная база, обработка естественного языка (NLP), векторизация, Faiss, семантическая близость, нейросеть, BERT, Python, FastText, ALS, матричная факторизация
Объем отчета: 53 с.
Количество иллюстраций: 36 рис.
Количество таблиц: 2 таблицы.
Объект: прототип сервиса поиска норм и расценок на основе технологий искусственного интеллекта.
Метод исследования: для выполнения НИОКР был выбран экспериментальный метод исследования с проведением предварительного анализа.
Цель работы 1 этапа:
• Разработка архитектура доработанного прототипа сервиса поиска норм и расценок на основе технологий искусственного интеллекта для групповой обработки запросов и поиска "лишних" и "пропущенных строк".
• Сбор и подготовка датасета, состоящий из набора смет.
• Обучение модели с маскированными токенами на базе архитектуры трансформеров, где маскируемым токеном выступит код из сметы.
• Построение векторного пространства отражающее связь между элементами сметы.
• Разработка механизма кластеризации смет.
• Разработка интерфейса сервиса поиска норм и расценок на основе искусственного интеллекта.
Результаты работы 1 этапа:
• Разработана архитектура доработанного прототипа сервиса поиска норм и расценок на основе технологий искусственного интеллекта для групповой обработки запросов и поиска "лишних" и "пропущенных строк".
• Собран датасет, состоящий из набора смет.
• Обучена модель с маскированными токенами на базе архитектуры трансформеров, где маскируемым токеном выступит код из сметы.
• Построено векторное пространство отражающее связь между элементами сметы.
• Разработан механизм кластеризации смет.
• Спроектирован интерфейс сервиса.
Оценка выполнения работ по этапу: запланированный объем работ по данному этапу
успешно выполнен полностью.
Выводы: в ходе реализации выполнения НИКОР по техническому заданию успешно
выполнены поставленные задачи в рамках 1 этапа по доработке прототипа сервиса
поиска норм и расценок на основе технологий искусственного интеллекта.
Область применения: составление сметной документации на основе сборников ФСНБ.
ГРНТИ
28.23.24 Модели восприятия информации в интеллектуальных системах
Ключевые слова
ALS
FastText
BERT
нейросеть
семантическая близость
Faiss
векторизация
NLP
Федеральная сметно-нормативная база
ФСНБ
Детали
НИОКТР
Заказчик
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ "ФОНД СОДЕЙСТВИЯ РАЗВИТИЮ МАЛЫХ ФОРМ ПРЕДПРИЯТИЙ В НАУЧНО-ТЕХНИЧЕСКОЙ СФЕРЕ"
Исполнитель
ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "НЕЙРОИНТЕЛЛЕКТ"
Бюджет
Средства фондов поддержки научной и (или) научно-технической деятельности: 4 000 000 ₽
Похожие документы
Разработка и тестирование прототипа сервиса поиска норм и расценок на основе технологий искусственного интеллекта
0.965
ИКРБС
Этап1. Разработка архитектуры прототипа сервиса поиска норм и расценок на основе технологий искусственного интеллекта. Векторизация каталога расценок Федеральной сметно-нормативной базы. Разработка справочников сателлитов к канонической базе. Разработка экспертного канонического справочника аналогов. Настройка индекса библиотеки алгоритмов поиска ближайших соседей в линейном пространстве. Разработка интерфейса для прототипа сервиса поиска норм и расценок на основе искусственного интеллекта.
0.963
ИКРБС
Доработка и тестирование прототипа cервиса обработки естественного языка для подбора методами искусственного интеллекта норм и расценок из Федеральной сметно-нормативной базы на основе технологий машинного обучения, веера нейросетей и совокупности современных/инновационных языковых моделей
0.949
ИКРБС
ОТЧЕТ
о выполнении НИОКР по теме:
«Разработка и тестирование прототипа системы автоматизированной оценки стоимости
строительства с возможностью генерации смет на основе анализа проектной
документации»
(договор №4795ГС1/80346 от 23.11.2022)
Этап №1 «Разработка библиотеки считывания, анализа и преобразования в данные
разделенных линий в PDF документе.
Доработка библиотеки, осуществляющей сбор данных сметных расценок.
Доработка клиентского интернет-приложения, разработка блока авторизации и
аутентификации с возможностью авторизации через сторонние сервисы, SSL защита
интернет-приложения.
Разработка структуры базы данных связей наборов ключевых слов и фраз с базой данных
сметных расценок.»
0.909
ИКРБС
Этап №1 “Подготовка датасетов. Сбор, обработка, разметка и валидация данных. Визуальная интерпретация данных. Доработка архитектурных составляющих прототипа. Разработка виджета оформления аренд на сторонних ресурсах, для сбора и учета дополнительных данных по пользовательской активности. Тестирование прототипа ПО. Тестирование виджета оформления аренд на сторонних ресурсах” (Промежуточный)
0.905
ИКРБС
Разработка и тестирование прототипов программных модулей для прогнозирования финансовых затрат и сроков в строительстве с возможностью интеграции в сторонние системы (заключительный)
0.904
ИКРБС
Разработка и тестирование прототипа системы автоматизированной оценки стоимости строительства с возможностью генерации смет на основе анализа проектной документации (заключительный)
0.902
ИКРБС
Этап №1 «Разработка пользовательских и функциональных требований. Разработка регрессионной и классификационной моделей на основе сета исторических данных компаний. Разработка процессов прогнозирования и оптимизации за счет применения ИИ для прогностической модели. Разработка внутренней части прототипа модуля автоматических публикаций вакансий. Разработка пользовательского интерфейса прототипа.» (промежуточный)
0.902
ИКРБС
«Проектирование базовой архитектуры прототипа системы автоматизированного обезличивания персональных данных. Разметка датасетов для обучения модуля NER прототипа системы автоматизированного обезличивания персональных данных. Разработка первой версии модуля NER. Апробация точности алгоритмов прототипа системы автоматизированного обезличивания персональных данных»(Договор 191ГС1ИИС12-D7/82038 от 25.12.2022) Этап №1 (промежуточный)
0.899
ИКРБС
Разработка системы мониторинга и аналитики информационного ландшафта на основе искусственного интеллекта.Этап №1 "Разработка компонентной базы для системы мониторинга и аналитики информационного ландшафта на основе искусственного интеллекта. Разработка пользовательского интерфейса на основе библиотеки компонентов. Разработка интерфейса администратора на основе библиотеки компонентов. Формирование набора данных из открытых источников сети Интернет (датасет), настройка и администрирование Системы. Разработка ядра системы. Разработка программы и методики испытаний для rest api системы и аналитики."
0.898
ИКРБС