ИКРБС
№ 223061300094-4

«Проектирование базовой архитектуры прототипа системы автоматизированного обезличивания персональных данных. Разметка датасетов для обучения модуля NER прототипа системы автоматизированного обезличивания персональных данных. Разработка первой версии модуля NER. Апробация точности алгоритмов прототипа системы автоматизированного обезличивания персональных данных»(Договор 191ГС1ИИС12-D7/82038 от 25.12.2022) Этап №1 (промежуточный)

13.06.2023

Отчет представлен на 44 страницах. Отчет содержит 12 рисунков, 8 таблиц и 11 источников. Отчет состоит из введения, основной части (главы 1-4), заключения и библиографии. Ключевые слова: персональные данные, архитектура, генератор, нейронная сеть, модель, точность, датасет. Целями текущего этапа являются: 1. Проектирование базовой архитектуры прототипа системы автоматизированного обезличивания персональных данных. 2. Разметка датасетов для обучения модуля NER прототипа системы автоматизированного обезличивания персональных данных. 3. Разработка первой версии модуля NER. 4. Апробация точности алгоритмов прототипа системы автоматизированного обезличивания персональных данных Разрабатываемый продукт предназначен для автоматического нахождения персональных данных в отсканированных или электронных медицинских документах, определения типа найденных персональных данных и их автоматического обезличивания. Потребители продукта – медицинские организации, а так же финансовые, юридические и государственные организации, ввиду их необходимости взаимодействия с персональными данными пользователей. В рамках этапа 1 НИОКР были достигнуты следующие результаты: 1. Спроектирована базовая архитектура прототипа системы автоматизированного обезличивания персональных данных. 2. Размечены датасеты для обучения модуля NER прототипа системы автоматизированного обезличивания персональных данных. 3. Разработана первая версия модуля NER. 4. Проведена апробация точности алгоритмов прототипа системы автоматизированного обезличивания персональных данных. Результаты выполнения работ первого этапа НИОКР полностью соответствуют техническому заданию и календарному плану проекта. Все поставленные цели достигнуты, выполнение задач прошло успешно. Работа по первому этапу выполнена в полном объеме. Результаты этапа 1 НИОКР в соответствии с приказом Министерства экономического развития Российской Федерации от 29 июня 2021 г. № 392 «Об утверждении критериев определения принадлежности проектов к проектам в сфере искусственного интеллекта» соответствуют технологиям искусственного интеллекта «ТИИ-2 Обработка естественного языка», а также направлены на решение технологической задачи «ЗИИ-2.02 Поиск и классификация различных типов сущностей в тексте, включая названия организаций и имена персоналий».
ГРНТИ
50.41.25 Прикладное программное обеспечение
Ключевые слова
датасет
точность
модель
нейронная сеть
генератор
архитектура
персональные данные
Детали

НИОКТР
Заказчик
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ "ФОНД СОДЕЙСТВИЯ РАЗВИТИЮ МАЛЫХ ФОРМ ПРЕДПРИЯТИЙ В НАУЧНО-ТЕХНИЧЕСКОЙ СФЕРЕ"
Исполнитель
ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "АЙТИНК"
Бюджет
Средства фондов поддержки научной и (или) научно-технической деятельности: 2 000 000 ₽
Похожие документы
ОТЧЕТ о выполнении НИОКР по теме: «Разработка и тестирование прототипа системы автоматизированного обезличивания персональных данных.» (договор №191ГС1ИИС12-D7/82038 от 25.12.2022) (заключительный)
0.978
ИКРБС
Этап №1 «Разработка пользовательских и функциональных требований. Разработка регрессионной и классификационной моделей на основе сета исторических данных компаний. Разработка процессов прогнозирования и оптимизации за счет применения ИИ для прогностической модели. Разработка внутренней части прототипа модуля автоматических публикаций вакансий. Разработка пользовательского интерфейса прототипа.» (промежуточный)
0.917
ИКРБС
«Разработка функционала модуля мониторинга Системы Check4Trick, предназначенного для расчета признаков на основе статистических данных о ходе торгов. Разработка функционала обезличивания данных. Разработка математических признаков для задачи классификации триплетов (дата, инструмент, клиент) с использованием встроенного языка Системы Check4Trick. Разработка заданий и выполнение расчетов признаков с использованием обезличенных данных реальных торговых сессий. Выполнение проверки полученных данных. Подготовка обучающей выборки на основе размеченных триплетов (дата, инструмент, клиент). Разработка прототипа математической модели классификации триплетов (дата, инструмент, клиент)» (договор 4ГРЦЭИИС12-D7/79053 от 22.08.2022) Этап №1 (промежуточный)
0.916
ИКРБС
Отчет о выполнении НИОКР по теме: «Разработка прототипа интеллектуальной программной платформы семантического анализа текста на естественном языке для решения задачи формирования поручений из распорядительных документов» (договор №152ГС1ИИС12-D7/79676 от 03.10.2022) Этап №1 «Определение архитектуры прототипа интеллектуальной программной платформы. Определение объема необходимых для реализации проекта понятий. Моделирование структуры понятий. Разработка проектного решения на создание прототипа интеллектуальной программной платформы.»(промежуточный)
0.909
ИКРБС
Разработка экспертной системы оценки соответствия и мониторинга выполнения законодательства о персональных данных на основе современных подходов к машинному обучению и обработке естественного языка
0.908
ИКРБС
«Создание новой подсистемы выявления неправомерных операций на финансовом рынке с использованием технологий искусственного интеллекта» (договор 4ГРЦЭИИС12-D7/79053 от 22.08.2022) Этап №2 (заключительный)
0.906
ИКРБС
"Разработка алгоритмов комплексирования, очистки и фильтрации неразмеченного массива данных. Разработка модуля предобработки неразмеченного массива данных. Разработка модуля построения графа связей физических лиц и транспортных средств. Разработка алгоритмов кластеризации графа связей физических лиц и транспортных средств. Разработка модуля кластеризации графа связей физических лиц и транспортных средств. Формирование перечня существенных признаков для обогащения исходных данных по результатам кластеризации графа связей физических лиц и транспортных средств. Разработка макетного образца Системы." (договор 102ГРЦЭИИС12-D7/82631 от 09.12.2022) (промежуточный)
0.904
ИКРБС
Промежуточный научно-технический отчет по разработке прототипа сервиса для формирования датасетов. Классификация датасета для одного коррупциогенного фактора. Разработка прототипа личного кабинета разработчика нормативных правовых актов. Разработка прототипа модели для выявления одного типа коррупциогенных факторов. Разработка одного эвристического метода определения коррупциогенных факторов. Интеграция и тестирование компонентов системы для формирования прототипа веб-сервиса.
0.904
ИКРБС
Отчет о выполнении НИОКР по теме: "Разработка и тестирование прототипа инфраструктуры базовых навыков (скиллов и стилей) цифровой личности на базе современных архитектур нейронных сетей с возможностью правдоподобного генерирования ответов на запросы пользователей." (договор № 3657ГС1/60562 от 11.08.2020) (заключительный)
0.902
ИКРБС
ОТЧЕТ о выполнении НИОКР по теме: «Доработка и тестирование прототипа корпоративной LMS-платформы генерации видеоинструкций для индустриальных рабочих на базе технологий генеративных предобученных трансформеров и нейронных сетей глубокого обучения» (договор No250ГС1ИИС12-D7/101235 от 10.10.2024) Этап No1 «Доработка архитектуры сервиса. Разработка технологии автоматического сбора данных. Разработка технологии автоматической генерации синтетических данных. Тестирование модуля автоматического сбора и генерации данных. Доработка веб-интерфейса сервиса. Доработка интерфейса мобильного приложения.» (промежуточный)
0.902
ИКРБС