РИД
№ 625102400085-5

Модуль автоматического парсинга данных и формирования датасетов

24.10.2025

В программе используется алгоритм, который позволяет обратиться по указанному пути к директории с общим доступом, просканировать её на предмет наличия данных табличной формы в форматах csv, txt, xlsx, sheet и выполнить загрузку в память для дальнейшей обработки. Из полученных данных формируется датасет, как структурированных, так и неструктурированных данных. Программа может быть применяться для подготовки входных данных, используемых для обучения модели искусственного интеллекта.
ГРНТИ
50.53.15 Автоматизация процессов проведения научных экспериментов
47.09.48 Наноматериалы для электроники
Ключевые слова
датасет
как структурированных
так и неструктурированных данных
Детали

НИОКТР
Тип РИД
Программа для ЭВМ
Сферы применения
Программа предназначена для получения данных из различных источников и формирования их в датасет неструктурированных данных.
Ожидается
Исполнитель
Исполнители
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ ИМЕНИ Н.Э. БАУМАНА (НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ)"
Заказчик
ФОНД ПОДДЕРЖКИ ПРОЕКТОВ НАЦИОНАЛЬНОЙ ТЕХНОЛОГИЧЕСКОЙ ИНИЦИАТИВЫ