РИД
№ 621111000041-1

Модуль парсинга контента интернет-магазинов

10.11.2021

Программа предназначена для периодического автоматизированного сбора контента (содержимого страниц) web-сайтов интернет-магазинов, очистки, преобразования и сохранения в БД данной информации для дальнейшего анализа данной информации специалистами, а так же, машинной обработки алгоритмами машинного обучения. Функциональные возможности программы: - задавать адрес сайта-донора и категории данных которые нужно выгружать: html-код страниц; - определять названия категорий, вложенность; - выбирать формат экспорта в файл базы данных; - запускать процесс парсинга вручную или по расписанию; - осуществлять парсинг контента в выбранную БД
ГРНТИ
28.23.39 Интеллектуальные базы знаний
Ключевые слова
очистка данных
нормализация данных
парсинг контента
онлайн-ритейл
Детали

Тип РИД
Программа для ЭВМ
Сферы применения
Программа может использоваться аналитиками по интернет-макретингу и контент-менеджерами с целью оптимизации работы интернтет-магазинов для улучшения качества контента и повышения продаж.
Ожидается
Исполнитель
Исполнители
Общество с ограниченной ответственностью «ТТЛ»
Заказчик
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ "ФОНД СОДЕЙСТВИЯ РАЗВИТИЮ МАЛЫХ ФОРМ ПРЕДПРИЯТИЙ В НАУЧНО-ТЕХНИЧЕСКОЙ СФЕРЕ"
Похожие документы
Адаптивный парсер данных сайтов-агрегаторов вакансий
0.891
РИД
Программа для автоматического парсинга данных из сайта и создания картинок товарных карточек
0.889
РИД
Парсер для веб-страниц российских компаний с возможностью настройки по типам документов и тематическим областям
0.879
РИД
Система автоматизированного сбора структурированных данных на основе правил обхода и сбора
0.877
РИД
Парсинг сетевых данных
0.869
РИД
Программное ядро автоматизированного сбора данных на основе анализа структуры сайтов с возможностью визуального редактирования сгенерированных задач (IntelliCraw)
0.868
РИД
Cервис сбора данных из открытых источников сети «Интернет»
0.867
РИД
Программа для автоматизации процессов сбора информации с различных новостных порталов и их группировки по категориям
0.866
РИД
Модуль автоматического парсинга данных и формирования датасетов
0.864
РИД
Система автоматизированного сбора и интеллектуальной обработки данных с веб-ресурсов
0.863
РИД