НИОКТР
№ 125042305424-2

Разработка технологии парсинга данных с применением нейросети и алгоритма web-драйвера

22.04.2025

Технология парсинга используется в информационных сервисах или приложениях для автоматического сбора данных из различных источников в Интернете в целях последующей обработки и анализа. Однако в работе традиционных парсеров можно выявить ряд недостатков: сложность работы с сайтами, содержащими динамические элементы; ограничения в извлечении информации с последующим структурированием данных. Технология парсинга данных с использованием нейросети и веб-драйвера может решить указанные проблемы. Применение веб-драйвера позволит корректно обращаться с динамическими элементами веб-страниц и получать актуальные данные после их загрузки. Обращение к нейросети во время парсинга может улучшить точность извлечения данных из нерегулярных и сложных страниц, структурировать информацию, полученную от первичного парсинга. Разработанное на основе технологии приложение может быть адаптировано под решение задач в различных предметных областях: службы занятости населения (поиск актуальных вакансий с учетом имеющихся компетенций), приемные комиссии вузов (поиск потенциальных абитуриентов), риелторские компании (парсинг сообществ социальных сетей и сайтов по продаже недвижимости с целью изучениярынка недвижимости и последующего формирования объявлений о продаже недвижимости).
ГРНТИ
20.53.19 Средства обработки и поиска информации
Ключевые слова
Классификация данных
web-драйвер
Нейросеть
Парсинг
Детали

Начало
28.02.2024
Окончание
19.08.2024
№ контракта
70
Заказчик
краевое государственное автономное учреждение "Красноярский краевой фонд поддержки научной и научно-технической деятельности"
Исполнитель
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "СИБИРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ НАУКИ И ТЕХНОЛОГИЙ ИМЕНИ АКАДЕМИКА М.Ф. РЕШЕТНЕВА"
Бюджет
Средства фондов поддержки научной и (или) научно-технической деятельности: 80 000 ₽
Похожие документы
Разработка технологии парсинга данных с применением нейросети и алгоритма web-драйвера
0.888
ИКРБС
Исследование научно-технической информации о технологии парсинга данных и разработка действующего прототипа информационно-поисковой системы сбора данных о грантах, конкурсах и стажировках на примере 50-ти сайтов
0.864
НИОКТР
Разработка и тестирование прототипа системы онлайн-рекрутмента с рекомендательной системой на основе искусственного интеллекта (заключительный)
0.851
ИКРБС
Парсинг сетевых данных
0.848
РИД
Техническое решение поиска и обработки информации о событиях и мероприятиях в рамках интересующих пользователя тематик с применением технологий парсинга данных и алгоритмов машинного обучения
0.847
РИД
Разработка прототипа цифровой рекрутинговой платформы.
0.844
НИОКТР
Адаптивный парсер данных сайтов-агрегаторов вакансий
0.844
РИД
Подсистема параллельного сбора, обработки, сохранения резюме соискателей и подготовки данных для построения карьерных маршрутов (версия 1.0)
0.843
РИД
Разработка и тестирование прототипа платформы для автоматизации процессов поиска и найма сотрудников на основе алгоритмов искусственного интеллекта. (заключительный)
0.835
ИКРБС
Разработка и тестирование прототипа платформы аренды специалистов, с искусственным интеллектом на основе обучения с подкреплением, и нейронных сетей
0.834
НИОКТР