РИД
№ АААА-Г19-619101590049-3

Парсинг сетевых данных

15.10.2019

Программа предназначена для парсинга сетевых данных и их последующего анализа. Парсингможет осуществляться как с ресурсов, требующих авторизацию пользователей, так и с ресурсов,на которых авторизация пользователей не требуется. Основой для парсинга является содержимоевеб-страниц, выбор которых осуществляется пользователем программы посредством«get-запросов». Программа преобразует и структурирует сетевые данные в текстовый массив.Это позволяет: извлекать сетевые данные из анализируемого массива - ключевые слова; извлекатьданные для проведения фолксономического анализа, в том числе анализа тональности хэштегов;извлекать цитируемых авторов социальных сетей; анализировать частотность используемыхслов; анализировать полуструктурированные выражения с заданным словом, т.е. извлекатьфакты; производить анализ тональности анализируемого массива; извлекать и анализироватьнаиболее частотные словосочетания, использующиеся в анализируемом массиве.
ГРНТИ
11.07.13 Методика и техника политических исследований
Ключевые слова
ПАРСИНГ
СЕТЕВЫЕ ДАННЫЕ
ФОЛКСОНОМИЧЕСКИЙ АНАЛИЗ
РЕЛЯЦИОННЫЙ АНАЛИЗ
Детали

Тип РИД
Программа для ЭВМ
Сферы применения
Анализируемые программой сетевые данные служат основой для проведения реляционного анализа и проведениякачественного анализа сетевых структур в Интернет-пространстве.
Ожидается
Исполнитель
Исполнители
Федеральное государственное бюджетное образовательное учреждение высшего образования «Кубанский государственный университет»
Заказчик
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ "РОССИЙСКИЙ ФОНД ФУНДАМЕНТАЛЬНЫХ ИССЛЕДОВАНИЙ"
Похожие документы
Многофакторный контент-анализ сетевых данных
0.873
РИД
Программа сбора и обработки данных из социальных сетей и новостных массмедиа интернет ресурсов с возможностью выбора необходимых элементов-идентификаторов
0.870
РИД
Модуль парсинга контента интернет-магазинов
0.869
РИД
Структурно-реляционный парсинг политического контента
0.863
РИД
Cервис сбора данных из открытых источников сети «Интернет»
0.863
РИД
Разработка технологии парсинга данных с применением нейросети и алгоритма web-драйвера
0.848
НИОКТР
Программный модуль для агрегирования неструктурированных данных СМИ на основе технологии Big Data
0.846
РИД
Система автоматизированного сбора и интеллектуальной обработки данных с веб-ресурсов
0.845
РИД
Парсер для веб-страниц российских компаний с возможностью настройки по типам документов и тематическим областям
0.844
РИД
Программа для автоматизации процессов сбора информации с различных новостных порталов и их группировки по категориям
0.844
РИД