РИД
№ 623110700253-2Способ распознавания характера текстового контента
07.11.2023
Изобретение относится к области машинного обучения, и, более конкретно, к способу распознавания характера текстового контента. Техническим результатом является повышение точности и скорости получения результата. Способ содержит этапы, на которых: формируют исходный набор источников текстовых данных, содержащих контент предварительно заданной тематики, причем каждому источнику присваивают по меньшей мере одну метку характера контента и по меньшей мере одну метку тематики контента; автоматически выполняют синтаксический анализ каждого источника в наборе источников для идентификации автора источника и идентификации ссылок на сторонние источники, причем в качестве сторонних источников рассматриваются источники, не включенные в имеющийся набор источников, причем в качестве ссылок на сторонние источники рассматриваются названия сторонних источников и url-ссылки на сторонние источники; выполняют поиск упомянутых сторонних источников по идентифицированным ссылкам; выполняют поиск сторонних источников по идентифицированным авторам; выбирают из найденных сторонних источников источники, тематика которых близка к по меньшей мере одной из тематик контента исходного набора источников; автоматически присваивают выбранным источникам соответствующие метки тематики контента; формируют из выбранных источников дополнительный набор источников; каждому источнику из дополнительного набора источников автоматически присваивают по меньшей мере одну метку характера контента путем сравнения данного источника с источниками из исходного набора, имеющими такую же тематику, как данный источник; и формируют обучающий набор источников путем объединения исходного набора источников и размеченного дополнительного набора источников.
ГРНТИ
28.23.01 Общие вопросы искусственного интеллекта
Ключевые слова
машинное обучение
искусственный интеллект
ИИ
распознавание текста
Детали
НИОКТР
Тип РИД
Изобретение
Сферы применения
распознавание характера текстового контента
Ожидается
Исполнитель
Исполнители
Автономная некоммерческая организация высшего образования "Университет Иннополис"
Заказчик
АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ "АНАЛИТИЧЕСКИЙ ЦЕНТР ПРИ ПРАВИТЕЛЬСТВЕ РОССИЙСКОЙ ФЕДЕРАЦИИ"
Похожие документы
Способ распознавания характера текстового контента
0.964
РИД
Способ разметки и верификации текстовых данных
0.899
РИД
Способ разметки и верификации (Method for labeling and verification of textual data)
0.890
РИД
Способ разметки структуры данных, способ поиска похожих объектов и способ рекомендации связанных объектов
0.866
РИД
Способ и устройство для классификации объекта
0.863
РИД
Способ извлечения ключевых словосочетаний из текстовых данных
0.862
РИД
Исследования, разработка и математическое моделирование. Исследование существующих методов семантического анализа текстовой информации на основе выделенных наборов данных
0.848
ИКРБС
Способ автоматизированного построения диалогового графа для реконструкции структуры диалоговых данных (варианты)
0.848
РИД
Способ автоматического определения достоверности неструктурированной текстовой информации
0.846
РИД
Разработка методов, моделей и алгоритмов выделения единиц знаний из тематического текстового корпуса для распознавания ситуаций смысловой близости текстов
0.844
НИОКТР