РИД
№ 623020800038-6Программный модуль для автоматического поиска и связывания сущностей в тексте с концептами базы знаний Wikidata
08.02.2023
Программа предназначена для систем автоматической обработки текста.
Программа может использоваться в системах автоматической разметки корпусов текста при формировании связанных источников данных. Тип ЭВМ: PC. ОС: Windows 7 и выше, Linux-совместимые ОС (Astra Linux, Ubuntu/Debian, Redhat, и др.).
Функциональные возможности программы: Программа осуществляет поиск именованных сущностей обрабатываемого текста в категориях дата, место, персоналия, произведение искусства, событие. Дополнительно анализируются с какими частями предложения связана найденная сущность для уточнения контекста. Найденные сущности приводятся в базовую форму посредством лемматизации, после чего осуществляется поиск сущностей в базе знаний Wikidata. Результатом работы является разметка текста, содержащая тип сущности, ссылку на страницу в Wikidata/Wikipedia и подсказку с текстовым описанием сущности и её свойств.
ГРНТИ
28.23.01 Общие вопросы искусственного интеллекта
Ключевые слова
Анализ текста
NER
распознавание именованных сущностей
база знаний
Wikidata
Детали
Тип РИД
Программа для ЭВМ
Сферы применения
Разработанный модуль может быть встроен в системы распознавания текста для автоматического связывания терминов с сущностями базы знаний, для подсказок о значении и семантической связи структурных элементов текста.
Ожидается
Исполнитель
Исполнители
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ "САНКТ-ПЕТЕРБУРГСКИЙ ФЕДЕРАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЦЕНТР РОССИЙСКОЙ АКАДЕМИИ НАУК"
Заказчик
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ "САНКТ-ПЕТЕРБУРГСКИЙ ФЕДЕРАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЦЕНТР РОССИЙСКОЙ АКАДЕМИИ НАУК"
Похожие документы
Программа для автоматизированного создания вопросов и поиска документов на основе контекста репозитория с использованием векторных баз данных
0.874
РИД
Программа для передачи данных об информационных ресурсах в виде структурированного массива
0.874
РИД
Автоматизированная подготовка словарей для использования в информационно-аналитических системах
0.874
РИД
Программа автоматического извлечения данных из текстов на естественном языке
0.873
РИД
Программный модуль синтаксического анализа литературных произведений с использованием OCR-ридеров и регулярных выражений
0.869
РИД
Программа для извлечения и анализа терминологических структур смежных предметных областей
0.867
РИД
Редактор семантических объектов
0.867
РИД
Программа автоматического анализа специализированной текстовой документации
0.865
РИД
Интегрированный ресурс предметно-лингвистических знаний
0.863
РИД
Программа для формирования и использования базы знаний материалов травелогов
0.860
РИД