РИД
№ 623120600535-9

Программный модуль поиска и извлечения библиографических ссылок из текста энциклопедических статей

06.12.2023

Модуль предназначен для автоматического извлечения библиографических ссылок из текстов энциклопедических статей и формирования списка обнаруженных ссылок в формате обмена ссылками внутри системы. Модуль выполняет следующие операции: чтение данных из файла docx, поиск абзаца с началом списка указателя имен, парсинг строки при помощи механизма регулярных выражений, нормализацию строки (в частности, удаление пробелов и иных символов форматирования в конце и начале строк). Модуль разработан для информационной системы «Пушкин Digital», но может быть использован при автоматизированной обработке литературы, в том числе в системах учета цитирования. Программный модуль разработан в рамках бюджетной темы FFZF-2023-0001
ГРНТИ
28.23.01 Общие вопросы искусственного интеллекта
Ключевые слова
Пушкин цифровой
текст
библиографические ссылки
база данных
энциклопедические статьи
Детали

Тип РИД
Программа для ЭВМ
Сферы применения
Автоматизированная обработка литературы, в том числе в системах учета цитирования
Ожидается
Исполнитель
Исполнители
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ "САНКТ-ПЕТЕРБУРГСКИЙ ФЕДЕРАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЦЕНТР РОССИЙСКОЙ АКАДЕМИИ НАУК"
Заказчик
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ "САНКТ-ПЕТЕРБУРГСКИЙ ФЕДЕРАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЦЕНТР РОССИЙСКОЙ АКАДЕМИИ НАУК"
Похожие документы
Программный модуль формирования библиографических описаний при автоматизированной обработке словарных статей
0.928
РИД
Программный модуль автоматического сопоставления библиографических ссылок с учетом их различного оформления на основе ассоциативного нечеткого сравнения
0.915
РИД
Программный модуль визуализации результатов поиска объектов в тексте
0.876
РИД
Программный модуль для составления индекса литературных произведений на основе заголовков в файлах формата TEI
0.867
РИД
Программный модуль управления распознаванием текста структурированных оцифрованных печатных изданий
0.859
РИД
Программный модуль синтаксического анализа литературных произведений с использованием OCR-ридеров и регулярных выражений
0.856
РИД
Программный модуль для автоматического поиска и связывания сущностей в тексте с концептами базы знаний Wikidata
0.855
РИД
Электронный каталог научных публикаций с поиском по библиографическим данным
0.850
РИД
Программный модуль для формирования перекрестных ссылок между произведениями в различных изданиях на основе метаданных
0.849
РИД
Программный комплекс автоматического препроцессинга цифровых коллекций математических документов
0.845
РИД