РИД
№ 625082800104-4

Программа для извлечения и анализа терминологических структур смежных предметных областей

28.08.2025

Программа предназначена для автоматизированного извлечения терминологических структур из монографии заданной предметной области (без использования заранее подготовленного корпуса специализированных текстов предметной области), а также сравнительного анализа терминологических структур смежных предметных областей. Программа используется в области автоматизации решения информационных задач, в частности, при разработке глоссариев и онтологий специализированных предметных областей, используется для теоретического исследования различных предметных областей, науковедения и построения типологий междисциплинарности. Функциями программы являются: чтение монографий в формате ТХТ и конфигурационных файлов с предпочтениями эксперта (словарь общих и специфичных стоп-слов, перечень морфологических шаблонов для выявления терминов) в формате JSON; извлечение терминов (токенизация текста, расшифровка аббревиатур, лемматизация токенов, формирование и фильтрация n-грамм, расчет статистик для n-грамм и их ранжирование); формирование перечня значимых терминов и их выгрузка в Excel; построение и анализ терминологических структур, включая расчет мер структурной значимости терминов и обнаружение терминологических кластеров; сравнительный анализ терминологических структур; визуализация терминологических структур и их выгрузка в файлы. Тип ЭВМ: IBM РС-совмест. ПК; ОС: Windows 10.
ГРНТИ
28.23.13 Инженерия знаний.
Ключевые слова
терминологическая структура
извлечение
сравнительный анализ
предметная область
Детали

НИОКТР
Тип РИД
Программа для ЭВМ
Сферы применения
Программа используется в области автоматизации решения информационных задач, в частности, при разработке глоссариев и онтологий специализированных предметных областей, используется для теоретического исследования различных предметных областей, науковедения и построения типологий междисциплинарности.
Ожидается
Исполнитель
Исполнители
Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В.А. Трапезникова Российской академии наук
Заказчик
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Похожие документы
Программный прототип для автоматизированного построения тезаурусов при помощи гибридных методов
0.893
РИД
Программный комплекс для автоматического определения профиля документов, относящихся к определенной предметной области
0.890
РИД
Модуль интеллектуальной обработки текстовой информации в среде MATLAB
0.889
РИД
Система автоматического извлечения терминов из научных текстов «Term Extractor»
0.888
РИД
Программа извлечения синтагматических структур из текстов на естественном языке
0.882
РИД
Программная система семантико-когнитивного анализа слабоструктурированных ресурсов на основе онтологии
0.882
РИД
Программа извлечения синтагматических структур из текстов на естественном языке
0.881
РИД
Интегрированный ресурс предметно-лингвистических знаний
0.880
РИД
Автоматизированная подготовка словарей для использования в информационно-аналитических системах
0.879
РИД
Программная система классификации текстовых данных на основе семантико-онтологического анализа
0.877
РИД