РИД
№ 623120600540-3

Программный модуль для автоматической конвертации HTML страниц в формат TEI с сохранением исходного форматирования

06.12.2023

Программный модуль предназначена для конвертации литературных документов с форматированием в виде HTML-разметки в стандартизированный формат TEI Программный модуль может использоваться любым пользователем, перед которым стоит задача конвертации HTML разметки в формат TEI. Тип ЭВМ: PC. ОС: Windows 7 и выше, Linux-совместимые ОС (Astra Linux, Ubuntu/Debian, Redhat, и др.). Функциональные возможности программного модуля: Модуль преобразует HTML документы в документы в формате TEI. В процессе конвертирования осуществляется преобразование тегов, а информация, сохраненная в дополнительных полях HTML тегов, преобразуется в метаинформацию согласно рекомендациям формата TEI. При этом полностью сохраняется первоначальная верстка, что позволяет сохранить построчное представление таких материалов, как поэзия или специальным образом сверстанная проза.
ГРНТИ
28.23.01 Общие вопросы искусственного интеллекта
Ключевые слова
конвертация HTML
TEI
верстка
формат
Детали

Тип РИД
Программа для ЭВМ
Сферы применения
Разработанный программный модуль может быть использована для конвертации разметки материалов из HTML в TEI с сохранением исходной верстки.
Ожидается
Исполнитель
Исполнители
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ "САНКТ-ПЕТЕРБУРГСКИЙ ФЕДЕРАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЦЕНТР РОССИЙСКОЙ АКАДЕМИИ НАУК"
Заказчик
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ "САНКТ-ПЕТЕРБУРГСКИЙ ФЕДЕРАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЦЕНТР РОССИЙСКОЙ АКАДЕМИИ НАУК"
Похожие документы
Программный модуль синтаксического анализа литературных произведений с использованием OCR-ридеров и регулярных выражений
0.865
РИД
Программный модуль для составления индекса литературных произведений на основе заголовков в файлах формата TEI
0.859
РИД
TEX2XHTML (Конвертер LаTеX к HTML5 и EPUB3)
0.853
РИД
Программный компонент принимаемых метаданных
0.850
РИД
Программа автоматического переноса форматирования текста между документами в формате XML
0.844
РИД
Программный комплекс автоматического препроцессинга цифровых коллекций математических документов
0.843
РИД
«Программа преобразования файлов офисных приложений в текст»
0.838
РИД
Программный модуль управления распознаванием текста структурированных оцифрованных печатных изданий
0.828
РИД
Программный модуль ИС СМАЛТ для формально-грамматической и синтаксической разметки текстов в дореволюционной и современной графике
0.827
РИД
Программа автоматического извлечения данных из текстов на естественном языке
0.823
РИД