Диссертация
№ 425122522639-1

Моделирование содержания сообщения в процессе автоматической генерации текста: лингво-информационный аспект

25.12.2025

Диссертационное исследование посвящено комплексному лингвистическому анализу автоматически сгенерированных текстов в сопоставлении с естественной человеческой коммуникацией. Актуальность работы обусловлена стремительным развитием технологий генерации текста и необходимостью разработки методов их изучения и атрибуции. Важным теоретическим достижением работы является установление преемственной связи между деривационной теорией текстообразования, трансформационной грамматикой и современными алгоритмическими процессами генерации. Показано, что современные языковые модели реализуют принципы трансформации глубинных структур в поверхностные на новом технологическом уровне. В рамках исследования разработана лингво-информационная модель сгенерированного текста, интегрирующая его тематические, структурно-композиционные и морфолого-синтаксические параметры, на основе сопоставительного анализа двух контрастивных корпусов – корпуса синтетических диалогов и подкорпуса диалогов из Национального корпуса русского языка. Анализ показывает, что сгенерированные диалогические тексты характеризуются тематической ограниченностью, структурной шаблонностью, гипернормированностью синтаксиса, низкой дейктичностью и ослабленными логическими связями, в то время как естественные диалоги отличаются тематическим разнообразием, контекстуальной насыщенностью, фрагментарностью и короткими репликами, высокой вариативностью переходов между репликами и преобладанием разговорной лексики и синтаксиса. Практическим результатом работы является методика лингвистической атрибуции сгенерированного контента, показавшая эффективность в условиях ограничений при автоматической детекции. Исследование вносит вклад в теоретическую лингвистику, уточняя статус сгенерированного текста, и имеет прикладное значение для верификации признаков генерации и оптимизации генерационных систем.
ГРНТИ
16.31.21 Автоматическая обработка текста. Автоматический перевод. Автоматическое распознавание речи
16.21.33 Лингвистика текста
Ключевые слова
языкознание — лингвистика текста
текстовая генерация
текстоообразование
диалоги
генерация текста
Детали

Автор
Остапенко Светлана Валерьевна
Вид
Кандидатская
Целевое степень
Кандидат филологических наук
Дата защиты
19.12.2025
Организация защиты
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ"
Организация автора
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "АЛТАЙСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ"
Похожие документы
Исследование методов и разработка средств формирования дискурса в задачах синтеза текста на естественном языке
0.885
НИОКТР
Модели и методы дискурсивного и сюжетного анализа текстов для решения задач интеллектуальной обработки и понимания текстов, естественно-языковой коммуникации
0.879
НИОКТР
Автоматический анализ прагматики и дискурса в диалогах на повседневные темы
0.871
Диссертация
Лингвистическое моделирование как инструмент атрибуции текста
0.870
НИОКТР
Разработка и исследование метода управляемой генерации текстов по сюжетной линии
0.870
НИОКТР
НАУЧНО-ТЕХНИЧЕСКИЙ ОТЧЕТ «Разработка модели представления текста в виде графовой базы данных» по теме: НИОКР «Разработка и тестирование прототипа автоматизированной системы сборки словаря синонимии» ПРОЕКТ «Программный комплекс ситуативного распознавания смысла текстов, написанных в научной и официально-деловой стилистике» (промежуточный, этап 1)
0.866
ИКРБС
НАУЧНО-ТЕХНИЧЕСКИЙ ОТЧЕТ «Разработка модели представления текста в виде графовой базы данных» по теме: НИОКР «Разработка и тестирование прототипа автоматизированной системы сборки словаря синонимии» ПРОЕКТ «Программный комплекс ситуативного распознавания смысла текстов, написанных в научной и официально-деловой стилистике» (промежуточный, этап 1)
0.866
ИКРБС
Разработка и исследование метода генерации текстов с аргументацией
0.864
НИОКТР
Разработка методов и алгоритмов анализа характеристик текстов на естественном языке на основе теоретико-информационного подхода и применение их к задачам защиты информации
0.863
Диссертация
Моделирование процесса порождения текста на основе данных регистратора нажатий клавиш и дистрибутивных семантических моделей: общее, индивидуальное и контекст
0.861
ИКРБС