Диссертация
№ 424122700249-9

Гибридные нейросетевые методы анализа понятности текстов юридических документов на русском языке

27.12.2024

Актуальность темы исследования. Автоматическая обработка юридических текстов приобретает все большую значимость благодаря возможности применения современных методов машинного обучения и технологий обработки естественного языка, позволяющих эффективно анализировать, классифицировать и интерпретировать большие массивы правовой информации. Использование больших языковых моделей (LLM) и их адаптация под специфику русского языка и юридических контекстов дают возможность проводить качественный анализ текстов, структурировать данные по признаку языковой понятности. Научная новизна. В представленной диссертации разработан список характеристик понятности русского правового языка, создана система интеллектуальной обработки данных для анализа сложности и доступности восприятия юридических текстов с помощью гибридной нейросетевой модели. Методы были протестированы на различных типов документов, включая стандартизированные и тексты свободной формы.
ГРНТИ
10.01.33 Терминология. Справочная литература. Учебная литература
16.31.21 Автоматическая обработка текста. Автоматический перевод. Автоматическое распознавание речи
28.23.37 Нейронные сети
Ключевые слова
коммуникационные барьеры
юридические тексты
лингво-юридический анализ
государственный язык
автоматический анализ текстов
языковые модели
статистика
машинное обучение
нейросети
Детали

Автор
Тарасов Никита Андреевич
Вид
Кандидатская
Целевое степень
Кандидат технических наук
Дата защиты
20.12.2024
Организация защиты
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ"
Организация автора
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ"
Похожие документы
Разработка нейросетевых методов и программных средств для анализа сложности и упрощения текстов на русском языке
0.885
НИОКТР
Разработка программного комплекса - интеллектуальное рабочее место юриста с внедрением в научно-практическую деятельность
0.878
ИКРБС
Разработка и исследование лингвистической модели искусственного интеллекта
0.870
ИКРБС
Построение систем знаний и анализ данных на основе текстовой информации
0.870
ИКРБС
Модели и алгоритмы поиска, приобретения и использования знаний в системах искусственного интеллекта при обработке и анализе текстов на естественном языке
0.869
Диссертация
Модели и алгоритмы обработки слабоструктурированных текстовых данных на основе методов искусственного интеллекта
0.868
Диссертация
Новые методы машинного обучения для оценки и интерпретации языковых моделей
0.868
ИКРБС
Интеллектуальный анализ текстовых данных большого объема в финансах, бизнесе и образовании на основе адаптивных семантических моделей (2 этап)
0.867
ИКРБС
Многозначная классификация и распознавание именованных сущностей на основе переноса обучения по зашумленным меткам для малоресурсных языков
0.867
Диссертация
РАЗРАБОТКА АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ ОБРАБОТКИ ЕСТЕСТВЕННОГО РУССКОГО ЯЗЫКА ДЛЯ ПОИСКА И РАСПОЗНАВАНИЯ ИМЕНОВАННЫХ СУЩНОСТЕЙ
0.864
ИКРБС