Диссертация
№ 421102500073-7

Исследование и разработка моделей и методов нечеткой кластеризации коротких текстов

25.10.2021

Целью диссертационной работы является повышение эффективности нечеткой кластеризации коротких текстов путем разработки модели, метода и алгоритма в системе поддержки принятия решений для кластеризации коротких текстов на русском языке с учетом экспертной информации. Эффективность определяется точностью кластеризации и сокращением времени и трудоемкости работы выполняемой экспертом при использовании предложенного решения. В диссертационной работе разработан метод обработки текстов для расширения словаря языковой модели на базе нейронной сети с использованием нечеткого иерархического классификатора, который позволяет повысить точность кластеризации в среднем на 10%. Также в диссертационном исследовании разработан метод для обработки обратной связи от эксперта, используемый для корректировки весовых коэффициентов нейронной сети, что позволяет проводить интерактивную кластеризацию наборов коротких текстов. Проведенные исследования позволили установить границы применения предлагаемого метода. Метод наиболее эффективен для текстов с количеством слов от 10 до 100. В ходе проведенных исследований была достигнута средняя точность кластеризации 80% при более низком числе дополнительных ограничений по сравнению с аналогичными методами. Предлагаемый в работе метод интерактивной кластеризации является универсальным и может быть применен для различных наборов коротких текстов.
ГРНТИ
28.23.24 Модели восприятия информации в интеллектуальных системах
28.23.35 Экспертные системы
28.23.29 Программная реализация интеллектуальных систем
28.23.37 Нейронные сети
Ключевые слова
обработка текстов
языковые модели
нейронные сети
нечеткая кластеризация
интерактивная кластеризация
кластеризация
Детали

Автор
Дударин Павел Владимирович
Вид
Кандидатская
Целевое степень
Кандидат технических наук
Дата защиты
29.09.2021
Организация защиты
Федеральное государственное бюджетное образовательное учреждение высшего образования "Ульяновский государственный технический университет"
Организация автора
Федеральное государственное бюджетное образовательное учреждение высшего образования "Ульяновский государственный технический университет"
Похожие документы
Метод классификации коротких текстов для решения задач управления в организационных системах
0.913
Диссертация
КАНДИДАТСКАЯ ДИССЕРТАЦИЯ: ИССЛЕДОВАНИЕ И РАЗРАБОТКА МОДЕЛЕЙ И МЕТОДОВ НЕЧЕТКОЙ КЛАСТЕРИЗАЦИИ КОРОТКИХ ТЕКСТОВ
0.911
РИД
Классификация текстовых документов на основе семантической близости ключевых слов
0.904
НИОКТР
Исследование и разработка методики и алгоритма обработки и структуризации библиографических записей
0.901
Диссертация
Разработка методики и алгоритмов линейной классификации неструктурированной текстовой информации в технических системах
0.900
Диссертация
МЕТОДЫ СТРУКТУРНОГО ОБУЧЕНИЯ ДЛЯ СИНТЕЗА АЛГОРИТМОВ ПОИСКА НЕЧЕТКИХ ДУБЛИКАТОВ В БОЛЬШИХ МАССИВАХ ТЕКСТОВЫХ ДАННЫХ
0.898
ИКРБС
Разработка методов анализа и обработки лингвистической экспертной информации
0.894
Диссертация
Модель, метод и алгоритмы Data Mining для интеллектуальной обработки и анализа текстов на естественном языке
0.893
Диссертация
Модели и алгоритмы обработки слабоструктурированных текстовых данных на основе методов искусственного интеллекта
0.892
Диссертация
Разработка средств обработки узко-тематических текстов короткой длины
0.890
НИОКТР