Диссертация
№ 424122500196-8Метод классификации коротких текстов для решения задач управления в организационных системах
26.12.2024
Целью работы является обеспечение тиражируемости алгоритмов для поддержки принятия решений в организационных системах на основе анализа коротких текстов.
Для достижения цели были поставлены следующие задачи:
- исследование существующих методов анализа текстовой информации;
- формирование перечня требований к разрабатываемому методу классификации текста;
- разработка математической модели представления текста, позволяющей реализовать классификацию текстов по прямым и косвенным признакам с учетом сформулированных требований;
- разработка алгоритма классификации текстов, реализующего данную математическую модель;
- проведение экспериментального исследования разработанного метода и оценка его эффективности для решения различных задач анализа текстовой информации;
- разработка и внедрение программного обеспечения на базе предложенного метода.
В результате проведенного иследования:
- Разработана эвристическая волновая модель представления текста, отличающаяся использованием квантового формализма и позволяющая учитывать взаимное влияние семантик слов, как интерференции их волновых функций в Гильбертовом пространстве.
- Разработан многофункциональный алгоритм классификации текстов, использющий универсальную предобученную языковую модель и не требует дополнительного обучения для решения конкретных задач.
- Проведено экспериментальное исследование разработанного алгоритма.
Разработан и внедрен прототип программного комплекса на базе предложенного алгоритма, обоснована его тиражируемость.
ГРНТИ
82.05.21 Принятие решений. Модели и методы принятия решений
82.01.85 Автоматизация управленческого труда
28.23.19 Эвристические методы
Ключевые слова
интерференция
эвристическая модель представления текста
обработка естественного языка
сентимент анализ
классификация текстов
Квантовый формализм теории вероятностей
Детали
Автор
Груздева Анастасия Сергеевна
Вид
Кандидатская
Целевое степень
Кандидат технических наук
Дата защиты
24.12.2024
Организация защиты
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ ИТМО"
Организация автора
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ ИТМО"
Похожие документы
Исследование и разработка моделей и методов нечеткой кластеризации коротких текстов
0.913
Диссертация
Модель, метод и алгоритмы Data Mining для интеллектуальной обработки и анализа текстов на естественном языке
0.905
Диссертация
Классификация текстовых документов на основе семантической близости ключевых слов
0.903
ИКРБС
Классификация текстовых документов на основе семантической близости ключевых слов
0.901
НИОКТР
Разработка методики и алгоритмов линейной классификации неструктурированной текстовой информации в технических системах
0.900
Диссертация
Метод классификации библиографической информации на основе комбинированных профилей классов с учетом структуры документов
0.900
Диссертация
МЕТОДЫ СТРУКТУРНОГО ОБУЧЕНИЯ ДЛЯ СИНТЕЗА АЛГОРИТМОВ ПОИСКА НЕЧЕТКИХ ДУБЛИКАТОВ В БОЛЬШИХ МАССИВАХ ТЕКСТОВЫХ ДАННЫХ
0.899
ИКРБС
Исследование и разработка методики и алгоритма обработки и структуризации библиографических записей
0.897
Диссертация
Проведение предварительных исследований и разработка экспериментальных образцов модулей классификации коротких текстов на основе методов оценки семантической близости и глубокого обучения
0.894
ИКРБС
Алгоритмы масштабируемого анализа многомерных и сложно структурированных данных
0.891
ИКРБС