Диссертация
№ АААА-В19-419012190037-5Методы и алгоритмы интеллектуализации проектирования технических систем посредством тематической сегментации текстов
21.01.2019
Разработана методика отбора и настройки алгоритмов машинного обучения для тематической сегментации научных текстов, позволяющая учесть внутреннюю структуру текста и цель запроса. Экспериментально показано, что разработанная методика для интернет-форумов обеспечивает лучшее качество суммаризации форумов по сравнению с бейзлайнами, а для текстов научной прозы экспериментально показано, что все выбранные алгоритмы демонстрируют достаточно близкие и высокие значения F-меры независимо от тематики и языка текста. Разработан метод визуальной композиции (ансамблирования) алгоритмов тематической сегментации, раскрыты его целесообразность и специфика. Предложено средство его программной поддержки, реализующее одновременную демонстрацию пользователю нескольких вариантов тематической сегментации. Проведены экспериментальные проверки разработанного метода композиции алгоритмов тематической сегментации, показавшие его эффективность.
ГРНТИ
20.53.19 Средства обработки и поиска информации
50.51.19 Применение вычислительной техники и других средств автоматизации проектирования
Ключевые слова
ИНТЕЛЛЕКТУАЛИЗАЦИЯПРОЕКТИРОВАНИЕТЕХНИЧЕСКИЕ СИСТЕМЫТЕМАТИЧЕСКАЯ СЕГМЕНТАЦИЯ
Детали
Автор
Добренко Наталья Викторовна
Вид
Кандидатская
Целевое степень
Кандидат технических наук
Дата защиты
26.12.2018
Организация защиты
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ ИТМО"
Организация автора
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ ИТМО"
Похожие документы
Методы и алгоритмы машинного обучения для предобработки и классификации слабоструктурированных текстовых данных в научных рекомендательных системах
0.909
Диссертация
Алгоритмы масштабируемого анализа многомерных и сложно структурированных данных
0.889
ИКРБС
Метод классификации коротких текстов для решения задач управления в организационных системах
0.888
Диссертация
Разработка методов смыслосохраняющего сжатия текстовой информации для задач открытого тестирования знаний
0.884
ИКРБС
Исследование и разработка методов построения и обогащения онтологии на основе коллекции текстовых документов
0.878
ИКРБС
МЕТОДЫ СТРУКТУРНОГО ОБУЧЕНИЯ ДЛЯ СИНТЕЗА АЛГОРИТМОВ ПОИСКА НЕЧЕТКИХ ДУБЛИКАТОВ В БОЛЬШИХ МАССИВАХ ТЕКСТОВЫХ ДАННЫХ
0.877
ИКРБС
Автоматизированная классификация новостных интернет-текстов (на основе метода латентно-семантического анализа LSA)
0.876
Диссертация
Методы и алгоритмы семантической структуризации текстовой информации на основе логико-онтологических преобразований
0.875
Диссертация
Разработка моделей и методов text mining, семантической обработки текстов в задачах анализа потребностей, предпочтений и поведения потребителей
0.874
ИКРБС
Исследование и разработка методов построения и обогащения онтологии на основе коллекции текстовых документов
0.874
ИКРБС