Диссертация
№ АААА-В20-420071490014-6Индексы интересности замкнутых описаний в задачах анализа данных и обнаружения знаний
14.07.2020
Цель работы: Разработка эффективных подходов к майнингу множества интересных паттернов, обладающих минимальной избыточностью и позволяющих учитывать экспертные знания.Методы исследования, кроме используемых приборов и аппаратуры: Методы машинного обучения, анализа формальных понятий и узорных структур, теории вероятности, теории информации, генерации синтетических наборов данных; проведение в вычислительных экспериментов.Достигнутые результаты: 1) Выполнен анализ индексов (метрик) оценки “интересных” паттернов, описаны их основные характеристики и предложена классификация на основе выделенных характеристик.2) На основе проведенных экспериментов выявлены группы схожих индексов а также индексов, устойчивых к шуму. Определены комбинации некоррелируемых индексов, обладающих наименьшей вычислительной сложностью.3) Предложена схема адаптации индексов оценки произвольных паттернов к оценке замкнутых.4) Предложен метод интеграции индексов и подхода на основе принципа минимальной длины описания к майнингупаттернов, позволяющий получить хорошо интерпретируемые описания данных с минимальной избыточностью.5) Разработан метод майнинга числовых паттернов на основе динамического подхода.Новизна: В работе впервые изложена систематизация мер интересности (для замкнутых множеств признаков), а также исследованы их качесвенные харктеристики, позволяющие на практике разрабатывать ансабли мер интересности, разносторонне характеризующие данные.Внедрение: Результаты могут использоваться на практике, а также для дальнейшего развития методов майнинга паттернов.Эффективность: Использование результатов работы позволит улучшить эффективность вычислений засчет использования индексов интересности, обладающих низкой вычислительной сложностью среди коррелирующих индексов. Разработан метод полиномиального майнинга численных паттернов.Область применения: Широкий спектр областей, где анализируемые данные представлены в виде таблиц бинарных или численных значений, и где целью анализа является получение краткого (сжатого) описания данных.
ГРНТИ
28.23.13 Инженерия знаний.
28.23.25 Модели и системы обучения
28.23.19 Эвристические методы
Ключевые слова
ГРУППЫ ИНДЕКСОВ
КЛАССИФИКАЦИЯ МЕТРИК
МАЙНИНГ ПАТТЕРНОВ
ОЦЕНКА ИНТЕРЕСНОСТИ
ПОИСК ПАТТЕРНОВ
Детали
Автор
Махалова Татьяна Павловна
Вид
Кандидатская
Целевое степень
Кандидат технических наук
Дата защиты
29.05.2020
Организация защиты
Федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики"
Организация автора
Федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики"
Похожие документы
Алгоритмы масштабируемого анализа многомерных и сложно структурированных данных
0.872
ИКРБС
МАТЕМАТИЧЕСКИЕ МОДЕЛИ ДЛЯ ОЦЕНКИ И ОБЕСПЕЧЕНИЯ ЭФФЕКТИВНОСТИ ПЕРСПЕКТИВНЫХ ИНФОРМАЦИОННО-ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ НА РАЗЛИЧНЫХ ЭТАПАХ ПРОЕКТИРОВАНИЯ(заключительный)
0.855
ИКРБС
СИСТЕМА МАШИННОГО ОБУЧЕНИЯ С ОБЕСПЕЧЕНИЕМ ИНТЕРПРЕТИРУЕМОСТИ, ОСНОВАННАЯ НА ОПТИМАЛЬНЫХ АНСАМБЛЯХ С РАЗЛИЧНОЙ АРХИТЕКТУРОЙ
0.853
ИКРБС
Разработка и исследование подходов к непрерывной интеграции компьютерных систем, предоставляющих доступ к истории изменений
0.850
ИКРБС
Повышение эффективности поиска скрытых закономерностей в базах данных применением интервальных методов на примерах в промышленности и других областях
0.849
Диссертация
Модельное исследование методов, алгоритмов и средств индуктивного анализа данных в приоритетных отраслях
0.848
ИКРБС
Логический анализ частично упорядоченных целочисленных данных в задачах классификации и поиска ассоциативных правил
0.848
НИОКТР
Логический анализ частично упорядоченных целочисленных данных в задачах классификации и поиска ассоциативных правил
0.848
НИОКТР
РАЗРАБОТКА ИНФОРМАЦИОННОГО КРИТЕРИЯ ЭФФЕКТИВНОСТИ МЕТРИЧЕСКИХ КЛАССИФИКАТОРОВ И ИССЛЕДОВАНИЕ СХЕМ КОМПЛЕКСИРОВАНИЯ ДАННЫХ ДЛЯ МНОГОКЛАССОВОГО РАСПОЗНАВАНИЯ ОБРАЗОВ ПО АНСАМБЛЮ ИЗОБРАЖЕНИЙ
0.845
ИКРБС
Разработка информационного критерия эффективности метрических классификаторов и исследование схем комплексирования данных для многоклассового распознавания образов по ансамблю изображений
0.843
НИОКТР