ИКРБС
№ 223020300621-9Вычислительно эффективные алгоритмы машинного обучения на основе новых метрик ансамблевого сходства в условиях неполноты обучающей информации
20.12.2022
Объектом исследования являются проблемы анализа данных, распознавания образов и прогнозирования в случае неполной обучающей информации.
Цель работы – создание новых эффективных методов и алгоритмов классификации и прогнозирования, которые будут способны решать задачи анализа разнородных данных в условиях неполноты обучающей информации, при наличии сложных нелинейных структур данных и их большом объеме.
Методы проведения работы включают аппарат теории машинного обучения, оптимизации, теории вероятностей, математической статистики.
Важнейшие результаты работы в 2022 году и их новизна.
1. Предложен метод бинарной классификации с вероятностной разметкой, который сочетает методологию регуляризация многообразия и ансамбль нечеткой кластеризации. В отличие от известных методов, в качестве матрицы подобия используется матрица коассоциации кластерного ансамбля. Матрица представлена в малоранговой форме, что позволяет значительно ускорять вычисления и экономить память. Аналогичный подход использован в задаче слабо-контролируемой регрессии с многомерным откликом, для решения которой предложен новый метод, основанный на минимизации расстояния Вассерштейна между многомерными распределениями.
2. Проведено теоретическое и экспериментальное исследование модели и метода построения разнородного кластерного ансамбля, основанного на наборе различных алгоритмов кластерного анализа. Впервые теоретически исследовано влияние коррелированности базовых решений ансамбля на его качество. Показано, что учет коррелированности позволяет объяснить улучшение качества ансамбля при увеличении степени разнообразия вариантов разбиения. Разработан алгоритм, в котором реализован метод построения ансамбля и вычисления оптимальных весов; проведено его экспериментальное исследование.
3. Проведен анализ эффективности методов решения задачи слабо-контролируемого обучения в прикладной задаче классификации томографических изображений участков головного мозга при ишемическом инсульте. При этом выбор информативного признакового пространства осуществлялся алгоритмом AdDel; применялась также методика цензурирования выборки с использованием аппарата FRiS-функций. Показано, что цензурирование повышает качество классификации.
По результатам этапа проекта опубликована одна статья, одна принята в печать (в журналах, входящих в базы Scopus и RSCI). Опубликована одна статья в трудах международной конференции и два тезиса. Запланированные по промежуточному этапу проекта цели достигнуты.
ГРНТИ
27.47.23 Математические проблемы искусственного интеллекта
Ключевые слова
анализ данных
распознавание образов
прогнозирование
слабо контролируемое обучение
кластерный ансамбль
цензурирование выборки
Детали
НИОКТР
Заказчик
Российский научный фонд
Исполнитель
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ ИНСТИТУТ МАТЕМАТИКИ ИМ. С.Л. СОБОЛЕВА СИБИРСКОГО ОТДЕЛЕНИЯ РОССИЙСКОЙ АКАДЕМИИ НАУК
Бюджет
Средства фондов поддержки научной и (или) научно-технической деятельности: 1 500 000 ₽
Похожие документы
Вычислительно эффективные алгоритмы машинного обучения на основе новых метрик ансамблевого сходства в условиях неполноты обучающей информации
0.970
ИКРБС
Глубокое обучение на больших данных при неполной обучающей информации
0.947
ИКРБС
Вычислительно эффективные алгоритмы машинного обучения на основе новых метрик ансамблевого сходства в условиях неполноты обучающей информации
0.923
НИОКТР
Методы и технологии интеллектуального анализа данных для диагностики и предсказания поведения сложных многокомпонентных систем
0.912
ИКРБС
НОВЫЕ ОПТИМИЗАЦИОННЫЕ ЗАДАЧИ В КОЛЛЕКТИВНЫХ МЕТОДАХ И МОДЕЛЯХ РАСПОЗНАВАНИЯ
0.905
ИКРБС
СИСТЕМА МАШИННОГО ОБУЧЕНИЯ С ОБЕСПЕЧЕНИЕМ ИНТЕРПРЕТИРУЕМОСТИ, ОСНОВАННАЯ НА ОПТИМАЛЬНЫХ АНСАМБЛЯХ С РАЗЛИЧНОЙ АРХИТЕКТУРОЙ
0.905
ИКРБС
Методы синтеза наборов данных в матричном представлении для систем мета-обучения (заключительный)
0.904
ИКРБС
Мультиалгоритмические подходы к решению задач анализа данных, классификации и распознавания естественной русской речи. Информационная сложность и анализ понятий
0.902
ИКРБС
Разработка и совершенствование интеллектуальных методов классификации и прогнозирования для задач распознавания образов и моделирования информационных процессов
0.902
НИОКТР
Разработка и совершенствование интеллектуальных методов классификации и прогнозирования для задач распознавания образов и моделирования информационных процессов
0.902
НИОКТР