НИОКТР
№ 122082300024-8Разработка новых вычислительных тензорных методов для задач интеллектуального анализа больших массивов данных на основе последовательностей событий.
02.08.2022
Задачи интеллектуального анализа данных с учетом очередности анализируемых событий являются актуальными во многих предметных областях: от рекомендательных систем и обработки текстов на естественном языке до анализа динамики климатических изменений на планете. Особенностью таких задач, с одной стороны, является большой масштаб, а с другой - высокая доля пропусков в данных и их зашумленность, что накладывает особые требования на соответствующие методы и алгоритмы анализа.
В проекте предлагается разработать масштабируемые методы на основе малоранговых тензорных разложений специального вида, учитывающих информацию об очередности событий и эффективно работающих на неполных данных. Проект нацелен на решение проблем в нескольких направлениях:
1. создание вычислительно эффективной альтернативы современным нейросетевым методам анализа последовательных данных,
2. создание методов, которые позволят повысить вычислительную эффективность алгоритмов на основе глубоких нейронных сетей за счет снижения размерности входных данных.
Это позволит расширить арсенал существующих математических моделей и вычислительных инструментов для широкого круга современных задач интеллектуального анализа больших массивов последовательных данных. Особенности постановки задачи ведут к необходимости рассмотрения новых структур тензорных представлений и обобщения подходов на основе анализа сингулярного спектра (метод "гусеницы", SSA) для тензорного случая. Кроме того, для обеспечения масштабируемости возникает необходимость правильного применения быстрых методов обучения и дообучения моделей с использованием алгоритмов скетчинга или потоковых алгоритмов, рандомизированных подходов, а также подходов на основе динамической малоранговой аппроксимации.
В результате выполнения проекта планируется создать комплекс программ ЭВМ с открытым исходным кодом с реализациями тензорных алгоритмов интеллектуального анализа больших неполных данных о последовательностях.
ГРНТИ
28.23.24 Модели восприятия информации в интеллектуальных системах
Ключевые слова
тензорные разложения
прогнозирование событий
обучение на последовательностях
интеллектуальный анализ данных
информационный поиск
Детали
Начало
22.12.2021
Окончание
31.12.2023
№ контракта
22-21-00911
Заказчик
Российский научный фонд
Исполнитель
АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОБРАЗОВАТЕЛЬНАЯ ОРГАНИЗАЦИЯ ВЫСШЕГО ОБРАЗОВАНИЯ "СКОЛКОВСКИЙ ИНСТИТУТ НАУКИ И ТЕХНОЛОГИЙ"
Бюджет
Средства фондов поддержки научной и (или) научно-технической деятельности: 3 000 000 ₽
Похожие документы
Тензорные методы в задачах машинного обучения
0.907
Диссертация
Тензорные методы и методы машинного обучения для моделирования и оптимизации сложных многопараметрических систем
0.884
НИОКТР
Методы, модели и алгоритмы интеллектуального анализа временных рядов на основе интеграции параллельных вычислений и нейросетевых технологий
0.881
НИОКТР
Разработка высокомасштабируемых методов и алгоритмов интеллектуального анализа сверхбольших временных рядов на вычислительных кластерах с многоядерными ускорителями
0.878
НИОКТР
Тензорные сети и глубинное обучение для интеллектуального анализа
данных
0.875
НИОКТР
Тензорные методы для многомерных дифференциальных уравнений
0.871
Диссертация
Тензорные методы для обработки и анализа биомедицинских данных в задачах машинного обучения
0.869
Диссертация
Развитие новых методов глубинного обучения в задачах обучения по большим объемам данных
0.869
ИКРБС
Развитие методов дистрибутивной семантики, применимых в системах искусственного интеллекта в цифровой экономике для анализа больших слабоструктурированных данных при решении задач тематического моделирования иразведочного поиска в различных предметных областях",
0.868
НИОКТР
Поиск новых архитектур нейронных сетей для задач анализа мультимодальных видео данных
0.862
НИОКТР