НИОКТР
№ 124022200064-9Построение систем знаний и анализ данных на основе текстовой информации
12.02.2024
Цель исследования - разработка математических методов, алгоритмов и программных библиотек, позволяющих успешно сочетать подходы, основанные на формальных моделях представления знаний (текстовых, структурных, логических, лингвистических и т.д.), с современными подходами к глубинному обучению на больших данных.
Задачи научного исследования:
1. Разработка эффективных алгоритмов для моделей человеческого знания (состоящих из коротких правил) на основе минимизации булевых функций.
2. Исследование сложности текстовых данных: показатели, отражающие различные аспекты сложности, и эффективные алгоритмы их вычисления.
3. Разработка интерпретируемых методов анализа текстовых данных на основе графового представления текстовых коллекций и использования индексов интересности понятий для кластеризации и классификации текстов.
4. Построение архитектуры нейронных сетей для классификации текстов на основе решёток понятий.
5. Выявление возможных кибератак на основе анализа текстов на хакерских форумах
6. Обзор новых публикаций и интернет-источников, посвященных развитию методов искусственного интеллекта с акцентом на интерпретируемых и контролируемых моделях машинного обучения, использующих внешние формальные структуры представления знаний.
7. Обзор новых публикаций и интернет-источников по междисциплинарным приложениям методов искусственного интеллекта, включая приложения в области образования, медицины, анализа литературных текстов и т.д.
8. Подготовка исходных данных (числовых, текстовых, мультимедийных) и выбор формальных моделей представления знаний (предметных онтологий, лингвистических теорий и т.д.) для проведения вычислительных экспериментов и экспертной оценки предлагаемых решений.
9. Разработка новых хорошо-интерпретируемых математических методов интеллектуального анализа данных, использующих графовые и лингвистические представления данных.
10. Разработка новых гибридных подходов, позволяющих применять большие языковые модели к прикладным задачам анализа данных, таким как суммаризация больших текстов, планирование диалога и т.д.
11. Разработка новых автоматических методов для выявления и корректировки недостоверной информации на основании текстовых данных, включая методы обнаружения текстовых фрагментов, содержащих некорректную (искаженную) подачу информации на русском и английском языке.
12. Развитие, исследование и тестирование для различных предметных областей алгоритмов консенсус-кластеризации.
13. Развитие, исследование и тестирование для различных предметных областей алгоритмов интервальной кластеризации.
14. Разработка системы определения тональности и выявления сущностей для больших потоковых данных на открытом технологическом стеке.
15. Сравнение различных видов формальных грамматик, основанных на неассоциативных и частично ассоциативных логических системах. Выявление их выразительной силы и разработка эффективных алгоритмов для данных грамматик.
16. Исследование семантического пространства текстовых данных на языках из разных языковых групп, написанных людьми или сгенерированных различными видами ботов.
17. Разработка автоматических методов выделения характеристик для идентификации текстов, сгенерированных ботами.
ГРНТИ
28.17.19 Математическое моделирование
28.23.25 Модели и системы обучения
28.23.29 Программная реализация интеллектуальных систем
Ключевые слова
семантические технологии
рекомендательная система
база данных
Анализ данных
онтологическое моделирование
программное обеспечение
машинное обучение
представление знаний
база знаний
Детали
Начало
09.01.2024
Окончание
28.12.2024
№ контракта
075-00554-24-00
Заказчик
Правительство Российской Федерации
Исполнитель
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ "ВЫСШАЯ ШКОЛА ЭКОНОМИКИ"
Бюджет
Средства федерального бюджета: 17 005 670 ₽
ИКРБС
Похожие документы
Построение систем знаний и анализ данных на основе текстовой информации
0.950
ИКРБС
Сложные языковые и семантические модели в искусственном интеллекте
0.938
НИОКТР
Сложные языковые и семантические модели в искусственном интеллекте
0.938
НИОКТР
Модели и методы анализа текстовых данных, рекомендательных систем и майнинга данных
0.937
НИОКТР
Синтез логических и статистических методов машинного обучения для междисциплинарных приложений
0.930
НИОКТР
Хорошо интерпретируемые методы интеллектуального анализа семантически насыщенных данных и их приложения
0.924
ИКРБС
Методы анализа данных и знаний в интеллектуальных системах для трансдисциплинарных приложений
0.923
НИОКТР
СИСТЕМЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА, ИЗВЛЕЧЕНИЕ ЗНАНИЙ И АНАЛИЗ ТЕКСТОВ 2024-2028
0.922
ИКРБС
Создание моделей, методов и программных средств анализа текстов на естественном языке для использования в интеллектуальных информационных системах
0.920
НИОКТР
Модели и методы анализа неструктурированных данных, майнинг данных и рекомендательные системы
0.916
НИОКТР