ИКРБС
№ 225012904144-6Построение систем знаний и анализ данных на основе текстовой информации
28.12.2024
Объектом исследования в НИР являются различные системы знаний (включая базы данных) и анализ данных на основе текстовой информации, в том числе с применением больших языковых моделей.
Целью работы является разработка математических методов, алгоритмов и программных библиотек, позволяющих успешно сочетать подходы, основанные на формальных моделях представления знаний (текстовых, структурных, логических, лингвистических и т.д.), с современными подходами к глубинному обучению на больших данных (в том числе подходы основанные на генерации с дополненной выборкой).
В рамках данной работы были получены основные результаты в соответствии с поставленными задачами:
1) Обзор новых публикаций и интернет-источников по междисциплинарным приложениям методов искусственного интеллекта, на основе векторных баз данных, RAG-систем, современных методов повышения логических способностей LLM, техник промпт-инжиниринга.
2) Подготовлены исходные данные (числовые, текстовые, мультимедийные) для проведения вычислительных экспериментов и экспертной оценки предлагаемых решений.
3) Рассмотрены подходы анализа формальных понятий на задачах текста, а также исследована идентификация максимальных клик с учетом справедливости в атрибутивных социальных сетях с помощью понятийно-когнитивного обучения.
4) Обучены модели инфинитарной логики действий на основе синтаксических формальных понятий.
5) Описан агломеративный консенсусный кластер-анализ с автоматическим выбором числа кластеров.
6) Исследованы направления для идентификации текстов, сгенерированных ботами.
7) Разработан вопросно-ответного бота на основе нормативных данных и оценка тональности текстов, в том числе автоматические методы выделения характеристик для идентификации текстов, сгенерированных ботами.
8) Обучена модель для идентификации манипулятивных техник в текстах на основе трансформеров и дискурсивных структур.
9) Разработано мобильное приложение.
ГРНТИ
28.23.29 Программная реализация интеллектуальных систем
28.23.25 Модели и системы обучения
28.17.19 Математическое моделирование
Ключевые слова
АНАЛИЗ ФОРМАЛЬНЫХ ПОНЯТИЙ
БОЛЬШИЕ ЯЗЫКОВЫЕ МОДЕЛИ
ГРАФ ЗНАНИЙ
ГРАФОВЫЕ МОДЕЛИ
ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА
ТОНАЛЬНОСТЬ ТЕКСТА
ЧАТ-БОТ
Детали
НИОКТР
Заказчик
Правительство Российской Федерации
Исполнитель
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ "ВЫСШАЯ ШКОЛА ЭКОНОМИКИ"
Бюджет
Средства федерального бюджета: 17 110 890 ₽
Похожие документы
Построение систем знаний и анализ данных на основе текстовой информации
0.950
НИОКТР
Модели и методы анализа неструктурированных данных, майнинг данных и рекомендательные системы
0.932
ИКРБС
Модели и методы анализа текстовых данных, рекомендательных систем и майнинга данных
0.920
НИОКТР
Разработка программного компонента «Управление базой знаний» и обучение нейросетевой модели распознавания русского языка
0.917
ИКРБС
Изучение и развитие методов обучения с подкреплением и глубинного обучения для задач анализа и генерации текстов и изображений
0.916
НИОКТР
Сложные языковые и семантические модели в искусственном интеллекте
0.914
НИОКТР
Сложные языковые и семантические модели в искусственном интеллекте
0.914
НИОКТР
Новые методы машинного обучения для оценки и интерпретации языковых моделей
0.910
ИКРБС
Разработка и тестирование алгоритмов на основе машинного обучения для семантической обработки текстов на живом языке для автоматизации аналитической деятельности
0.909
ИКРБС
Модели и методы анализа неструктурированных данных, майнинг данных и рекомендательные системы
0.908
НИОКТР