ИКРБС
№ 324062100002-6Разработка механизмов памяти и внимания для обработки длинных последовательностей. Этап 2
29.12.2023
Основными объектами исследования являются: методы направленной генерации юмористических текстов; методы переноса токенизации между задачами обработки естественного языка; семантически обусловленные методы токенизации.
Основными целями исследования являются: разработка семантически ориентированного подхода к токенизации текстов, разработка подхода к генерации юмора, не требующего дообучения языковой модели, определение областей внедрения алгоритма VIPI с учетом его доменной специфики.
В рамках исследований был разработан фреймворк автоматической оценки токенов на базе трехуровневой типологии, с помощью этого фреймворка были оценены словари языковых моделей, а также была исследована взаимосвязь между балансом токенов разного типа и качеством токенизаторов на конечных задачах. Также был разработан и реализован новаторский подход к направленной генерации юмористических текстов, не требующий дообучения языковой модели. Были исследованы границы применимости алгоритма переноса словаря VIPI.
ГРНТИ
28.23.01 Общие вопросы искусственного интеллекта
28.23.02 Общие проблемы искусственного интеллекта
28.23.23 Модели когнитивной психологии
28.23.37 Нейронные сети
16.31.21 Автоматическая обработка текста. Автоматический перевод. Автоматическое распознавание речи
Ключевые слова
ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА
МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ
ТОКЕНИЗАЦИЯ
ГЕНЕРАТИВНЫЕ МОДЕЛИ
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
ГЛУБИННОЕ ОБУЧЕНИЕ
ТРАНСФОРМЕРЫ
Детали
НИОКТР
Заказчик
ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "ЦЕНТР ИСКУССТВЕННОГО ИНТЕЛЛЕКТА МТС"
Исполнитель
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ "ВЫСШАЯ ШКОЛА ЭКОНОМИКИ"
Бюджет
Средства хозяйствующих субъектов: 5 000 000 ₽
Похожие документы
Разработка механизмов памяти и внимания для обработки длинных последовательностей. Этап 1
0.860
ИКРБС
Разработка и исследование метода управляемой
генерации текстов по сюжетной линии
0.841
НИОКТР
Модели и методы анализа неструктурированных данных, майнинг данных и рекомендательные системы
0.840
ИКРБС
Методы оценивания языковых моделей в задачах понимания естественного языка
0.840
Диссертация
Разработка и верификация алгоритмов и дополнительных математических моделей генеративных моделей нового поколения на основе нейродифференциальных уравнений. Этап 3
0.840
ИКРБС
Метрики семантической и стилистической близости текстов на естественном языке
0.829
ИКРБС
Выявление релевантных дискурсивных признаков для решения задач анализа текстовых данных
0.824
Диссертация
Отчет о научно-исследовательской работе: РАЗРАБОТКА МЕТОДОВ АНАЛИЗА ТОНАЛЬНОСТИ РУССКОЯЗЫЧНЫХ ПУБЛИЦИСТИЧЕСКИХ ТЕКСТОВ С ИСПОЛЬЗОВАНИЕМ СИНТАКСИЧЕСКОЙ СТРУКТУРЫ ПРЕДЛОЖЕНИЙ (заключительный)
0.824
ИКРБС
Разработка и тестирование прототипа инфраструктуры базовых навыков (скиллов и стилей) цифровой личности на базе современных архитектур нейронных сетей с возможностью правдоподобного генерирования ответов на запросы пользователей.
0.824
НИОКТР
Эффективное доменно-ориентированное непрерывное обучение больших языковых моделей на основе доменного пост-обучения и редактирования знаний с помощью слоев с дообучаемыми адаптерами (промежуточный, этап 1)
0.823
ИКРБС