ИКРБС
№ 324060500043-1

Разработка механизмов памяти и внимания для обработки длинных последовательностей. Этап 1

30.12.2022

Объекты исследования: 1. Методы обучения по плану в задачах обработки естественного языка; 2. Методы переноса токенизации между задачами обработки естественного языка; 3. Семантически обусловленные методы токенизации. Цели исследований: 1. Разработка новых способов использования обучения по плану в задачах обработки естественного языка, а также адаптация существующих алгоритмов из других областей машинного обучения; 2. Разработка способов использования задаче-зависимой токенизации для увеличения качества моделей в обработке естественного языка; 3. Разработка лингвистически интерпретируемого подхода к токенизации, опирающегося на семантические свойства словаря. Результаты: 1. Проведено объемное исследование существующих способов обучения по плану, продемонстрировавшее, что в области обработки естественного языка данный подход не является эффективным, по исследованиям написана и опубликована статья; 2. Разработан алгоритм переноса токенизации от задачи предобучения на задачу дообучения, показавший прирост качества, по результатам написана статья. Работы выполнялись за счет средств внебюджетного софинансирования в рамках договора с индустриальным партнером ООО "Центр искусственного интеллекта МТС" № 6.12-20/270821-2 (№ D210292562-38) от 27 августа 2021г. 3. Изучены статистические особенности распределения Ципфа на словарях различного размера, выделены семантически различные группы токенов в рамках этого распределения, выработана их классификация, по результатам написана статья. 4. В рамках социально-значимой работы центра осуществлён совместный исследовательский проект с благотворительной организацией “Ночлежка”. По итогам проекта написана исследовательская статья, принятая на конференцию AAAI в трек “Искусственный интеллект в социальной сфере”. 5. Поставлена серия экспериментов по разработке альтернатив механизму внимания, которые были бы применимы к более длительным последовательностям.
ГРНТИ
28.23.01 Общие вопросы искусственного интеллекта
28.23.02 Общие проблемы искусственного интеллекта
28.23.23 Модели когнитивной психологии
28.23.37 Нейронные сети
16.31.21 Автоматическая обработка текста. Автоматический перевод. Автоматическое распознавание речи
Ключевые слова
ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА
МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ
ТОКЕНИЗАЦИЯ
АЛГОРИТМЫ МАШИННОГО ОБУЧЕНИЯ
АЛГОРИТМ ПЕРЕНОСА ТОКЕНИЗАЦИИ
Детали

НИОКТР
Заказчик
ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "ЦЕНТР ИСКУССТВЕННОГО ИНТЕЛЛЕКТА МТС"
Исполнитель
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ "ВЫСШАЯ ШКОЛА ЭКОНОМИКИ"
Бюджет
Средства хозяйствующих субъектов: 5 000 000 ₽
Похожие документы
Разработка программного компонента «Управление базой знаний» и обучение нейросетевой модели распознавания русского языка
0.878
ИКРБС
Эталонное тестирование языковых моделей на задачах понимания естественного языка
0.877
Диссертация
Методы оценивания языковых моделей в задачах понимания естественного языка
0.874
Диссертация
Сложные языковые и семантические модели в искусственном интеллекте
0.873
НИОКТР
Сложные языковые и семантические модели в искусственном интеллекте
0.873
НИОКТР
Метрики семантической и стилистической близости текстов на естественном языке
0.872
ИКРБС
Изучение и развитие методов обучения с подкреплением и глубинного обучения для задач анализа и генерации текстов и изображений
0.872
НИОКТР
Модели и методы анализа неструктурированных данных, майнинг данных и рекомендательные системы
0.870
ИКРБС
Способ обработки длинных входных последовательностей рекуррентным генеративным трансформером с памятью
0.869
РИД
Эффективное доменно-ориентированное непрерывное обучение больших языковых моделей на основе доменного пост-обучения и редактирования знаний с помощью слоев с дообучаемыми адаптерами (промежуточный, этап 1)
0.869
ИКРБС