НИОКТР
№ 122031600234-6

Разработка нейросетевых методов и программных средств для анализа сложности и упрощения текстов на русском языке

15.03.2022

Проект посвящен фундаментальным проблемам создания средств автоматического анализа сложности текстов на русском языке. Объективная автоматическая оценка сложности текстов востребована в образовании и целом ряде других областей. Решение этой проблемы поможет в повышении качества учебных материалов и особенно актуально в свете персонализации обучения. Однако она остается нерешенной даже для английского языка, хотя и привлекала внимание многих исследователей. Ранее в нашем коллективе был решен ряд первоочередных задач в этой области, реализованы простые модели расчет сложности текстов на русском языке на основе небольшого числа низкоуровневых параметров. В зарубежных исследованиях в последние годы осуществляется переход от простых моделей к усложненным моделям нового поколения. Перечислим основные задачи, которые будут решаться в рамках данного проекта. Одна из них - оценка сложности текстов нейронными сетями в рамках недавно предложенной технологии глубокого обучения. Ранее сложность слов оценивалась только по простым параметрам - числу букв/слогов, частотности или присутствию в лексических минимумах. При этом совершенно не учитывался контекст. Простое слово может оказаться сложным для понимания, если оно употребляется в переносном смысле в незнакомом контексте, и наоборот, неизвестное слово может быть легко понято в подходящем контексте.
ГРНТИ
50.41.25 Прикладное программное обеспечение
Ключевые слова
НЕЙРОННЫЕ СЕТИ
BERT
СЛОЖНОСТЬ ТЕКСТА
СЛОЖНЫЕ СЛОВА
УПРОЩЕНИЕ ТЕКСТОВ
Детали

Начало
11.01.2022
Окончание
31.12.2023
№ контракта
22-21-00334
Заказчик
Российский научный фонд
Исполнитель
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "КАЗАНСКИЙ (ПРИВОЛЖСКИЙ) ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ"
Бюджет
Средства фондов поддержки научной и (или) научно-технической деятельности: 3 000 000 ₽
Похожие документы
Разработка нейросетевых моделей глубокого обучения на базе высокопроизводительных систем с GPU для моделирования синтаксической структуры предложения
0.909
НИОКТР
Сложность текстов на русском языке
0.900
НИОКТР
Автоматическое определение сложности слов в текстах для детей разного возраста
0.892
НИОКТР
Статистическое моделирование русского языка с помощью нейронных сетей
0.887
Диссертация
Гибридные нейросетевые методы анализа понятности текстов юридических документов на русском языке
0.885
Диссертация
Разработка алгоритмов построения сетей глубокого обучения как суперпозиций универсальных моделей
0.877
НИОКТР
Исследование точности решения задачи комплексного морфо-синтаксического анализа текстов естественного языка на основе вероятностно-нейросетевых моделей
0.875
НИОКТР
Интеллектуальный анализ текстовых данных большого объема в финансах, бизнесе и образовании на основе адаптивных семантических моделей (2 этап)
0.875
ИКРБС
Интеллектуальный анализ текстовых данных большого объема в финансах, бизнесе и образовании на основе адаптивных семантических моделей (1 этап)
0.873
ИКРБС
Разработка классификатора на основе топологии рекуррентных нейронных сетей для анализа русскоязычных текстов, размеченных в виде деревьев синтаксических зависимостей
0.872
НИОКТР