ИКРБС
№ АААА-Б20-220031890035-3

Разработка и тестирование алгоритмов на основе машинного обучения для семантической обработки текстов на живом языке для автоматизации аналитической деятельности

03.03.2020

Цель: разработка и тестирование алгоритмов на основе машинного обучения для семантической обработки текстов на живом языке для автоматизации аналитической деятельности. Задачи: исследование и проектирование семантических алгоритмов обработки текстов на живом языке; разработка внутреннего представления для хранения результатов в виде тензоров, таблиц и графов, хранения и анализа полученных результатов; разработка и отладка функций, реализующих алгоритмы обработки и функции хранения результатов, а также эффективных алгоритмов исполнения функций; исследование и выбор инструментов для визуализации результатов; сборка библиотек функций и тестирование алгоритмов и функций из собранных библиотек; разработка руководства пользователя. Проведены экспериментальные исследования существующих алгоритмов и методов обработки текстов на естественном языке. Определены требования к их доработке и реализации новых алгоритмов и методов с учетом эффективного исполнения. Разработаны семантические алгоритмы обработки текстов, проведен анализ их эффективности алгоритмов, выявлены их «слабые» места, и намечены работы по повышению их эффективности. Специфицированы библиотеки Morphology, Semantics.Core и Semantics.Algorithms, а также команды обработки запросов Semantics.Controllers. Разработана структура хранилища для внутреннего представления (тензоры, таблицы, графы), и определены методы и инструменты работы с ним, а также инструменты для визуализации объектов внутреннего представления. Данные библиотеки использованы в разработанном прототипе семантического ассистента, который использован при выполнении договоров для обработки данных, анализа и сохранения информации. Поданы две заявки на государственную регистрацию программы для ЭВМ (библиотеки Morphology и Semantics.Core).
ГРНТИ
27.41.23 Машинные, графические и другие методы вычислительной математики
16.21.51 Семантика
16.21.33 Лингвистика текста
20.23.17 Информационно-поисковые массивы. Базы данных. Манипулирование данными и файлами
20.19.27 Автоматизация знаковой обработки текста
Ключевые слова
ОБРАБОТКА ТЕКСТОВ
СЕМАНТИЧЕСКИЙ АЛГОРИТМ
БОЛЬШИЕ ДАННЫЕ
СЕМАНТИЧЕСКИЙ АНАЛИЗ
АНАЛИТИЧЕСКАЯ ДЕЯТЕЛЬНОСТЬ
МАШИННОЕ ОБУЧЕНИЕ
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
ТЕНЗОР
СЕМАНТИЧЕСКАЯ СЕТЬ
Детали

Заказчик
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ "ФОНД СОДЕЙСТВИЯ РАЗВИТИЮ МАЛЫХ ФОРМ ПРЕДПРИЯТИЙ В НАУЧНО-ТЕХНИЧЕСКОЙ СФЕРЕ"
Исполнитель
Общество с ограниченной ответственностью "ДИЭСТИ"
Похожие документы
Разработка и тестирование алгоритмов на основе машинного обучения для семантической обработки текстов на живом языке для автоматизации аналитической деятельности
0.936
НИОКТР
Исследование и проектирование семантических алгоритмов обработки текстов на живом языке. Разработка тензоров, таблиц, графов для хранения и анализа полученных результатов
0.934
ИКРБС
Разработка программного компонента «Управление базой знаний» и обучение нейросетевой модели распознавания русского языка
0.917
ИКРБС
Построение систем знаний и анализ данных на основе текстовой информации
0.911
НИОКТР
Построение систем знаний и анализ данных на основе текстовой информации
0.909
ИКРБС
Разработка модуля предобработки текста, модуля векторного представления слов и токенов, модуля классификации страниц. Разработка модуля обучения модели извлечения данных и дообучения моделей. Разработка модуля применения модели извлечения данных и модуля измерения количественных и качественных характеристик компонент системы. Компоновка разработанных модулей в прототип системы для извлечения данных из неструктурированного текста и его тестирование. Доработка прототипа системы для извлечения данных из неструктурированного текста и тестирование разработанного прототипа по результатам тестирования. Разработка технической и эксплуатационной документаций к прототипу системы для извлечения данных из неструктурированного текста и тестирование разработанного прототипа.
0.909
ИКРБС
РАЗРАБОТКА АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ ОБРАБОТКИ ЕСТЕСТВЕННОГО РУССКОГО ЯЗЫКА ДЛЯ ПОИСКА И РАСПОЗНАВАНИЯ ИМЕНОВАННЫХ СУЩНОСТЕЙ
0.908
ИКРБС
Разработка омниканальной системы разговорного искусственного интеллекта для ведения коммуникаций (заключительный)
0.908
ИКРБС
Проектирование и разработка версии программного комплекса для организации кроссплатформенной мультиотраслевой базы знаний с интеллектуальным поиском по данным, хранящимся в ней, с использованием технологии семантического анализа для распознавания сущностей в тексте и его структуризации
0.907
ИКРБС
Разработка и тестирование прототипа информационной системы экспертного и машинного анализа текстовых массивов как цифровой платформы для удаленной командной работы
0.906
ИКРБС