ИКРБС
№ 223022100072-5

РАЗРАБОТКА ПРОТОТИПА СЕРВИСА ПО ГЕНЕРАЦИИ ОПИСАНИЙ ТОВАРОВ ДЛЯ ИНТЕРНЕТ-МАГАЗИНОЙ С ПОМОЩЬЮ ИСКУССТВЕННОГО ИНТЕЛЕКТА

30.01.2023

Цели работы: 1. Сборка данных и подготовка корпуса данных для обучения нейросетевой модели 2. Проведение исследования архитектур лингвистических и нейросетевых моделей 3. Разработка модуля взаимодействия с пользователем (аутентификация, навигация, элементы взаимодействия) 4. Разработка модуля генерации 5. Исследование метрик производительности модуля генерации 6. Разработка серверного модуля прототипа сервиса 7. Сборка прототипа сервиса по генерации описаний товаров 8. Нагрузочное тестирования прототипа сервиса по генерации описаний товаров. 9. Доработка пользовательского интерфейса в части импорта/экспорта данных 10. Исследование качества составляемых текстов. Объектом исследования являлся процесс генерации продуктовых описаний, с использованием языковой модели для получения вероятностных распределений слов. Область применения НИОКР - электронная коммерция, интернет-магазины Значимость данного НИОКР обуславливается новым подходом к созданию контента: переходом от создания контента людьми (копирайтерами) к генеративному ИИ. В результате работы, были достигнуты следующие характеристики: - Генерируемый текст от 300 до 1000 символов - Среднее время генерации без нагрузки 3-4 секунды - При нагрузке 3 одновременных пользователя среднее время генерации 4-5 секунд - Средняя уникальность текста >85% - 99.7% соответствие классификации входного товара и результата генерации - SEO-оптимизация по большинству входных параметров (seo-ключи во входных данных входят в генерации) - Перплексия текста, оцененная не обученной на описаниях товаров моделью gpt3 более 12 и менее 30 - Перплексия текста, оцененная обученной на описаниях товаров моделью gpt3 более 8 и менее 25 - Средняя косинусная близость между векторными представлениями тегов и словами описания не менее 0.65 Данные результаты в значительной степени привосходят первоночальные требования к результату работы сервиса. Разработанное в результате НИОКР решение является в высокой степени экономически эффективным. Это подтверждает устойчивый спрос на продукт по генерации текста на русскоязычном рынке. Более 10 компаний приняли положительное решение о приобретении продукта. Благодаря НИОКР наблюдается значительное снижение стоимости написания текста для интернет-магазинов. Прогнозируем резкое увеличение важности объекта исследования ввиду массового перехода на генеративные подходы к созданию контента в ближайшие года. Рекомендуем имплементировать инструменты автоматического создания контента во все площадки электронной коммерции. В результате выполнения работы была создана ИС: платформа для автоматического создания текстового контента для электронной коммерции. Результат выполнения работ в соответствии с Техническим заданием считаем успешным. Календарный план был изменен, из-за проблем и заминок в технической реализации инфраструктурной части решения, в т.ч доступности сервисов облачных вычислений от компании Amazon Web Services.
ГРНТИ
20.53.15 Средства ввода информации
20.53.19 Средства обработки и поиска информации
20.53.21 Средства выдачи информации
Ключевые слова
автоматизация копирайтинга
обработка естественного языка
искусственный интеллект
нейронные сети
генеративные модели
электронная коммерция
продуктовые описания
Детали

НИОКТР
Заказчик
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ "ФОНД СОДЕЙСТВИЯ РАЗВИТИЮ МАЛЫХ ФОРМ ПРЕДПРИЯТИЙ В НАУЧНО-ТЕХНИЧЕСКОЙ СФЕРЕ"
Исполнитель
ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "СТУРТУП"
Бюджет
Средства фондов поддержки научной и (или) научно-технической деятельности: 1 000 000 ₽
Похожие документы
СБОР ДАННЫХ И ПОДГОТОВКА КОРПУСА ДАННЫХ ДЛЯ ОБУЧЕНИЯ НЕЙРОСЕТЕВОЙ МОДЕЛИ. ПРОВЕДЕНИЕ ИССЛЕДОВАНИЯ АРХИТЕКТУР ЛИНГВИСТИЧЕСКИХ И НЕЙРОСЕТЕВЫХ МОДЕЛЕЙ. РАЗРАБОТКА МОДУЛЯ ВЗАИМОДЕЙСТВИЯ С ПОЛЬЗОВАТЕЛЕМ (АУТЕНТИФИКАЦИЯ, НАВИГАЦИЯ, ЭЛЕМЕНТЫ ВЗАИМОДЕЙСТВИЯ). РАЗРАБОТКА МОДУЛЯ ГЕНЕРАЦИИ
0.937
ИКРБС
Разработка методики и алгоритма генерации уникального описания товара. Разработка алгоритмов оценки и генерации комбинированных фотографий товаров.
0.926
ИКРБС
Разработка массивов данных. Подбор математического аппарата для решения задач классификации текстов на примерах массивов данных. Проектирование архитектуры прототипа системы. Разработка протокола обмена данными между прототипом системы и системами для автоматизации обработки информации. Разработка компонента анализа визуальной и текстовой информации. Обучение нейросетевой модели распознавания русского языка. Извлечение промта с каждой из картинок через Focus. Анализ данных с помощью YOLO. (промежуточный).
0.924
ИКРБС
Сбор данных о товарах и исследование структуры информации. Разработка алгоритмов очистки, нормализации и подготовки данных для обучения алгоритмов. Разработка алгоритма генерации наименования товара. Разработка алгоритма обогащения значений характеристик товара.
0.922
ИКРБС
Разработка и тестирование прототипа системы для анализа графического и текстового материала при помощи искусственного интеллекта (заключительный)
0.922
ИКРБС
Разработка механизма генерации маркетинговых материалов для прототипа веб-платформы. Разработка Back-End архитектуры прототипа веб-платформы. Разработка модуля сбора данных прототипа веб-платформы. Разработка UI/UX прототипа веб-платформы (промежуточный).
0.916
ИКРБС
Разработка и тестирование прототипа системы на основе нейросетевых подходов для автоматизированной генерации коммерчески успешных визуальных представлений товара (заключительный)
0.914
ИКРБС
Разработка и тестирование алгоритмов генерации продуктовых страниц для онлайн-ритейла на основе алгоритмов машинного обучения
0.914
ИКРБС
Отчет о выполнении НИИОКР по теме "Разработка прототипов модуля генерации описаний и заголовков в полуавтоматическом режиме, модуля анализа покупательских трендов, системы управления товарами с возможностью генерации заголовков и описаний товаров на естественном языке, в автоматическом режиме с использованием данных предоставляемых пользователем и анализа трендов торговых площадок." (заключительный)
0.912
ИКРБС
Сбор данных и файнтьюнинг модели искусственного интеллекта для генерации описаний товаров в интернет-магазинах
0.909
ИКРБС