НИОКТР
№ 124020700092-3

Разработка бенчмарков для задач распространения цвета, предсказания карт внимания, нейросетевого сжатия и построения карт оптического потока

02.02.2024

Объем видеотрафика растет с каждым годом. Это влечет за собой необходимость разрабатывать методы для хранения и передачи видеоконтента, которые смогут уменьшать размер видео, улучшая при этом его субъективное качество. Каждый день создается и загружается в сети “Интернет” огромное количество новых видеофайлов, общая продолжительность которых превышает продолжительность человеческой жизни. Поэтому становятся все более актуальными методы для работы с видеоданными. Распространение данных в видео является полезной технологией, использующейся в различных задачах обработки видеопотока. Так, имея для одного из кадров видео какую-либо разметку (например бинарную маску, определяющую положение объекта), требуется перенести её на остальные кадры в видео. Задача распространения цвета заключается в том, чтобы перенести цвет с одного или нескольких цветных кадров на остальные черно-белые. Увеличивающееся количество алгоритмов распространения цвета, а также простота генерации размеченных данных для них, облегчают исследование темы распространения данных на этом конкретном случае. Однако, для данной задачи не существует специализированных объективных методов оценки качества (метрик), самыми популярными используемыми метриками являются PSNR и SSIM, которые зачастую плохо коррелируют с субъективным восприятием. Так как при работе методов возникают специфические искажения, разработка бенчмарка и создание специализированной метрики для задачи распространения цвета позволит получить большую корреляцию с субъективными оценками и более адекватно оценить имеющиеся алгоритмы. Построение карт оптического потока — одна из базовых и ключевых задач обработки видео. При распространении данных в видео частым подходом является использование оптического потока. Классический подход для сравнения методов требует попиксельной разметки между двумя кадрами для получения истинного значения карт оптического потока. В данном проекте предлагается сравнить качество работы методов, на задаче распространения цвета. Карты внимания, представляющие из себя тепловые карты, выделяющие более важные с точки зрения зрителей области, могут служить источником информации о том, какие области стоит сжимать сильнее, чтобы получать меньший объем видео, а какие, наоборот, слабее, чтобы улучшить их визуальное качество, а значит в среднем и всего видео. Получение карт внимания напрямую от зрителей возможно с использованием айтрекеров — внешних устройств, отслеживающих в реальном времени направление взгляда. Но использование дорогостоящего оборудования может не оправдать себя и сделает процесс получения карт крайне медленным, поэтому автоматические методы получения карт внимания обрели популярность, а значит появилась необходимость сравнивать эти методы для выявления лидеров. Кроме того, хоть качество этих методов постоянно растет, сейчас оно все еще сильно ниже качества карт полученных с использованием реальных людей. Это значит, что проблема поиска более оптимального способа получения эталонных данных все еще остается актуальной. В данном проекте предлагается собрать большое количество данных альтернативным методом для более качественного обучения и тестирования моделей предсказания карт внимания. Также проект направлен на проведение объективного сравнения множества алгоритмов получения карт внимания. Задача сжатия изображений является приоритетным направлением для исследования уже многие годы. Но за последние 5 лет на передний план выдвинулись нейросетевые методы сжатия, которые смогли обогнать традиционные методы по многим существующим метрикам качества. Чаще всего сравнение кодеков проводится на датасетах KODAK или Technik, этим датасетам не хватает достаточного количества изображений, а также разнообразия контента для качественного сравнения работы нейросетевых кодеков. В связи с этим предлагается создать бенчмарк нейросетевых методов сжатия изображений, в котором участники будут протестированы на большом количестве изображений, покрывающими все случаи использования кодека.
ГРНТИ
28.23.15 Распознавание образов. Обработка изображений
Ключевые слова
нейросетевое сжатие изображений
сжатие
айтрекер
отслеживание внимания
карты внимания
оптический поток
распространение цвета в видео
распространение данных в видео
обработка видео
бенчмарк
Детали

Начало
15.01.2024
Окончание
31.12.2025
№ контракта
24-21-00172
Заказчик
Российский научный фонд
Исполнитель
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИМЕНИ М.В.ЛОМОНОСОВА"
Бюджет
Средства фондов поддержки научной и (или) научно-технической деятельности: 3 000 000 ₽
Похожие документы
РАЗРАБОТКА МЕТОДОВ ОБЪЕКТИВНОЙ ОЦЕНКИ КАЧЕСТВА АЛГОРИТМОВ ПРЕОБРАЗОВАНИЯ ВИДЕО
0.913
НИОКТР
Методы проектирования и тестирования алгоритмов оценки качества обработки и кодирования видеоданных
0.900
Диссертация
Методы и алгоритмы сжатия цифровых изображений и видео на основе методов машинного обучения
0.896
НИОКТР
Разработка нейросетевых алгоритмов обработки и сжатия видеопоследовательностей
0.892
НИОКТР
Разработка нейросетевых алгоритмов обработки и сжатия видеопоследовательностей
0.892
НИОКТР
Разработка нейросетевых методов оценки различий по цвету и резкости, их исправления, оценки геометрических искажений между ракурсами стереоскопического видео. Тестирование разработанных методов на VR180 роликах, собранных с платформ видеохостингов. Разработка системы генерации отчетов по результатам анализа стереоскопических видео. Тестирование нейросетевых методов построения оптического потока для задачи сопоставления ракурсов стереоскопического видео, их дообучение в случае различий кадров по резкости и цвету.
0.881
ИКРБС
Повышение эффективности передачи видео в компьютерных сетях с помощью нейросетевого кодирования / Improving the Efficiency of Video Transmission in Computer Networks Using Neural Network Coding
0.879
Диссертация
Развитие нейросетевых методов повышения качества передачи цифровых изображений в интеллектуальных видеосистемах
0.876
НИОКТР
МЕТОДЫ АНАЛИЗА И ОБРАБОТКИ ИЗОБРАЖЕНИЙ ДЛЯ ИНДЕКСАЦИИ ВИДЕОДАННЫХ И ИХ УСТОЙЧИВОГО ПОИСКА В РЕЖИМЕ РЕАЛЬНОГО ВРЕМЕНИ
0.875
ИКРБС
Исследование и разработка адаптивных методов селекции интегральных параметров объектов видеоконтроля для прикладных систем видеоаналитики
0.875
ИКРБС