НИОКТР
№ 122031000075-1

Методы и алгоритмы сжатия цифровых изображений и видео на основе методов машинного обучения

03.03.2022

Приведённый в заявке анализ показал отсутствие явного преимущества современных алгоритмов компрессии, основанных на машинном обучении, над давно известными популярными алгоритмами компрессии изображений и видео, основанными на декоррелирующих преобразованиях, энтропийном кодировании и оценке движения. Таким образом, потенциал машинного обучения в области компрессии в настоящий момент не раскрыт, что позволяет надеяться на кратное увеличение эффективности компрессии при улучшении современных методов машинного обучения и их использовании для компрессии изображений и видео. Развитие исследований в рассматриваемой области позволит сократить отставание РФ, а, возможно, и занять лидирующие позиции в таких важных экономических сферах, как телемедицина, телекоммуникации (широковещательная передача, удаленная работа и обучение и т.п.), интерактивные развлечения (игровая индустрия), а также создание специальных технических средств типа дистанционно-управляемых роботов, работающих в сложных условиях, систем видеосвязи с узким пропускным каналом и др. Научной новизной будут обладать предлагаемые к разработке модификации алгоритмов машинного обучения, которые войдут в состав разрабатываемых методов компрессии. Указанные модификации будут основаны, в первую очередь, на ортогонализации и параметризации сверточных ядер, используемых в автоэнкодерах, а также сверточных и генеративно-состязательных нейросетях, которые будут выбраны в рамках настоящего проекта для использования в составе разрабатываемых методов компрессии изображений (в том числе гиперспектральных) и видео. Актуальность компрессии цифровых изображений и видео с использованием методов машинного обучения обусловлена ростом пространственного разрешения, качества цветопередачи и в целом качества восприятия визуальных данных, ростом объема хранимых и передаваемых визуальных данных в сетях общего пользования, ростом ожиданий пользователей относительно качества получаемой ими видеоинформации и т.д. Предлагается разработать основанный на машинном обучении метод компрессии изображений, использующий современные нейросетевые алгоритмы сверхразрешения и доопределения (image inpainting) цифровых изображений. Приведённый в заявке анализ даёт основания для выбора свёрточных нейросетей, автоэнкодеров и генеративно-состязательных нейросетей в качестве базовых технологий для предлагаемого метода компрессии. Используемые свёрточные нейросети будут усовершенствованы посредством ортогонализации и/или параметризации настраиваемых свёрточных ядер в целях повышения устойчивости и сокращения времени обучения. Затем предложенные модификации алгоритмов машинного обучения, будут обобщены на трёхмерный случай для использования при компрессии гиперспекральных изображений и видео. Метод будет использовать безызбыточный вариант пирамидального представления изображения, который позволит учитывать при настройке машинного обучения структурные особенности изображения, проявляющие на различных масштабных уровнях. Структура предлагаемого метода позволит обеспечить работу как в режиме управления максимальной/квадратичной погрешностью, так и в режиме управления коэффициентом сжатия. Пирамидальность представления изображения позволит гарантировать независимость времени декомпрессии прореженного фрагмента от масштаба, а также реализовать механизмы помехозащищенности и стабилизации скорости формирования потока сжатых данных, что обосновывает перспективность исследований в выбранном направлении.
ГРНТИ
28.23.37 Нейронные сети
28.23.15 Распознавание образов. Обработка изображений
Ключевые слова
компрессия видео
геоинформатика
гиперспектральные изображения
свёрточные нейросети
компрессия изображений
нейронные сети
машинное обучение
Детали

Начало
21.12.2021
Окончание
31.12.2023
№ контракта
22-21-00662
Заказчик
Российский научный фонд
Исполнитель
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "САМАРСКИЙ НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ ИМЕНИ АКАДЕМИКА С.П.КОРОЛЕВА"
Бюджет
Средства фондов поддержки научной и (или) научно-технической деятельности: 3 000 000 ₽
Похожие документы
Развитие нейросетевых методов повышения качества передачи цифровых изображений в интеллектуальных видеосистемах
0.920
НИОКТР
Методы и алгоритмы сжатия цифровых изображений и видео на основе методов машинного обучения
0.917
ИКРБС
Разработка нейросетевых алгоритмов обработки и сжатия видеопоследовательностей
0.912
НИОКТР
Разработка нейросетевых алгоритмов обработки и сжатия видеопоследовательностей
0.912
НИОКТР
Экономичные средства интеллектуального анализа визуальной информации на основе сверточных нейронных сетей
0.907
НИОКТР
Исследование и разработка адаптивных методов селекции интегральных параметров объектов видеоконтроля для прикладных систем видеоаналитики
0.901
ИКРБС
Развитие новых методов глубинного обучения в задачах обучения по большим объемам данных
0.901
ИКРБС
Методы и алгоритмы сжатия цифровых изображений и видео на основе методов машинного обучения
0.900
ИКРБС
Метод, алгоритмы и устройства сжатия и восстановления изображений при удаленном контроле критических вычислительных систем
0.898
Диссертация
Ускорение, сжатие и усовершенствование нейросетевых алгоритмов классификации и распознавания объектов на изображении и в видеопотоке
0.898
Диссертация