На сегодняшний день в мире видеокодеков доминируют стандарты H.265/HEVC консорциума MPEG LA и VP9 компании Google. Лицензионные отчисления с каждого произведенного продукта, связанного с видео, вынуждены платить как все производители электроники, так и компании, транслирующие и принимающие видео. Российские программисты намерены разрушить монополию США на рынке видеокодирования, реализовав до конца 2016 года коммерческую версию отечественного кодека, имитирующего преобразование (сжатие) визуальной информации между человеческим глазом и мозгом.
Российская компания «Лэсиф» привлекла 32 млн инвестиций. С помощью этих средств она планирует завершить разработку аппаратнонезависимого видеокодека нового поколения, который сможет превзойти по своим характеристикам существующие на сегодняшний день технологии видеокодирования, присутствующие на рынке.
В основу нового продукта лягут собственные многолетние разработки программиста Всеволода Мокрушина, реализованные им в кодеке SIF-1, на который он в феврале 2013 г. получил соответствующий патент в США. Изначально этот кодек писался на языке программирования C++ с ассемблерными вставками, потом был переписан на С.
Сейчас ведутся переговоры с потенциальными заказчиками. В России «Лэсиф» особенно рассчитывает на внимание предприятий оборонной отрасли, а в мире среди перспективных покупателей называет Apple, Google, Microsoft, Samsung, Qualcomm, Intel, AMD, nVidia.
Общий объем рынка видеокодеков в мире «Лэсиф» оценивает в $10 млрд в год. С точки зрения Мокрушина, распространенные на рынке кодеки близки к порогу развития заложенных в них алгоритмов, в то время как ограничения по сжатию в его кодеке пока не выявлены.
В разговоре с CNews, Всеволод Мокрушин сообщил, что занимается разработкой своего кодека с 2000 г. «Тогда стали появляться кодеки, передового на тот момент стандарта Н263, — говорит он. — В результате, полученного мной опыта в работе с этим стандартом, я пришел к выводу, что используемый в нем подход недостаточно гибок, чтобы реализовать эффективные психовизуальные модели сжатия. Уже тогда у меня было понимание, что возможность наращивать эффективность сжатия видеокодеков «грубой силой» в ближайшем будущем будет исчерпана, так как упрется в фундаментальный барьер, обойти который будет очень сложно».
По словам Мокрушина, общеизвестен факт того, что объем информации получаемый световыми рецепторами человеческого глаза существенно больше, чем теоретическая пропускная способность зрительного нерва, передающего полученную глазом информацию в зрительную кору мозга. «То есть уже на этом этапе происходит сжатие и отбрасывание части полученной информации», — заверяет он.
Мокрушин уверен, что данное сжатие не может базироваться на очень сложных алгоритмах, так как основная обработка производиться зрительной корой. «По сути, нейроны сетчатки должны локально решать, какая часть полученной зрительной информации важна и должна быть передана дальше, а какую можно отбросить. Вся обработка производится относительно локально и независимо для различных участков изображения, — поясняет он. — В результате на одних участках чувствительность глаза становится выше для одних признаков изображения, а на других для совсем иных».
Основная задача, решаемая нейронами зрительной коры, как заверяет Мокрушин, состоит в том, чтобы максимально сохранить те признаки, которые могут улучшить распознавание жизненно важной информации и огрубление неважных признаков. «Соответственно, если видеокодек точно также будет огрублять не важные для конкретного участка изображения признаки и точнее кодировать важные, то мы можем получить выигрыш в визуальном качестве сжатого видео, даже если в целом изображение будет передаваться менее точно», — отмечает он.
В идеале наиболее подходящий для создания психовизуальной модели алгоритм должен быть максимально похож на тот, что используется при кодировании информации между глазом и зрительной корой.