Первый релиз кодека AV2: Alliance for Open Media меняет будущее видео

Первый релиз кодека AV2: Alliance for Open Media меняет будущее видео

Индустрия цифрового контента стоит на пороге очередной технологической смены вех. Некоммерческий консорциум Alliance for Open Media (AOMedia) тихо, но весьма революционно опубликовал в своем официальном репозитории AVM на GitHub первую полноценную версию видеокодека нового поколения — AV2 (версия 1.0.0).

Пока массовый потребитель только привыкает к повсеместному внедрению аппаратного ускорения для формата AV1, инженеры крупнейших технологических компаний планеты уже заложили программный фундамент для видеотехнологий следующего десятилетия. Проекту еще предстоят масштабные доработки и годы оптимизации, но архитектурные контуры и ключевые фишки преемника стали понятны уже сейчас.Alliance for Open Media — создатели стандартов AV1 и AV2, создано искусственным интеллектом

Alliance for Open Media — создатели стандартов AV1 и AV2. Источник: Alliance for Open Media

Философия AV2: Наследие AV1 и победа над роялти

Главный принцип, который перекочевал из AV1 в новый стандарт, — полное отсутствие лицензионных отчислений (royalty-free). Чтобы понять, почему это так важно, достаточно взглянуть на историю форматов H.264, H.265 (HEVC) и новейшего VVC (H.266). Все они создавались коммерческими пулами под эгидой MPEG, и за право использовать их в смартфонах, браузерах, процессорах или стриминговых сервисах компании обязаны платить огромные скрытые отчисления. В некоторых случаях лицензионные сборы для крупных медиагигантов доходили до миллионов долларов в год.

Именно поэтому в свое время сформировался альянс AOMedia, куда вошли мастодонты рынка: Google, Apple, Microsoft, Amazon, Netflix, Intel, Nvidia и AMD. Их цель — создать полностью открытый, бесплатный для внедрения и максимально эффективный стандарт сжатия. AV2 продолжает эту традицию. Его базовое предназначение осталось прежним:

  • Обеспечение сверхэффективного сжатия тяжелых видеофайлов.
  • Качественная потоковая передача (стриминг) в разрешениях 4K и 8K.
  • Организация онлайн-трансляций и видеоконференций в реальном времени с минимальной задержкой.

Технический разбор: Что такое AOM Video Model (AVM)?

Текущая дебютная сборка кодека в репозитории получила маркировку av2 – AOMedia Project AV2 Encoder 1.0.0-3-gf236400. Вместе с ней разработчики опубликовали ссылки на кодировщик avm-av2 и библиотеки libaom-av2 / libavm-av2.

Здесь кроется важный нюанс, который часто путает рядовых пользователей. Программа AVM (AOM Video Model), в рамках которой состоялся релиз, — это так называемое эталонное программное обеспечение.

Что такое эталонный софт? Это не готовый плеер или быстрый конвертер, который можно скачать, чтобы за пару минут перекодировать домашний фильм. AVM — это громоздкая, чисто математическая модель кодека. Она создается учеными и инженерами для того, чтобы зафиксировать структуру потока данных (bitstream) и проверить, правильно ли работают заложенные математические алгоритмы сжатия.

По этой причине эталонный кодировщик работает невероятно медленно. Он может обрабатывать один кадр видео по несколько секунд или даже минут, полностью загружая мощнейшие многоядерные процессоры. Он категорически не готов к повседневному применению обычными пользователями. Однако энтузиасты, которые уже успели скомпилировать код и провести первые тесты «чистой» математики AV2, отметили поразительную вещь: кодек демонстрирует феноменальную эффективность на сверхнизких битрейтах. Картинка сохраняет четкость там, где старые алгоритмы превращают ее в кашу из пикселей.

Что изменилось под капотом: Инновации сжатия

По предварительным оценкам экспертов и результатам прототипирования, AV2 обеспечивает примерно на 30% более эффективное сжатие видео, чем его предшественник AV1, при аналогичном уровне визуального качества. По сути, это позволяет передавать идентичную по четкости картинку, расходуя почти на треть меньше сетевого трафика.

Принцип работы современных видеокодеков: от захвата до сжатия и воспроизведения.

Достичь такого скачка удалось за счет кардинальной модернизации внутренней архитектуры, унаследованной от AV1:

  1. Расширенное рекурсивное разбиение (Recursive Partitioning): При кодировании кадр делится на блоки. В AV2 алгоритмы деления стали более гибкими, позволяя точнее подстраиваться под сложные геометрические формы на видео.
  2. Разделение яркостной и цветной составляющих (Semi-decoupled Partitioning): Теперь сетка блоков для черно-белого контура (яркости) и цветовых пятен (хроматического компонента) может обрабатываться полунезависимо, что экономит биты на однородных цветовых поверхностях.
  3. Улучшенное внутрикадровое предсказание: Алгоритмы научились гораздо точнее предугадывать, как именно должен выглядеть соседний пиксель, опираясь на информацию о цвете и яркости уже обработанных участков кадра.

Новые сценарии: Виртуальная реальность и текст

Мир медиа изменился со времен проектирования AV1. Создавая AV2, консорциум AOMedia внедрил глубокую оптимизацию под специфические современные типы контента:

  • Технологии AR и VR (дополненная и виртуальная реальность): Панорамные видео формата 360° требуют колоссального битрейта и ультранизкого пинга, иначе у пользователя в VR-шлеме начнется тошнота. AV2 аппаратно готов к обработке таких «сферических» потоков.
  • Экранный контент (Screen Content Tools): Сжатие интерфейса операционной системы, строк программного кода или текста презентаций — давняя боль классических видеокодеков. Алгоритмы, заточенные под мягкие киношные тени, размывают резкие края букв, создавая вокруг них грязные ореолы. AV2 получил специализированные инструменты для идеального сохранения резкости шрифтов при захвате экрана.
  • Материалы с разделенным экраном (Split-Screen): Оптимизация для стриминга, когда на одном экране транслируется сразу несколько независимых видеопотоков (например, в сервисах видеоконференций или во время киберспортивных трансляций).

Подводные камни: Патентные споры

Несмотря на открытый статус стандарта, вокруг него уже начинают сгущаться тучи. Известный люксембургский патентный агрегатор Sisvel (NPE — организация, не производящая продукцию, но владеющая патентами) еще до финального релиза спецификаций объявил о планах создать коммерческий патентный пул для AV2.

Аналогичную схему они пытались провернуть и с AV1, утверждая, что открытый кодек использует часть технологий, защищенных их патентами. Alliance for Open Media обычно успешно отбивается от подобных претензий в судах благодаря мощной юридической поддержке со стороны Apple, Google и Microsoft, но этот прецедент показывает, что борьба за бесплатные стандарты будет жесткой.

Сроки внедрения: Когда мы сможем им пользоваться?

Исторический опыт подсказывает, что путь нового кодека от репозитория на GitHub до реального применения в устройствах занимает много лет. Видеокодеки — это та сфера, где софтверные решения без «кремниевой» поддержки практически бесполезны для массового рынка.

Чтобы оценить временную шкалу, достаточно вспомнить жизненный цикл AV1. Его спецификации утвердили в 2018 году. Прошло долгих два года, прежде чем Intel добавила аппаратный декодер AV1 в свои ноутбучные процессоры Tiger Lake, а Nvidia — в видеокарты RTX 30-й серии. Полноценные же блоки аппаратного кодирования (энкодеры) появились в GPU и вовсе лишь к 2022-2023 годам (поколения RTX 40 и Radeon RX 7000).

Этап развития технологииКак это было с AV1Как это происходит с AV2
Релиз эталонного кода 1.02018 год2026 год
Появление первых программных плееровЧерез несколько месяцевУже тестируется в VLC 4.0 (сборки 2026 года)
Интеграция аппаратного декодера в GPUЧерез 2 года (2020 г.)Ожидается не ранее 2027–2028 гг.
Массовое внедрение (энкодинг в картах)Через 4-5 лет (2022-2023 гг.)Ожидается ближе к 2029–2030 гг.

Сейчас ситуация развивается чуть быстрее. Например, разработчики из VideoLAN уже вовсю ведут работу над ранним CPU-декодером dav2d, а на выставках демонстрируются рабочие прототипы плеера VLC 4.0, способные программно воспроизводить тестовые ролики AV2 на обычных ноутбуках. Тем не менее, пока производители графических чипов не спроектируют и не выжгут на кремнии специализированные блоки для обработки AV2, формат останется уделом экспериментаторов. Ближайшие несколько лет на рынке будет безраздельно доминировать AV1, который только сейчас вышел на пик своей формы.