ストリーミング技術の中核をなすビデオコーデックの世界で、新たなマイルストーンが打ち立てられようとしている。Google、Netflix、Amazon、Appleといった巨大テック企業が結集するコンソーシアム「Alliance for Open Media (AOMedia)」が開発を進めてきた次世代ビデオコーデック「AV2」の詳細が、ついに公の場で語られたのだ。
Netflixでコーデック開発を率いるAndrey Norkin氏が最近行ったプレゼンテーションによれば、AV2は現在主流のオープンフォーマット「AV1」と比較して、約30%もの圧縮効率向上を達成しているという。これは、同じ画質を約3割少ないデータ量で実現できることを意味し、ストリーミングサービスの帯域コスト削減や、モバイル環境でのより高品質な視聴体験に直結する、極めて重要な進化である。
2020年に開発が始まったAV2は、約5年の歳月を経て、2025年末の正式リリースを予定している。
驚異的な圧縮性能:AV1を30%以上凌駕
今回公開されたデータの中で最も注目すべきは、その圧縮性能だ。Norkin氏が示したAVM(AOMedia Video Model)リファレンスソフトウェアの最新版(v11.0.0)による測定結果は、業界に大きなインパクトを与えた。
- PSNR-YUV (客観的画質評価): 28.6%のビットレート削減
- VMAF (Netflix開発の主観的画質評価): 32.6%のビットレート削減
これらの数値は、ストリーミングで最も一般的に利用される「ランダムアクセス(RA)」構成での結果であり、AV1を基準とした場合のビットレート削減率を示している。つまり、AV1と同じVMAFスコア(体感画質)の動画を、AV2では約3分の2のデータ量で配信できる計算になる。
さらに、Meta社のRyan Lei氏による別の発表では、より詳細なテスト結果が示された。Google社内で実施されたUHDコンテンツの主観評価テストでは、平均で38%、一部のクリップでは最大50%ものビットレート削減を達成したという。
これは4K、8Kといった高解像度化が進む中で、この30%という数字は、ユーザー体験を損なうことなく配信コストを劇的に下げる可能性を秘めたものだ。あるいは、データ通信量が限られるモバイル環境において、これまで以上に高画質な映像を安定して届けるための強力な武器となるだろう。
なぜ圧縮効率は向上したのか? AV2の技術アーキテクチャ
では、AV2はどのようにしてこの性能向上を実現したのだろうか。Norkin氏の解説によれば、その根幹は「ハイブリッドブロックベースモデル」と呼ばれる、過去35年以上にわたってビデオコーデックの基本となってきたアーキテクチャにある。しかし、その内部の各ツールは大幅に洗練・拡張されている。
1. より賢くなった「画面分割(パーティショニング)」
ビデオ圧縮の基本は、画像を小さなブロックに分割し、それぞれのブロックに最適な圧縮方法を適用することだ。AV2では、この分割方法が大きく進化した。
- ブロックサイズの拡大: AV1の最大128×128ピクセルから、最大256×256ピクセルへとスーパーブロックのサイズが拡大された。これにより、4Kや8K映像の平坦な領域をより効率的に処理できる。
- 柔軟な分割構造(ERP & SDP): 従来の四分木分割に加え、より多様な形状での分割が可能になった。また、輝度(Luma)と色差(Chroma)で異なる分割構造を持つことを許容する「Semi-Decoupled Partitioning (SDP)」が導入され、コンテンツの特性に応じて最適な分割を適用できるようになった。
2. 予測精度の向上(Inter/Intra Prediction)
圧縮効率は「予測」の精度で決まる。AV2は、フレーム内(Intra)とフレーム間(Inter)の両方で、予測技術を大幅に強化した。
- Intra予測の強化: 1つのブロックを予測する際に参照できる隣接ピクセルの範囲を広げる「Multiple Reference Line Selection (MRLS)」や、過去の予測モード情報を基に最適なモードを効率的に選択する「Adaptive Intra Mode Coding (AIMC)」などが導入された。
- Inter予測の新ツール「TIP」: 特に強力なのが「Temporal Interpolated Prediction (TIP)」だ。これは、前後の参照フレームから動き情報を利用して仮想的な中間フレームを生成し、それを予測に利用する技術である。これにより、特に動きの滑らかな映像で高い予測精度を発揮する。
3. 適応的なツール選択と高度なフィルタリング
AV2は、単にツールを追加しただけでなく、それらをコンテンツに応じて適応的に使い分ける仕組みを強化している。
- ワープロック予測の進化: カメラのズームや回転といった複雑な動きに対応するワープロック予測が改善され、より大きな動きも高精度にモデル化できるようになった。
- 5段階のループ内フィルター: 圧縮によって生じるブロックノイズやリンギングといった画質劣化を低減するため、5種類もの高度なループ内フィルター(Deblocking, CDEF, CCSO, GDF, Loop-Restoration)がパイプライン化されている。これらが連携し、再構成された画像の品質を最大限に高める。
- 量子化技術の刷新: 圧縮率を決定する量子化プロセスも刷新された。AV1で採用されていたカスタムLUT(ルックアップテーブル)ベースの設計から、より統一された指数関数的な数式ベースの設計に変更。これにより、特に低ビットレート域での制御性が向上し、競合コーデックであるVVCと同等の広い品質レンジをカバーできるようになった。
今後の展望と残された課題
AOMediaは、AV2の最終リリースを2025年末と定めている。ローレベルのコーディングツールはほぼ確定し、現在はコンテナフォーマットやヘッダー情報などを定義する「ハイレベルシンタックス(HLS)」の設計と、仕様書の策定に焦点が移っている。
しかし、輝かしい性能データの一方で、その普及にはいくつかのハードルが存在する。
1. エンコーダーとデコーダーの複雑性
最も大きな課題は、処理の複雑さだ。AV1も登場当初、そのエンコード時間の長さが普及の足かせとなった。AV2はさらに多くの高度なツールを搭載しており、現状のリファレンスソフトウェアは実用的とは言えない速度だろう。今後、エンコーダーの高速化と最適化が急務となる。
また、デコード(再生)に関しても、ソフトウェア再生の負荷は大きな懸念材料だ。Norkin氏のプレゼンではハードウェア実装の容易性に繰り返し言及されており、これは事実上、スマートフォンやテレビでの快適な再生には専用のハードウェアデコーダーが不可欠であることを示唆している。
2. ハードウェア普及のタイムライン
仮に2025年末に仕様が確定したとして、AV2デコーダーを搭載したSoC(System-on-a-Chip)が設計・製造され、実際にスマートフォンやテレビ、PCに搭載されるまでには、最低でも2〜3年のタイムラグが生じる。つまり、AV2がリビングルームの主役になるのは、早くとも2028年以降と見るのが現実的だろう。
3. 市場での立ち位置とIPリスク
競合となるVVC(Versatile Video Coding)はすでに市場に存在し、ブラジルでのテレビ放送規格に採用されるなど、一定の足場を築き始めている。AV2の圧縮性能がVVCを劇的に上回るものでない限り、先行するHEVCやAV1からの移行を促す決定的な要因にはなりにくい。
また、AOMediaはロイヤリティフリーを掲げているが、Norkin氏が「35年来の技術」と表現したハイブリッドブロックベースモデル自体が、数多くの特許で保護されてきた領域である。AV2が完全に特許問題をクリアできるかについては、依然として不透明な部分が残る。
着実な進化の先に見える未来
AV2は、AV1から約30%という着実かつ大きな性能向上を遂げた、正統進化のコーデックである。特に、ストリーミングで重要となるランダムアクセス構成や、主観画質での高い評価は、そのポテンシャルの高さを物語っている。
今後の普及は、二段階で進むと筆者は見る。まず、YouTubeやMetaといったUGCプラットフォームが、ソフトウェアデコードを前提に、膨大なトラフィックを削減する目的でいち早く採用を進めるだろう。これはAV1が辿った道筋と同じだ。
一方、Netflixのようなプレミアムコンテンツ配信や、低消費電力が求められるモバイルデバイスでの本格普及は、ハードウェアデコーダーの登場を待つことになる。その間、AV1はHDR10+対応を果たすなど成熟度を高めており、HEVCとAV1が共存する時代がもうしばらく続くと考えられる。
AV2の登場は、ビデオ圧縮技術がまだ進化の途上にあることを力強く示している。しかし、その進化がユーザーに広く届くまでには、エンコーダーの高速化、ハードウェアの普及、そして複雑な市場力学といった、いくつものハードルを越えなければならない。2025年末の正式リリースに向け、その動向には注目だ。
Sources
- Streaming Learning Center: Inside AV2: Architecture, Performance, and Adoption Outlook