低解像度のビデオから驚く程クッキリとした動画を出力する「VideoGigaGAN」をAdobeが発表

Y Kobayashi 2024年4月25日

約 5 分 3 閲覧

この記事のポイント

Adobeが新VSR技術「VideoGigaGAN」開発
ぼやけず、くっきり高解像度動画を生成
既存技術の課題克服、8倍解像度向上も

低解像度のビデオから驚く程クッキリとした動画を出力する「VideoGigaGAN」をAdobeが発表

Adobeとメリーランド大学の研究者らは、NVIDIAのRTX VSR (RTX Video Super Resolution）のように、低解像度の動画から高解像度の動画を生成するビデオ超解像（Video Super Resolution: VSR）テクノロジーの新しいモデルである「VideoGigaGAN」を開発した。この新たな超解像テクノロジーは、従来の同等の技術がどこかぼやけた動画を出力するのに対し、くっきり、ハッキリとした高解像度の動画を出力してくれるという。

Adobeの以前の成果「GigaGAN」を動画に拡張

これまでのアップスケーリングテクノロジーが回帰ベースのネットワークを使用することが多かった事から、ぼやけた感じになっていたことが問題だった点に対し、VideoGigaGANは画像のアップスケーリングが得意なGigaGANをベースにすることでこの問題に対処しようとした。

しかしGenerative Adversarial Networks（GAN、敵対的生成ネットワーク）は静止画を高解像度にアップスケーリングするのには効果的だがビデオ超解像に使用すると、フレーム間のちらつきやエイリアシングなどの問題があることが分かった。これを解決するため、研究者らはGigaGANに新しいパーツを追加し、フレームをより一貫性のある高品質なものにした。

投稿者: @luokai

Threadsで見る

テストによると、VideoGigaGANは、従来の手法よりも画像の一貫性とディテールのバランスが良く、これまでの同等技術よりもはるかに多くのディテールを再現したビデオを生成してくれる。VideoGigaGANは、シーンによりマッチしたディテールを追加することで、ビデオの解像度を8倍向上させることができるという。

投稿者: @luokai

Threadsで見る

ただし欠点もある。このモデルは、フレーム間に広がるエラーや、低解像度の入力ではそもそも失われてしまうテキストのような小さなもののために、長いビデオは今のところ使えないなどの制限がある。

VideoGigaGANプロジェクトのWebサイトでは、多くのデモや他の手法との比較を見ることができる。これはあくまで研究用のプレビューであり、Adobeがこのモデルをいつ自社の製品に取り入れるかは、この論文からはわからない。しかし、Adobeは最近、同社のビデオ・スイートに生成AIを追加すると発表したので、近い将来実現されるかも知れない。

論文

arXiv: VideoGigaGAN: Towards Detail-rich Video Super-Resolution

参考文献

GItHub: VideoGigaGAN: Towards Detail-rich Video Super-Resolution

研究の要旨

ビデオ超解像（VSR）アプローチは、アップサンプリングされたビデオにおいて印象的な時間的一貫性を示してきた。しかし、これらのアプローチは生成能力に限界があるため、画像よりもぼやけた結果を生成する傾向がある。このことは、時間的一貫性を保ちながら、生成的画像アップサンプラーの成功をVSRタスクに拡張できるかという基本的な問題を提起する。我々はVideoGigaGANを紹介する。VideoGigaGANは新しい生成的VSRモデルであり、高周波のディテールと時間的一貫性を持つビデオを生成することができる。VideoGigaGANは、大規模な画像アップサンプラーであるGigaGANをベースにしている。GigaGANに時間的モジュールを追加してビデオモデルに膨らませただけでは、深刻な時間的ちらつきが発生する。我々はいくつかの重要な問題を特定し、アップサンプリングされたビデオの時間的一貫性を大幅に改善する技術を提案する。我々の実験によれば、これまでのVSR手法とは異なり、VideoGigaGANは、よりきめ細かな外観の詳細を持つ、時間的に一貫性のある動画を生成する。VideoGigaGANの有効性を、公開データセット上で最新のVSRモデルと比較することで検証し、8倍超解像の動画結果を紹介する。

テーマ

Generative AI

この記事はいかがでしたか？

一緒に読みたい・使いたいアイテム

※本リンクから購入いただくと、当サイトの運営・記事制作費に充てられます（Amazonアソシエイト参加）

↑ トップへ戻る

低解像度のビデオから驚く程クッキリとした動画を出力する「VideoGigaGAN」をAdobeが発表

Adobeの以前の成果「GigaGAN」を動画に拡張

関連する事物

テーマ

この記事はいかがでしたか？

全固体電池の実用化を阻む「デンドライト」の真犯人が判明：寿命と充電速度を3倍にするMITの新発見

量産開始まで1年半、2.9兆円の政府支援とRapidusの歩留まりの綱渡り

ClaudeのAPI費用が激減。システムプロンプトを「画像」として読ませる新ツールの仕組み

村田の受注残高比率が2018年最悪期を超えた理由、AIサーバーが変えたMLCC争奪戦

Claude Fable 5が2003年のゲームをiOSへネイティブ移植、初ビルドまで40分

世界生産シェアわずか1.6%の中国によるヘリウム輸出禁止はなぜ世界の半導体市場に大きな影響を与えるのか

厚さ14μmのチップ10層超積層に成功、HBM4量産の目安30μmとの距離

リチウム依存からの脱却なるか。次世代ナトリウム金属電池を実用レベルに引き上げる新発見

効率30%超えの世界新記録。EPFLが開発した「3接合」ペロブスカイト太陽電池の全貌

急速充電で劣化するのはスマホではなくEVだった：8年換算で12ポイントもの大きな開きが

Adobeの以前の成果「GigaGAN」を動画に拡張

関連する事物

テーマ

この記事はいかがでしたか？

関連記事

Amazon、開発者と企業向けの新たなAIアシスタント「Amazon Q」を発表

Intel、11億5000万個のニューロンを搭載した世界最大のニューロモーフィックシステム「Hala Point」を発表

NVIDIAに独占禁止法違反の疑い &#8211; フランス規制当局が近く告発か

NVIDIAに独占禁止法違反の疑い – フランス規制当局が近く告発か