AIスタートアップのEtchedとDecartは、ゲーム開発の常識を覆す画期的な技術「Oasis」を発表した。完全なAI生成による世界初のリアルタイムゲームとなるOasisは、従来のゲームエンジンを一切使用せず、プレイヤーの入力に応じて物理演算やゲームルール、グラフィックスをリアルタイムで生成するという。
AIビデオ生成の限界を突破する圧倒的な処理速度
Oasis はキーボードとマウスの入力からフレームごとに動画を生成することで、「ゲームプレイ」を再現するものだ。
Etchedらが発表したOasisを使ったゲームでは、プレイヤーはMinecraftに似た環境で、移動したり、ジャンプしたり、アイテムを集めたり、ブロックを壊したりすることができる。 Decartによると、同社のシステムはプレイヤーの入力を即座に処理し、物理学、ルール、ビジュアルを含むゲームプレイ要素を作成するという。
これまでにもこうした技術の愛ではあったが、従来のAI動画生成技術は「処理速度」という問題を抱えていた。OpenAIが開発したSoraや、Runway Gen-3といった最先端のAIモデルでさえ、わずか1秒の映像生成に10〜20秒という長い処理時間を要していた。これはインタラクティブなコンテンツ生成において致命的な制約となっていた。
しかしOasisは、この技術的障壁を完全に突破した。1フレームあたり0.04秒という驚異的な処理速度を実現し、人間が違和感なくプレイできる毎秒20フレームのリアルタイム生成を可能にしたのである。この処理速度は、従来のAIモデルと比較して250倍以上の高速化を達成したことを意味する。
革新的なアーキテクチャが実現する高速処理の秘密
Oasisの卓越した性能を支えているのは、徹底的に最適化されたAIアーキテクチャだ。開発チームは数百に及ぶアーキテクチャ実験とデータ実験を重ね、最適な構成を追求した。その結果として採用されたのが、Diffusion Transformerをバックボーンとし、新開発の自己符号化器を組み込んだハイブリッドシステムである。
特筆すべきは、OpenAIのSoraが60秒単位でまとめて映像を生成するアプローチを取るのに対し、Oasisはフレームごとの生成方式を採用している点である。この方式により、キーボードやマウスの入力に対する即時的な応答が可能となり、従来のビデオゲームに匹敵する操作性を実現している。
画質劣化を防ぐ革新的な安定化技術
連続的な画像生成において最も困難な課題の一つが、フレーム間の一貫性の維持である。わずかな誤差が蓄積されることで、画質が徐々に劣化していく「エラー伝播」の問題は、多くのAIモデルを悩ませてきた。
Oasisの開発チームは、この課題に対して「ダイナミックノイズ」という革新的な解決策を編み出した。各フレームの生成過程で意図的にノイズを付加し、それを段階的に除去していく手法である。このプロセスをAIの学習段階から組み込むことで、モデルはノイズ処理に最適化された画像生成能力を獲得した。結果として、フレーム間の一貫性を保ちながら、鮮明な画像生成を維持することに成功している。
専用チップが拓く高解像度ゲーミングの未来
現行バージョンのOasisは、NVIDIA H100 GPU上で360p解像度での動作を実現している。遠距離のオブジェクトの描画精度やレンダリングの安定性など、いくつかの技術的課題は残るものの、Minecraftライクなバーチャルワールドにおいてすでにプレイ可能な品質を達成している。プレイヤーは自由な移動やジャンプ、ブロックの破壊、アイテムの収集といった基本的なゲームプレイを、違和感なく楽しむことができる。
さらなる性能向上を目指し、EtchedはSohuと呼ばれる専用AIチップの開発を進めている。このチップは、最大1000億のパラメータを持つAIモデルを4K解像度で処理可能とされており、実用化されれば現行の10倍以上のユーザーに同時サービスを提供できる。これは、AIゲームの商業展開における重要なブレークスルーとなる可能性を秘めている。
また、運用コストの面でも画期的な効率性を実現している。Decartの試算によると、Oasisの1時間あたりの運用コストは、一般的なSteamゲームの平均プレイ時間あたりのコストを大幅に下回るという。この経済性は、AIゲームの大規模展開を現実的なものとする重要な要素となる。
Xenospectrum’s Take
Oasisは、純粋なゲームとは異なり、インタラクティブビデオという方が正確かもしれない。
だが、ゲームとビデオの垣根を曖昧にするこのOasisは、ゲーム開発の歴史における重大な転換点となる可能性を秘めている。従来のゲーム開発では、Unity、Unreal Engineといったゲームエンジンを基盤としたコンテンツ構築が不可欠であった。しかしOasisは、AIモデル単体でゲームの全要素をリアルタイムで生成するという、まったく新しいパラダイムを提示している。
とりわけ注目すべきは、このシステムがもたらす開発プロセスの革新である。ゲームエンジンを介さない直接的なコンテンツ生成は、開発期間の短縮やコスト削減にとどまらず、クリエイターの表現手法そのものを変革する可能性を秘めている。従来のプログラミングやアセット制作に依存しない、より直感的な創造プロセスが実現する可能性がある。
大手ベンチャーキャピタルのSequoia Capitalによる出資も、この技術の市場潜在力を裏付けている。専用チップSohuの実用化により高解像度・高品質なゲーム体験が実現すれば、ゲーム業界全体のパラダイムシフトが加速する可能性も十分にある。
さらに、このテクノロジーの応用範囲はゲーム開発にとどまらない。教育コンテンツやシミュレーション、バーチャルプロダクション等、インタラクティブな映像生成を必要とするあらゆる分野への波及効果が期待される。Oasisは、AIとインタラクティブコンテンツの融合による新たな地平を切り開く、真の意味での革新的技術となる可能性を秘めているのである。
Sources
- GitHub Model: Oasis: A Universe in a Transformer
- Etched: Oasis: an interactive, explorable world model
コメント