テクノロジーと科学の最新の話題を毎日配信中!!

10年分の学習を1時間で:新物理エンジン『Genesis』が実現する次世代ロボット開発

Y Kobayashi

2024年12月20日

カーネギーメロン大学を中心とする20以上の研究機関による共同プロジェクトチームは、革新的なAI物理シミュレーションエンジン「Genesis」を発表した。現実世界の43万倍の速度でロボットの学習を可能にする本システムは、ロボット開発の新時代の幕開けを告げるものだ。

圧倒的な処理速度とPython採用で実現する技術革新

Genesisの技術革新は、従来のシミュレーターを大きく上回る処理性能とアクセシビリティの両立にある。研究チームのリーダーであるZhou Xian氏が率いるプロジェクトは、NVIDIAのIsaac GymやMujoco MJXといった既存のGPUベースのシミュレーターと比較して、最大80倍の高速化を実現している。この驚異的な性能は、一般的なグラフィックボードを利用した並列計算の最適化によって達成された。

https://twitter.com/_philschmid/status/1869639246434246966

具体的な性能を示す代表的な例として、Franka社のロボットアームを使用した操作シミュレーションでは、毎秒4,300万フレームという処理速度を記録。これは現実世界の時間の約43万倍に相当し、1時間のコンピューティング時間で10年分の訓練データを生成できることを意味する。システムは最大10万件のシミュレーションを同時実行可能で、この並列処理能力がニューラルネットワークによるロボット制御の学習を大幅に加速する。

さらに注目すべき技術的特徴として、コアとなる物理演算エンジンを含めたシステム全体をPythonで実装している点が挙げられる。従来のシミュレーターでは、高速な演算処理を実現するためにC++やCUDAによる低レベルな実装が一般的だったが、Genesisはこの常識を覆した。純粋なPythonによる実装は、開発効率と保守性を高めるだけでなく、研究者やエンジニアの参入障壁を大きく下げることに成功している。

また、Genesisは静的なオブジェクトに対する自動休止機能(auto-hibernation)を実装しており、計算リソースの効率的な活用を実現している。この最適化技術により、複雑な物理シミュレーションにおいても安定したパフォーマンスを維持することが可能となった。Jim Fan氏が指摘するように、この高速なシミュレーション能力は、実世界における多様な状況に対応できるロボットの開発を加速させる重要な要素となっている。

これらの技術革新により、従来は高価な専用ハードウェアと複雑なプログラミングスキルを必要としていたロボットの訓練シミュレーションが、一般的なコンピューター環境でシンプルなPythonコマンドを用いて実行可能となった。この民主化は、ロボット工学研究の裾野を大きく広げる可能性を秘めている。

自然言語による4次元世界の生成機能

Genesisの革新的なもう一つの機能が、テキストプロンプトによる4次元動的世界の生成システムだ。研究チームはこの機能について、時間軸を含めた3次元空間のシミュレーションという意味で「4D」という表現を採用している。このシステムの中核となっているのは、視覚言語モデル(Vision Language Models:VLMs)を活用した生成AI技術だ。

システムは自然言語による指示を解釈し、Genesisの独自のシミュレーションインフラストラクチャAPIを用いて、完全な仮想環境を構築する。生成された環境には現実的な物理法則が適用され、カメラの動き、オブジェクトの挙動などが包括的にシミュレートされる。さらに、システムは物理的に正確なレイトレーシング処理によって映像を生成し、これをロボットの訓練データとして活用することが可能だ。

具体的な応用例として、システムはキャラクターの動作生成、インタラクティブな3Dシーンの構築、表情アニメーションの生成などを実現している。研究チームのJim Fan氏は、従来のシミュレーター開発における大きな課題であった3Dアセット、テクスチャー、シーンレイアウトなどの手作業による制作が、このシステムによって自動化されたことを強調している。

特筆すべきは、この生成システムが単なる見た目の再現に留まらない点である。生成された世界は統計的なピクセルの操作による表面的な映像合成ではなく、物理法則に基づいたデータ構造として構築される。これにより、生成された環境でのロボットの訓練結果は、実世界により近い形で適用することが可能となる。

現時点では、この生成機能は公開されているGitHubのコードには含まれていないものの、研究チームは将来的なリリースを予定している。この機能の実装により、ロボット工学の研究者たちは、複雑な実験環境を直感的な言語指示だけで構築できるようになる。さらに、この技術はゲーム開発やデジタルコンテンツ制作など、より広範な応用可能性を秘めている。このように、Genesisの4次元世界生成機能は、物理シミュレーションの新しいパラダイムを切り開く可能性を示している。


Sources

Follow Me !

\ この記事が気に入ったら是非フォローを! /

フォローする

コメントする