米国のロボティクス企業Figure AIは、強化学習(RL)を用いて開発した新たな制御システムにより、同社のヒューマノイドロボット「Figure 02」が人間のような自然な歩行を獲得したと発表した。この技術は、シミュレーション環境で学習した能力を、追加調整なしで実世界のロボットへ適用可能にするものであり、ロボットの実用化と大規模展開に向けた重要な一歩となる。
ロボット歩行の進化:強化学習によるブレークスルー
ヒューマノイドロボット開発における長年の課題の一つに、自然で効率的な歩行の実現があった。従来のロボットは、しばしば硬く、機械的な、ぎこちない動きになりがちであった。これは、人間にとっては無意識に行える複雑な動作制御を、ロボットで再現することの難しさを示す「モラベックのパラドックス」の一例である。
Figure AIは、この課題に対し、強化学習(Reinforcement Learning, RL)という人工知能(AI)のアプローチを採用した。RLは、AIが試行錯誤を通じて、特定の目標(この場合は人間らしい歩行)を達成するために最適な行動を学習する手法である。同社は、このRLを用いて、ロボットの動きを制御するためのエンドツーエンドのニューラルネットワーク(入力から出力まで単一のネットワークで処理するAIモデル)を開発した。
その結果、Figure 02は、踵から着地し(ヒールストライク)、つま先で地面を蹴り出す(トーオフ)、そして脚の動きと同期した腕の振りといった、人間特有の歩行動作を獲得した。公開されたビデオでは、Figure 02が以前よりも明らかに流暢で自然な足取りで歩行する様子が示されている。
シミュレーションと現実世界の架け橋:「ゼロショット」転送の実現
この自然な歩行能力は、Figure AIが構築した高度な学習プロセスによって生み出された。
- 大規模シミュレーション: GPUで高速化された高忠実度の物理シミュレーター内で、数千体の仮想Figure 02ロボットが並行して動作する。これにより、現実世界での数年分に相当する学習データをわずか数時間で収集することが可能となった。
- 多様な環境と経験: シミュレーション内では、各仮想ロボットに異なる物理的パラメータ(例えば、関節の硬さやモーターの特性など)が設定される(ドメインランダム化)。さらに、様々な地形での歩行、アクチュエータ(駆動装置)の動特性の変化、つまずき、滑り、外部からの突き飛ばしといった予期せぬ事態への対応など、多様なシナリオが与えられた。
- 報酬設計: ニューラルネットワークは、人間らしい歩行の参照軌道を模倣すること、指定された速度で安定して歩くこと、エネルギー消費を抑えること、そして外乱に対するロバスト性(安定性)を高めることなどを「報酬」として与えられ、これらの目標を達成するように学習を進めた。
- Sim-to-Real転送: シミュレーションで学習された制御ポリシー(方策)を、実世界のロボットにそのまま適用する際には、「シミュレーションと現実のギャップ(Sim-to-Real Gap)」が問題となる。Figure AIは、前述のドメインランダム化に加え、実機ロボット側でkHz(キロヘルツ)レートの高周波トルクフィードバック制御(モーターが出力する力を高速に検知し、精密に制御する技術)を組み合わせることで、このギャップを埋めることに成功した。これにより、シミュレーションで学習したポリシーを、実世界のFigure 02ロボットに追加の微調整なしで直接適用(ゼロショット転送)することが可能となった。
この「ゼロショット転送」の成功は、開発サイクルの大幅な短縮と、個々のロボットごとの調整作業の削減に繋がり、技術のスケーラビリティを大きく向上させるものである。
実用化への加速とヒューマノイドロボット市場
Figure AIは、この新しい歩行制御システムが、同社のロボット群全体に効果的に展開できることを実証している。公開されたビデオでは、10台のFigure 02ロボットが、全く同じニューラルネットワークポリシーで、調整なしに同様の自然な歩行を行っている様子が確認できる。同社はブログ投稿で「このプロセスが近い将来、数千台のFigureロボットにスケールできるという希望を与えてくれる」と述べている。

この技術的進展は、ヒューマノイドロボットの実用化に向けた動きを加速させるものと期待される。Figure AIはすでに、2024年にBMWの米国サウスカロライナ州の工場でFigure 02のテストを開始しており、今後さらに導入を進める計画である。
ヒューマノイドロボット分野では競争が激化しており、TeslaのOptimus、Agility RoboticsのDigit(Amazonの倉庫で試験中とも報じられている)、ApptronikのApollo(Mercedes-Benz工場への導入計画)、さらにUBTech RoboticsやUnitree Roboticsといった中国企業などが開発を進めている。
Figure AIは、今回の歩行技術の改善に加え、最近ではHelixと呼ばれるVision-Language-Action (VLA)モデルも発表している。これは、視覚情報と言語指示を理解し、複雑なタスクを実行できるAIであり、ロボットの汎用性をさらに高めることが期待される。同社は、「これらの初期の結果は刺激的ですが、我々の技術の可能性のほんの一部を示唆するものに過ぎないと考えています」と述べ、今後さらに多様な実世界シナリオに対応できるよう、学習済みポリシーを発展させていく方針を示している。
Source