Nianticが、Pokemon GOやIngressなどの人気位置情報ゲームから収集したユーザーデータを活用し、現実世界をナビゲートする大規模AIモデルの開発計画を発表した。同社が「Large Geospatial Model(LGM)」と名付けたこの野心的なプロジェクトは、現実世界の空間をAIが理解し、相互作用することを目指している。
Large Geospatial Modelが切り拓く空間理解の未来
Large Geospatial Model(LGM)は、大規模言語モデル(LLM)が自然言語を理解・生成するように、物理的な空間を理解・解釈するために設計された革新的なAIモデルである。このモデルの特徴は、単なる3D空間の把握を超えて、場所の文脈や構造的特徴を理解し、未知の視点からでも空間を推論できる点にある。
LGMの技術的革新性は、その学習アプローチにある。従来の3Dビジョンモデルが任意の3Dアセットを生成するのに対し、LGMは地理的な位置に紐付けられた3次元エンティティを扱う。これにより、メートル法に基づく正確なスケール推定が可能となり、実質的に次世代の地図システムとして機能する。さらに重要なのは、LGMが個々の場面を独立して理解するだけでなく、世界中の数百万の場所との地理的な関連性も理解できる点である。
このモデルは、地理空間インテリジェンスという新しい概念を実現する。過去の観察から学習し、新しい場所に知識を転移できる能力を持つ。例えば、ある建造物の一部しか観察できない場合でも、世界中の類似構造物から学習した知識を活用して、見えない部分の構造を推測することができる。これは人間の空間認知能力に近い特性である。
前例のないデータ収集規模で実現する空間理解
Nianticの取り組みの特筆すべき点は、そのデータ収集の規模と特異性にある。同社は世界中で1000万カ所以上のスキャンデータを保有しており、そのうち100万カ所以上がすでにVPS(Visual Positioning System)サービスで活用可能な状態にある。さらに注目すべきは、毎週約100万件の新規スキャンデータが追加され続けており、各スキャンには数百枚の個別画像が含まれている点である。
このデータセットの独自性は、収集方法にある。Google Street Viewやほかのマッピングサービスとは異なり、Nianticのデータは歩行者視点で収集されている。これにより、自動車では到達できない歩道や路地、公園内の小道など、より詳細な空間データの収集が実現している。
このビッグデータを基盤として、Nianticはすでに5000万以上のニューラルネットワークを訓練することに成功している。各ニューラルネットワークは特定の場所や視点を表現しており、総計で1500兆以上のパラメータを持つ。同社の研究論文「ACE」(2023年)と「ACE Zero」(2024年)で発表された技術により、古典的な3Dデータ構造ではなく、ニューラルネットワークのパラメータに場所の特徴を暗黙的に符号化している。
実用化と未来への展望
この技術の実用性は、すでにPokemon GOの新機能「Pokemon Playgrounds」として実証されている。ユーザーが特定の場所にポケモンを配置し、他のプレイヤーがそれを見つけて交流できるこの機能は、センチメートル単位の精度でデジタルコンテンツを配置・共有できる次世代AR体験の基盤となっている。
さらに、同社の最新研究「MicKey」(2024年)では、大幅な視点変化があっても2つのカメラ視点の相対的な位置関係を特定できるニューラルネットワークを実現している。これはLGMの潜在的な可能性を示す重要な成果である。
応用可能性の観点では、LGMは空間計画、設計、物流、観客エンゲージメント、遠隔コラボレーションなど、幅広い分野での活用が期待されている。特にARグラスなどのウェアラブルデバイスが一般化する将来において、物理世界とデジタル世界を橋渡しする空間コンピューティングの基盤として機能することが想定されている。
Meta Description
NianticがポケモンGOユーザーのスキャンデータを活用し、現実世界をAIがナビゲートする大規模空間モデル(LGM)の開発を発表。毎週100万件の新規データを収集し、5000万以上のニューラルネットワークを構築。AR技術の新時代を予感させる革新的な取り組み。
Source
コメント