Google DeepMindの最新AIは幾何学問題をオリンピック金メダル選手並みの能力で解決できる

Google DeepMindは、人間の国際数学オリンピック金メダリストに迫るレベルで複雑な幾何学問題を解くAIシステム、「AlphaGeometry」を発表した。このAlphaGeometryのコードとモデルはオープンソースでも提供されている。今回の発表は同時に、合成的に生成されたAI学習データの可能性も示す物である。

Google AI研究科学者のTrieu Trinh氏とThang Luong氏は、「オリンピックレベルの幾何学問題を解くことは、より高度で一般的なAIシステムに向けて深い数学的推論を開発する上で重要なマイルストーンです。我々は、AlphaGeometryが数学、科学、AIに新たな可能性を開く一助となることを願っています」と、述べている。

水曜日にNature誌に発表された研究によると、Google DeepmindのAlphaGeometryは、高校生を対象とした国際数学オリンピック（IMO）において、30問中25問を正解した。

これに対し、これまでトップレベルだったWuのメソッドと呼ばれるシステムが解いた幾何学の問題は10問で、人間の金メダリストが解いた問題の平均は25.9問だった。

Google DeepMindによれば、この成績は人間参加者の金メダル基準に非常に近いものであり、数学分野におけるAIの能力の高まりを示すものだという。

なぜ幾何学に注目するのか？Google DeepMindは、数学の定理を証明したり、定理（ピタゴラスの定理など）がなぜ正しいかを論理的に説明したりするには、推論と、解答に向かう可能なステップの範囲から選択する能力の両方が必要だと主張している。複雑な数学の推論と学習の課題は、人間と同等かそれ以上の人工知能（AGI）への道において、重要なテストとなる。

このプロジェクトに参加しているGoogle DeepMindの研究者、Quoc V Le氏は、この新しいシステムは「AGI構築に向けた重要な一歩」であるとFinancial Times紙に語っている。

「これは、AIがいかに科学の進歩に役立つか、そして世界がどのように機能するかを決定する根本的なプロセスをよりよく理解するのに役立つかを補強するもう一つの例です」。

AlphaGeometry の仕組み

AlphaGeometryの設計において、研究室は「神経言語」モデル（アーキテクチャ的にはChatGPTに沿ったモデル）と「記号的演繹エンジン」（ルール（例えば数学的ルール）を活用して問題の解を推論するエンジン）を組み合わせた。記号的エンジンは、特に大規模または複雑なデータセットを扱う場合、柔軟性に欠け、時間がかかることがある。しかしディープマインドは、与えられた幾何学的問題に対する可能な答えをニューラル・モデルが演繹エンジンに「ガイド」することで、これらの問題を軽減した。

Google DeepMindは、このアプローチを心理学者Daniel Kahnemanの「高速思考、低速思考」という言葉になぞらえている。

トレーニングデータの代わりに、Google DeepMindは独自の合成データを作成し、さまざまな複雑さの「合成定理」と証明を1億個生成した。そして、この合成データを使ってAlphaGeometryをゼロからトレーニングし、オリンピックの幾何学問題で評価した。

AIの研究者の中には、AIの未来はこのようなハイブリッド・システムにあると考えている者もいる。大規模な言語モデルのような、純粋に相関関係に基づくAIシステムは、論理的なスキルや信頼性に欠けるため、複雑な幾何学的・数学的問題やその他多くのタスクに苦戦することが多い。

AlphaGeometryは、図形と線からランダムな幾何学図を生成することで学習データを作成する。その後、システムはこれらの図内のすべての接続、関係、証明を識別し、再構築する。このプロセスにより、AlphaGeometryは人間の実演や指導に頼ることなく、幾何学を学習し理解することができる。

Google DeepMindはこの技術を “記号的演繹とトレースバック”と呼んでいる。数学の学習データが少なすぎるという問題を回避することができる。

完成したデータセットは、幾何学的なオブジェクトのランダムでユニークな10億の図からなり、各図の点と線の間のすべての関係が “網羅的に導出 “されている。

人間は依然として優れた論理的思考者である

AlphaGeometryはその素晴らしい性能にもかかわらず、1979年のオリンピックでベトナムの数学者Lê Bá Khánh Trìnhが解いた円の交差パズルのように、解けない問題に遭遇した。

AlphaGeometryはオリンピック問題の3分の1しか解くことができないが、Google DeepMindによれば、2000年と2015年のオリンピックで銅メダルの閾値を超えた世界初のAIモデルである。

研究者たちは、AlphaGeometryをはじめとする合成データ生成とトレーニングのアプローチが、数学、科学、AIの新たな可能性を切り開くことを期待している。

Google DeepMindのさらに大きな目標は、人間の頭脳では複雑すぎることが証明されている数学的問題を解決できるAIシステムを作ることである。

Google DeepMindは、国際数学オリンピックに正式に参加する予定はないが、その可能性を排除しているわけではない。Google DeepMindはコードとモデルをオープンソースとしてGithubで公開している。

論文

Nature: Solving olympiad geometry without human demonstrations

参考文献

Google DeepMind: AlphaGeometry: An Olympiad-level AI system for geometry
GitHub: google-deepmind/alphageometry
Financial Times: DeepMind approaches gold standard in complex maths in latest AI breakthrough

研究の要旨

オリンピアードレベルでの数学定理の証明は、人間レベルの自動推論において注目すべきマイルストーンである。しかし、現在の機械学習アプローチは、人間の証明を機械が検証可能な形式に変換するコストが高いため、ほとんどの数学領域には適用できない。幾何学の場合、その独特な翻訳上の課題1,5があるため、問題はさらに深刻であり、その結果、学習データが著しく不足している。我々はAlphaGeometryを提案する。AlphaGeometryはユークリッド平面幾何学の定理証明器であり、様々な複雑さのレベルにわたる何百万もの定理と証明を合成することで、人間による証明の必要性を回避する。AlphaGeometryは、大規模な合成データを用いてゼロから訓練された神経言語モデルを用いて、困難な問題における無限の分岐点を通して記号的演繹エンジンを導く神経記号システムである。最新のオリンピアードレベルの問題30問からなるテストセットにおいて、AlphaGeometryは25問を解き、10問しか解けなかった従来の最良の手法を上回り、国際数学オリンピック（IMO）の平均的な金メダリストのパフォーマンスに近づいた。特筆すべきは、AlphaGeometryは人間が読める証明を作成し、人間の専門家の評価下でIMO2000と2015のすべての幾何学問題を解き、2004年には翻訳されたIMOの定理の一般化されたバージョンを発見したことである。