最近、OpenAIがSam Altman氏を解雇し、すぐに再雇用したことで、人工知能(AI)の開発と利用をめぐる議論が再び脚光を浴びている。さらに異例なのは、メディア報道で目立つテーマが、AIシステムの数学能力であることだ。
どうやらOpenAIのドラマの一部は、同社が開発した新しいAIアルゴリズム「Q*」に関連しているようだ。このシステムは重要な進歩として話題になっており、その顕著な特徴のひとつは数学的に推論する能力だった。
しかし、数学はAIの基礎ではないだろうか?コンピュータや電卓が数学的なタスクをこなせるのに、どうしてAIシステムが数学的な推論を苦手とするのだろうか?
AIは単一の存在ではない。人間からの直接の指示なしに計算を実行するための戦略のパッチワークなのだ。後述するように、AIシステムの中には数学が得意なものもある。
しかし、現在最も重要な技術のひとつである、ChatGPTのようなAIチャットボットの背後にある大規模言語モデル(LLM)は、これまで数学的推論をエミュレートするのに苦労してきた。これは、LLMが言語に集中するように設計されているためだ。
もし同社の新しいQ*アルゴリズムが未知の数学的問題を解くことができれば、それは重要なブレークスルーとなるかもしれない。
本稿執筆時点では、Qアルゴリズムとその能力の詳細は限られているが、非常に興味をそそられる。そのため、Qが成功したとみなす前に考慮すべきさまざまな微妙な点がある。
例えば、数学は誰もが程度の差こそあれ取り組む科目であり、Q*がどの程度の数学の能力を有しているかはまだ不明である。しかし、研究レベルの数学を発展させるために別の形のAIを使用した学術的研究は発表されている(私自身が書いたものや、Google DeepMindの研究者と共同で数学者のチームが書いたものなど)。
これらのAIシステムは、数学に長けていると言えるだろう。しかし、Q*は学者の仕事を助けるために使われているのではなく、別の目的で使われている可能性が高い。
とはいえ、たとえQ*が最先端研究の限界を押し広げることができなかったとしても、その構築方法には何らかの意義が見出される可能性が高く、将来的な発展の可能性を示唆している。
ますます快適に
社会として、私たちはますます、あらかじめ決められた種類の問題を解決するために専門的なAIが使われることに馴染んできている。例えば、デジタルアシスタント、顔認識、オンライン推薦システムなどは、多くの人にとって馴染み深いものだろう。しかし、人間に匹敵する広範な推論能力を持つ、いわゆる「汎用人工知能」(AGI)については、いまだ解明されていない。
数学は、私たちがすべての小学生に教えたいと熱望している基本的なスキルであり、AGIの探求における基本的なマイルストーンとなることは間違いないだろう。では、数学的に有能なAIシステムは、他にどのように社会の役に立つのだろうか?
数学的思考は、例えばコーディングやエンジニアリングなど、多くのアプリケーションに関連しているため、数学的推論は人間にとっても人工知能にとっても不可欠なスキルである。皮肉なことに、AIは基本的なレベルで数学に基づいている。
例えば、AIアルゴリズムが実装するテクニックの多くは、最終的には行列代数として知られる数学分野に集約される。行列とは、単純に数字のグリッドであり、デジタル画像はその身近な例である。各ピクセルは数値データに他ならない。
大規模言語モデルも本質的に数学的である。膨大なテキストのサンプルに基づいて、マシンは、ユーザーからチャットボットへのプロンプト(または質問)に続く可能性が最も高い単語の確率を学習することができる。事前に訓練されたLLMを特定のトピックに特化させたい場合は、数学文献やその他の学習領域で微調整することができる。LLMは、あたかも数学を理解しているかのようなテキストを生成することができる。
しかし残念なことに、そうすることでハッタリは得意だが細かいことは苦手なLLMが出来上がる。問題は、数学的な文とは定義上、曖昧さのないブール値(つまり真か偽か)が割り当てられるものだということだ。数学的推論は、以前に確立されたものから新しい数学的記述を論理的に推論することである。
悪魔の代弁者
当然ながら、言語的確率に依存する数学的推論へのアプローチは、その車線を逸脱することになる。これを回避する1つの方法は、アーキテクチャに形式的検証のシステムを組み込むことである(まさにLLMがどのように構築されているか)。
Qという名前は、演繹的推論を助けるために1970年代に開発されたアルゴリズムを指しているのかもしれない。あるいは、QはQ-learningを指しているのかもしれない。Q-learningでは、正しい結論をテストして報酬を与えることで、モデルが時間とともに向上していく。
しかし、数学的に有能なAIを構築するには、いくつかの課題が存在する。例えば、最も興味深い数学の中には、非常に起こりそうもない出来事で構成されているものがある。小さな数に基づいてパターンが存在すると考えても、十分な数のケースをチェックすると、思いがけずそれが崩れてしまうような状況がたくさんある。この能力を機械に組み込むのは難しい。
数学的研究は非常に創造的である。なぜなら、研究者は新しい概念を発明しながらも、古くからある学問の形式的なルールの範囲内にとどまる必要があるからである。
既存の数学のパターンを見つけるためだけに訓練されたAIの方法論では、おそらく純粋に新しい数学を創造することはできないだろう。数学とテクノロジーの間のパイプラインを考えると、これは新しい技術革命の概念を排除しているように思える。
しかし、ちょっと悪魔の代弁者になって、AIが本当に新しい数学を創造できるかどうかを想像してみよう。これに対する先ほどの議論には欠陥がある。人間の優れた数学者もまた、既存の数学だけで訓練されてきたとも言えるからだ。大規模な言語モデルは以前にも私たちを驚かせたが、今回もそうなるだろう。
コメント