OpenAIとMetaが開発した人工知能(AI)システムのアップグレードが間近に迫っており、AIが次のレベルへとステップアップする姿を間もなく見ることができるかもしれない。OpenAIのGPT-5はAIチャットボットChatGPTの新しい「エンジン」となり、MetaのアップグレードはLlama 3と名付けられる。特に、Llamaの現行バージョンは、Metaのソーシャルメディア・プラットフォームのチャットボットを強化している。
OpenAIとMetaの両社の幹部がメディアに語ったところによると、これらのアップグレードシステムには、前もって計画を立てる機能が組み込まれるようだ。しかし、この技術革新はAIチャットボットの能力を具体的にどのように変えるのだろうか?
例えば、あなたが自宅から職場まで車を運転していて、最適なルートを選択したいと想像してみよう。AIシステムなら、既存の2つのルートのうち、より良いルートを選ぶことは完璧にできるだろう。しかし、ゼロから最適なルートを生成するのは、はるかに難しい作業だ。
ルートは最終的に、さまざまな選択の連続から構成される。しかし、個々の意思決定を単独で行っても、全体として最適な解決策を導き出すことはできないだろう。
例えば、後で何らかの利益を得るために、最初に多少の犠牲を払わなければならないことがある。後で速く移動するために、高速道路に入るために遅い列に加わるなどだ。これは計画問題の本質であり、AIの古典的なテーマである。
ここには囲碁などのボード ゲームとの類似点がある。試合の結果は、全体的な一連の動きに左右され、いくつかの手は、後で利用できるチャンスを引き出すことを目的としている。
AI企業のGoogle DeepMindは、プランニングの革新的なアプローチに基づいて、AlphaGoと呼ばれるこのゲームをプレイする強力なAIを開発した。AlphaGoは、利用可能な選択肢のツリーを探索できるだけでなく、経験を積むことでその能力を向上させることができた。
もちろん、本当に重要なのは、運転やゲームに最適なルートを見つけることではない。ChatGPTやLlama 3のような製品を支えているのは、大規模言語モデル(LLM)と呼ばれる技術だ。ここで問題になっているのは、これらのAIシステムに行動の長期的な結果を考慮する能力を与えることだ。このスキルは数学的問題を解くためにも必要であり、LLMの他の能力を引き出す可能性がある。
大規模言語モデルは、与えられた一連の単語から次の単語を予測するように設計されている。しかし実際には、人間のユーザーからの質問に対する答えのような、長い一連の単語を予測するために使用される。
これは現在、答えに単語を1つ追加し、さらに別の単語を追加するというように、最初のシーケンスを拡張することで行われている。これは専門用語で「自己回帰的」予測として知られている。しかし、LLMは時として、抜け出すことが不可能な状況に陥ることがある。
期待される発展
LLMの設計者にとって重要な目標は、プランニングをディープ・ニューラル・ネットワークと組み合わせることである。ディープ・ニューラル・ネットワークは、もともと神経系から着想を得たものだ。ディープ・ニューラル・ネットワークは、大規模なデータセットにさらされるトレーニングと呼ばれるプロセスを通じて、その能力を向上させることができる。
OpenAIとMetaの幹部のコメントによれば、計画を立てることができるLLMを待つのはもう終わりかもしれない。しかし、これはAI研究者にとっては驚きではない。
昨年末、OpenAIのCEOであるSam Altman氏が解雇され、その後再雇用された。当時、この騒動は同社がQと呼ばれる高度なアルゴリズムを開発したことに関係していると噂されたが、その後この説明は覆された。Qが何をするのかは不明だが、当時、その名前がAI研究者の間で話題になった。
MetaのAI責任者でYann LeCun氏は、この噂についてX(旧Twitter)に、LLMにおける自動回帰のプロセスをプランニングに置き換えることは難しいが、ほぼすべてのトップラボがそれに取り組んでいると書いている。彼はまた、Q*がOpenAIのLLMにプランニングを組み込む試みである可能性が高いと考えていた。
LeCun氏は、トップラボについての彼の発言に何かを感じていた。なぜなら、最近、Google DeepMind が計画能力をほのめかした特許出願を公開したからである。
興味深いことに、記載された発明者はAlphaGoチームのメンバーだった。出願に記載された方法は、AlphaGoを目標に導くものによく似ている。また、大規模な言語モデルで使われている現在のニューラルネットワーク・アーキテクチャとも互換性があるだろう。
そこで、MetaとOpenAIの幹部による、アップグレードの能力についてのコメントを紹介しよう。MetaのAI研究担当副社長であるJoelle Pineau氏は、FT紙にこう語っている:「私たちは、これらのモデルが単に話すだけでなく、それ以上のことが出来る方法を見付けることに懸命に取り組んでいます。それは実際に推論し、計画を立て、そして記憶することです」。
もしそれがうまくいけば、単純な段階的な単語生成から、会話全体の計画、あるいは交渉の計画へと、計画と推論の進歩が見られるかもしれない。そうなれば、AIは本当に次のレベルにステップアップするかもしれない。
コメント