2024年、ノーベル化学賞を受賞し、名実ともに現代科学の頂点に立ったGoogle DeepMindの共同創設者兼CEO、Demis Hassabis氏。彼がサンフランシスコで開催された「Axios AI+ Summit」に登壇し、2026年に向けた人工知能(AI)の進化について、極めて具体的かつ示唆に富む予測を披露した。
Hassabis氏が語ったのは、単なる性能向上の話ではない。AIが「見る」だけの存在から「理解し、行動し、世界を創造する」存在へと変貌を遂げる、パラダイムシフトの予言だ。
本稿では、Hassabis氏の発言を基に、彼が予測する「マルチモーダルモデルの進化」「インタラクティブなワールドモデル」「真に使えるAIエージェント」という3つの主要トレンドを深掘りしていきたい。
マルチモーダルの深化:AIは「文脈」と「哲学」を理解し始めた
Hassabis氏が最初に挙げたトレンドは、マルチモーダル機能の劇的な進化だ。現在、Googleのフラッグシップモデルである「Gemini」は、テキスト、画像、音声、動画を同時に処理する能力を持っているが、Hassabis氏はその理解力が「表面的な認識」を超え、「意味の解釈」の領域に達しつつあると指摘する。
「ファイト・クラブ」を哲学するAI
Hassabis氏は、Geminiの能力を示す非常に興味深い例として、映画『ファイト・クラブ』のワンシーンを挙げた。従来のAIであれば、「男性が指輪を外している」といった動作の記述にとどまるだろう。
しかし、最新のGeminiモデルは違った。AIはこのシーンを「日常生活の放棄を象徴する哲学的シンボル」として解釈したのだ。
「これはAIが視覚情報を単なるピクセルの集合としてではなく、背後にある意図や物語、文化的文脈を含めて理解し始めていることを示しています」とHassabis氏は語る。この「深い理解」こそが、2026年に向けて加速するトレンドの核心だ。Googleの最新の画像理解モデル(Imagen 3などの系譜にある技術)は、視覚コンテンツを正確に把握することで、従来は不可能だった複雑なインフォグラフィックの生成や、高度な推論を伴う視覚的タスクを可能にしつつある。
「観る」から「入る」へ:Genie 3とインタラクティブ・ワールドモデル
動画生成AIといえば、OpenAIのSoraなどが注目を集めているが、DeepMindはその「先」を見据えている。Hassabis氏が明かした2つ目のトレンドは、「世界モデル(World Models)」の台頭だ。
動画の中を「歩き回る」体験
DeepMindが開発中の「Genie 3」は、単に動画を生成するだけではない。Hassabis氏によれば、Genie 3は「インタラクティブで探索可能な3D空間」を生成する。
「動画を生成するだけでなく、まるでゲームやシミュレーションの中にいるかのように、その世界の中を歩き回ることができるようになります。しかも、その空間の一貫性は数分間にわたって維持されます」(Hassabis氏)
これは、AIが物理法則や空間的整合性を理解し、リアルタイムで反応する仮想世界を構築できることを意味する。元々「テーマパーク」や「ブラック&ホワイト」などの傑作シミュレーションゲームを開発したクリエイターとしての経歴を持つHassabis氏にとって、AIによる無限のゲーム空間生成やシミュレーション構築は、長年の夢の結実とも言えるだろう。
この技術はエンターテインメントだけでなく、ロボット工学のトレーニング環境や、建築・都市計画のシミュレーションなど、産業界にも計り知れないインパクトを与える可能性がある。
ユニバーサルアシスタントの完成:AIエージェントの「信頼性」革命
3つ目の、そしておそらく最も実用的なトレンドは、「AIエージェント」の実用化だ。Hassabis氏は、AIが人間の代わりに複雑なタスクを自律的にこなす「エージェント」機能が、今後1年以内に決定的な転換点を迎えると予測している。
2026年、「信頼」が実装される
これまでも「AIエージェント」という概念は存在したが、その信頼性は限定的だった。指示を誤解したり、途中でタスクを放棄したりすることがあったからだ。しかし、Hassabis氏は「今後1年で、AIエージェントは複雑なタスクを自律的に処理できるだけの信頼性を獲得する」と断言する。これは彼が2024年5月に行った予測とも一致しており、開発が順調に進んでいることを示唆している。
Googleが目指すのは「ユニバーサルアシスタント」だ。
それはスマートフォンやPC、スマートグラスなど、あらゆるデバイスを横断して機能し、ユーザーの日常生活の「ファブリック(構成要素)」となる存在だ。
「日常生活の管理、旅行の予約、複雑な調査、あるいは単なる話し相手。これらをデバイスの制約を超えてシームレスにこなすアシスタントが、間もなく現実のものとなります」
企業にとっては、AIエージェントを顧客対応や業務プロセスに組み込む際、その挙動が「安全かつ予測可能」であることが絶対条件となる。Hassabis氏は、この「信頼性の確立」こそが、AIエージェント普及のラストワンマイルであると強調した。
AGIへのカウントダウンと「科学者」Hassabisの視点
Hassabis氏の講演で特に印象的だったのは、彼が自身を「ビジネスマンである前に科学者である」と定義した点だ。ノーベル賞受賞者としての彼の視点は、AI開発競争におけるGoogle DeepMindの独自性を浮き彫りにする。
「スケーリング則」の先にあるもの
現在、AI業界は「モデルを巨大化させれば性能が上がる」というスケーリング則(Scaling Laws)に従って突き進んでいる。Hassabis氏はこのアプローチの有効性を認めつつも、汎用人工知能(AGI)に到達するには「それだけでは不十分かもしれない」という冷静な見方を示した。
彼は、AGIの実現には現在のTransformerアーキテクチャの延長線上にあるスケーリングに加え、「1つか2つの大きなブレイクスルー」が必要になる可能性があると分析する。具体的には、以下の能力の獲得だ。
- 継続学習 (Continual Learning): 常に新しい情報を学習し続け、知識を更新する能力。
- 長期的な計画と推論 (Long-term Planning & Reasoning): 複雑なゴールに向けて、手順を論理的に組み立て、修正しながら実行する能力。
Hassabis氏は、AGIの実現時期について問われると、慎重ながらも「5年から10年以内」という具体的なタイムフレームを提示した。これは、SFの世界の話だと思われていたAGIが、私たちの現役世代の間に実現する可能性が高いことを示している。
米中競争とAIの安全性
地政学的な文脈において、Hassabis氏は米国(および西側諸国)が依然としてAI開発でリードしているとの見方を示した。しかし、中国の研究チームは優秀な「ファストフォロワー」であり、その差は数ヶ月程度に縮まっている可能性があるとも警鐘を鳴らす。
また、AIの安全性については、実存的なリスク(人類滅亡など)の議論だけでなく、より差し迫った脅威として「サイバーセキュリティへの悪用」を挙げた。これに対抗するため、Google DeepMindではAIを活用した防御システムの構築に注力しており、「AIでAIを守る」体制を強化している。
2026年、AIは「ツール」から「パートナー」へ
Demis Hassabis氏の予測を統合すると、2026年のテクノロジー風景は現在とは全く異なるものになるだろう。
マルチモーダルAIは私たちの意図を深く理解し、ワールドモデルは体験可能な仮想空間を生成し、高信頼性のエージェントは私たちの手足となって働く。それは、AIが単なる「検索や生成のツール」から、思考と行動を共にする「パートナー」へと進化することを意味する。
Hassabis氏が率いるGoogle DeepMindは、科学的厳密さとエンジニアリングの力を融合させ、この未来を「安全かつ大胆に」手繰り寄せようとしている。Gemini 3やGenie 3といった次世代モデルが市場に投入される時、私たちは再び「テクノロジーの魔法」を目撃することになるだろう。
Sources