テクノロジーと科学の最新の話題を毎日配信中!!

Google、飛躍的な推論能力を備える「Gemini Deep Think」発表:最難関ベンチマークを突破し、OpenAI超えの性能を示す

Y Kobayashi

2025年5月21日6:39AM

Googleは、年次開発者会議「Google I/O 2025」において、主力AIモデル「Gemini 2.5 Pro」に新たな「Deep Think」モードを導入すると発表した。この画期的な機能は、AIの推論能力を飛躍的に向上させ、最難関とされる複数のベンチマークで既存のAIモデルを凌駕する「SOTA(State of the Art)」の記録を達成した。AIがまるで人間の脳のように「深く考える」能力を獲得しつつあるという、GeminiのDeep Thinkとは何なのだろうか。

スポンサーリンク

Google I/O 2025の目玉「Deep Think」とは何か?

Google DeepMindのCEO、Demis Hassabis氏が「モデルの性能を限界まで押し上げる」と語ったDeep Think。一体どのような技術なのだろうか。

複数の仮説を並列処理 – AlphaGoの思考法を彷彿

Deep Thinkの最大の特徴は、与えられた課題に対して、単一の答えに飛びつくのではなく、「複数の仮説を同時に考慮し、それぞれを評価した上で最終的な回答を生成する」という点にある。これは、かつて囲碁の世界チャンピオンを破ったAI「AlphaGo」が、盤面の無数の可能性を探求し、最適な一手を見つけ出すプロセスにも通じるものがあると言えるだろう。

従来のAIモデルの多くは、一方向的に情報を処理し、最も確率の高い答えを導き出す傾向があった。しかし、Deep Thinkは、より複雑で多角的な検討を可能にするために、「並列思考技術」とも呼べるアプローチを採用しているようだ。

Googleは、Deep Thinkの内部構造について詳細を明らかにしていないが、OpenAIが発表したo1-proや今後登場するo3-proモデルの技術と類似している可能性がありそうだ。これらのモデルもまた、複雑な問題を解決するために、内部的にサブタスクに分解し、複数の解決策を探索・統合するような高度な推論エンジンを利用していると考えられているる。Deep Thinkは、単なる情報の羅列やパターン認識に留まらず、より複雑な問題解決や深い理解へとAIを進化させるための重要なステップとなるだろう。

「考える」とは何か?Deep Thinkの技術的アプローチ

「考える」という行為は、単に情報を処理するだけでなく、情報の背後にある文脈を理解し、論理的な推論を重ね、時には直感的な飛躍をも伴う複雑な認知プロセスだ。Deep Thinkが目指すのは、まさにこの人間的な「思考の深さ」の獲得にあると考えられる。

具体的には、以下のような技術要素が推測される。

  • 高度なプランニング能力: 複雑なタスクを複数のサブタスクに分解し、それぞれの最適な解決策を探索する。
  • 仮説生成と検証: 複数の可能性(仮説)を並行して生成し、それぞれについて論理的な整合性やエビデンスとの適合性を検証する。
  • 自己批判と修正: 生成した回答や推論プロセスを自己評価し、必要に応じて修正を加えることで、より精度の高い結論へと導く。

これらの能力は、AIが単なる情報検索ツールやパターン認識システムを超え、真の意味で「知的なパートナー」となるための重要なステップと言えるだろう。

ベンチマークで競合を凌駕:AIの「思考力」を数値で証明

Deep Thinkの導入により、Gemini 2.5 Proは複数の挑戦的なAIベンチマークで驚異的なパフォーマンスを示した。特に注目すべきは以下の達成である。

  • LiveCodeBench(競争レベルのコーディング評価): Deep Thinkは、この難解なコーディング評価においてトップの座を獲得した。
  • MMMU(マルチモーダル推論ベンチマーク): 知覚や推論などのスキルを評価するこのテストでは、OpenAIの競合モデルであるo3を打ち破った。
  • 2025 USAMO(全米数学オリンピック): 最も難易度の高い数学ベンチマークの一つであるUSAMO 2025で、Deep Thinkは49.4%という驚くべきスコアを記録した。

これらのベンチマークでの「SOTA(State of the Art)」達成は、AIが単なるデータ処理能力だけでなく、より高度な「思考力」や「問題解決能力」において人間レベル、あるいはそれ以上の領域に踏み込みつつあることを明確に示している。特にUSAMOのような競技レベルの数学問題で高得点を出すということは、AIが複雑な論理構造を理解し、抽象的な概念を操作する能力が著しく向上したことを意味する。

これらのベンチマーク結果は、AIの進化が「量(データ量やモデルサイズ)」から「質(推論の深さ)」へと移行していることを示していると言えるだろう。Deep Thinkは、まさにその質の向上を象徴する技術であり、今後のAI開発の方向性を決定づける可能性を秘めている。

スポンサーリンク

Deep Thinkの提供戦略と安全性への配慮

Deep Thinkは、その革新性ゆえに、広範な展開には慎重なアプローチがとられている。現時点では、今週からGemini APIを介して「信頼できるテスター」向けに提供が開始されたばかりだ。Googleは、本格的な一般公開に先立ち、さらなる安全性評価と、各分野の専門家からのフィードバックを得るために追加の時間を費やすとしている。

この「信頼できるテスター」への先行提供と、徹底した安全性評価の実施は、GoogleがAIのフロンティア技術を開発する上で、その潜在的な影響を深く考慮し、責任あるAI開発を重視している姿勢の表れである。AIの能力が向上するにつれて、誤情報、バイアス、悪用の可能性などのリスクも高まるため、このような慎重なアプローチは極めて重要である。

将来的には、Deep Thinkモードは、Googleのプレミアムサブスクリプションプラン「Google AI Ultra」の加入者向けに提供される予定だ。Google AI Ultraは月額249.99ドルという高額な料金設定であり、Googleはこれを「Google AIへのVIPパス」と位置付けている。このプランには、Deep Thinkのほか、音声生成が可能な動画生成モデル「Veo 3」、AI映画制作ツール「Flow」、エージェント機能「Project Mariner」へのアクセス、さらには30TBのストレージやYouTube Premiumも含まれる。これは、最先端のAI技術を求めるクリエイター、開発者、企業などのパワーユーザーをターゲットとした戦略であり、GoogleがAIを単なるコンシューマー向けサービスだけでなく、プロフェッショナルなツールとしても確立しようとしていることを示している。

Deep Thinkだけではない:進化を続けるGeminiエコシステム

Google I/O 2025での発表はDeep Thinkに留まらず、Geminiモデルシリーズ全体、さらにはGoogleの広範なプロダクトエコシステム全体にわたるAIの進化が示された。

より効率的になったGemini 2.5 Flash

まず、低コストで高速性に特化した「Gemini 2.5 Flash」も大幅にアップデートされた。この新バージョンは、コーディング、マルチモダリティ、推論、長文コンテキスト処理のパフォーマンスが向上しただけでなく、効率性も高まり、同じ出力に対して20%から30%少ないトークンで処理可能になった。これにより、開発者や企業は、よりコスト効率よくGeminiモデルを利用できるようになる。Gemini 2.5 Flashのプレビュー版はGoogle AI StudioとVertex AIで提供されており、6月上旬には一般提供が開始される予定だ。

音声付き動画生成も!Imagen 4とVeo 3の進化

マルチモーダルAIの分野でも大きな進展があった。画像生成モデル「Imagen 4」は、より写実的なディテールと優れたテキスト・タイポグラフィ出力を実現。そして、動画生成モデル「Veo 3」は、ついに「ネイティブな音声生成」に対応ており、効果音、背景ノイズ、さらにはキャラクター間の対話まで含んだ動画を生成できるという。これは、AIによるクリエイティブコンテンツ制作の可能性を飛躍的に拡大するものであり、「動画生成のサイレント時代からの脱却」と評されている。

Geminiアプリも大幅強化 – iPhone対応、Deep Research、Agent Mode

エンドユーザー向けのGeminiアプリも大幅な機能強化が図られた。
9to5Googleによると、主な新機能は以下の通りだ。

  • iPhoneおよびiPadアプリへの対応: Project Astraを活用したカメラおよび画面共有機能がiOSデバイスでも利用可能になる。
  • Gemini Liveの拡張機能サポート: Google Maps、Calendar、Tasks、KeepといったGoogleアプリとの連携が強化される。
  • Deep Research機能の進化: 公開データとユーザー自身のプライベートなPDFや画像を組み合わせて、より深い洞察を得ることが可能になる。GmailやDriveとの連携も近日中に予定されている。
  • Gemini Canvasの新「Create」メニュー: 会話の内容からWebページ、インフォグラフィック、クイズ、音声概要などを生成できる。
  • インタラクティブクイズ: 学習内容に基づいたインタラクティブなクイズを生成し、個別最適化された学習体験を提供する。
  • Agent Mode (Google AI Ultra加入者向け): Project Marinerを搭載し、ユーザーが目的を述べるだけで、GeminiがWebブラウジング、詳細なリサーチ、Googleアプリとの連携などを自律的に行い、タスクを遂行する。これは、AIがユーザーの指示を能動的に解釈し、実行する「エージェントAI」の実現に向けた大きな一歩と言えるだろう。

これらの機能強化は、Deep Thinkのような高度な推論エンジンと連携することで、よりインテリジェントでパーソナルなAI体験をユーザーに提供することを目指している。

スポンサーリンク

考えるAI」時代の幕開け

Google I/O 2025で発表されたGemini 2.5 Proの「Deep Think」モードは、AIが単なる情報処理ツールから、より深く「考える」存在へと進化する新たな時代の到来を告げている。複数の仮説を並列で検討し、複雑な推論を行うその能力は、数学やコーディングといった知的な領域で目覚ましい成果を上げ、AIの可能性を大きく押し広げた。

提供はGoogle AI Ultraサブスクリプションを通じて慎重に進められるが、その背景には、強力なAI技術に対するGoogleの責任ある姿勢がうかがえる。Deep Thinkを取り巻くGeminiファミリー全体の進化も目覚ましく、音声付き動画生成やエージェントAIの実現など、私たちのデジタル体験を根底から変えるポテンシャルを秘めている。

AIの「思考」が深まることで、私たちはどのような未来を手にするのだろうか。それは、計り知れない恩恵をもたらす一方で、新たな倫理的・社会的課題を私たちに突きつけるかもしれない。しかし、確かなことは、AI技術がもはやSFの世界の話ではなく、私たちの現実を着実に変革しつつあるということだ。この「考えるAI」との対話を通じて、私たちは自らの知性や創造性をも再発見し、新たな価値を共創していくことになるのではないだろうか。


Sources

Follow Me !

\ この記事が気に入ったら是非フォローを! /

フォローする
スポンサーリンク

コメントする