Googleが2023年に実験的プロジェクト「Google Labs」から展開したNotebookLMは、大規模言語モデル(LLM)を用いた情報処理のアプローチにおいて、特定の方向性を示してきた。一般的なチャットAIが、モデルが事前に学習した広範な知識に依存して回答を生成するのに対し、NotebookLMはユーザーが手動でアップロードした文書群(PDF、Google Docs、スライド資料など)のみを知識の基盤(グラウンディング)とする仕様を採用していた。この設計は、LLM特有のハルシネーション(事実に基づかない情報の生成)を抑制し、企業内の機密資料や学術論文といった特定の閉じられた情報空間に対する正確な質疑応答を実現する上で、合理的なアプローチであった。

しかしながら、この厳格な制約は同時にユーザーのワークフローに対する摩擦を生んでいた。調査を開始する段階で、ユーザー自身が対象となるすべての関連資料を事前に収集し、整理してアップロードしなければならないからである。未知の領域に関する探索的なリサーチを行う場合、ユーザーはどの資料を読み込ませるべきかさえ把握していないことが多く、初期段階の情報収集は外部の検索エンジンに依存せざるを得なかった。

6月8日に公開された最新のアップデートは、この初期段階のワークフローを根本的に再構築している。ユーザーは手元に特定のドキュメントを持たずとも、漠然としたアイデアや疑問をチャットに入力するだけでプロジェクトを開始できるようになった。システム側がGoogle検索と連動し、Web上の関連性の高い高水準なリソースを自律的に検索して、ノートブックにソースとして追加するためのガイドを行う。たとえば、特定のトピックについて外国語で記述された一次情報を探索して多角的な視点を導入したり、関心を持った著者の関連論文を自動で収集して文脈を構築したりといった、リサーチの足場固めをシステムが支援する。

ここで注目すべきは、自律的なソース検索機能が導入されても、ノートブックに追加される情報の管理権限は引き続きユーザー側に保持される点である。検索された外部情報は自動的に組み込まれるわけではなく、ユーザーの選択と承認を経て初めてノートブックに統合される。回答の生成時には常に出典が明記されるという基本設計は維持されており、ツールの重要な設計思想である「意図しない情報の混入を防ぐ」という安全性を担保したまま、調査のスタート地点を大幅に手前へと引き上げている。

AD

Gemini 3.5の推論能力とAntigravityによるコード実行環境の実装

IMG\_4\_ImportingSources\_2x.width-1000.format-webp.webp

今回の機能強化の中核を構成している技術要素は、Googleの最新基盤モデルである「Gemini 3.5」と、エージェント型コーディングプラットフォーム「Antigravity」の統合である。LLMの進化はこれまでパラメータ数の増加やコンテキストウィンドウの拡張に焦点が当てられることが多かったが、NotebookLMのバックエンド刷新は、AIに「行動を実行する環境」を与えるというアプローチを取っている。

統合の結果として、NotebookLM内の各ノートブックにはセキュアなクラウドコンピューターが専用の実行環境として割り当てられることになった。システムは一般的なテキスト処理にとどまらず、ユーザーの要求に応じてPythonなどのプログラミング言語を用いたコードを自律的に記述し、その環境内で実行することが可能となっている。LLMは数字の計算や厳密なデータ操作を言語的確率論で処理しようとするため、複雑な計算タスクにおいてエラーを引き起こしやすいという構造的弱点を持つ。しかし、Antigravityによってコードを実行し、その演算結果をLLMが再度解釈するという手続きを踏むことで、この弱点を克服する設計となっている。

このシステムには、データ分析やファイル処理に特化した100以上のキュレートされたソフトウェアスキルが組み込まれており、ソース資料に対する深い分析タスクを強力にサポートする。Googleが実施した旧システムとの比較評価によれば、5つの主要な評価指標において平均65%以上の勝率(旧モデルとの比較で15ポイントの差)を達成している。大規模ドキュメントの分析においては69.9%、高度なWebリサーチおよび情報源の発見においては78.2%という極めて高い勝率を記録している。この数値は、膨大なテキストのクロスリファレンスや、フォーマットが混在するデータの統合において、新たなバックエンドが精度向上をもたらしていることを客観的に示している。

推論能力の向上と並行して、生成プロセスにおける透明性の確保も図られている。チャット画面上には、システムがどのように情報を処理し、どのソースを参照して結論に至ったかを示す「思考プロセス(thinking steps)」が詳細に展開されるようになった。高度なエージェント化が進むにつれてAIの内部処理はブラックボックス化しやすいが、この可視化機能により、ユーザーは論理の飛躍や不適切なデータの参照がないかを自ら検証し、出力結果に対する信頼性を評価しやすくなっている。

多彩なファイル出力による情報処理サイクルの完結

これまでのAIチャットアシスタントは、どれほど優れた分析結果を提示できたとしても、そのアウトプットは「チャット画面のテキスト」という枠に制約されていた。ユーザーは得られたインサイトを業務に活用するために、手動でテキストをコピーし、WordやExcel、PowerPointといった別のアプリケーションに貼り付けてレイアウトを調整するというアナログな最終工程を強いられていた。今回のアップデートでは、この情報の断絶を解消すべく、多様なファイルフォーマットでの直接エクスポート機能が実装された。

NotebookLMはユーザーの詳細なプロンプト指示に基づき、分析結果を加工可能なファイルとして直接生成する。対応フォーマットは、テキスト文書(PDF、DOCX、Markdown、プレーンテキスト)にとどまらず、表計算ソフト向けの構造化データ(XLSX、CSV、JSON)、プレゼンテーション用のスライド(PPTX)といった主要なビジネスファイル形式を網羅している。さらに、数値データの可視化を目的としたグラフ(PNG、SVG)や、Googleの画像生成AIモデル「Nano Banana」を利用した画像出力(PNG、JPG、GIF)にも対応した。

この出力機能は、テキストを単純にファイルへ流し込む処理とは異なり、ソースデータの文脈を理解した構造化を伴う。ユーザーが「この2つのデータソースを比較し、相違点を明確にする表を含んだPDFレポートを作成して」と指示すれば、NotebookLMはテキストの要約と同時に比較表を構築し、ダウンロード可能なPDFとして提示する。多言語ワークフローにも対応しており、日本語で指示を与えながら、出力ファイルは英語で作成するといった柔軟な運用も可能である。出力後に追加の編集を指示してファイルを更新することもでき、情報の検索、分析、構造化、ドキュメント化までの全工程がひとつのワークスペース内で完結する。

AD

プロフェッショナル領域における具体的なユースケースと今後の展開

高度な推論と多様な出力を組み合わせることで、NotebookLMは専門的な実務における複雑なワークフローを代替するツールへと位置づけが変化している。Googleは今回のアップデートが業務に与えるインパクトとして、データアナリスト、技術専門家、ビジネスオーナーという3つのペルソナに基づくユースケースを提示している。

データアナリストの事例では、複数の国から収集されたフォーマットの異なるデータをNotebookLMに読み込ませるシナリオが想定されている。アナリストはシステムにWebリサーチを実行させて各国の市場背景などのコンテキストを補完させ、Antigravityの環境内でPythonコードを実行してデータのクレンジングと正確な分析を実施する。そして最終的な結果を視覚的なグラフを含むPDFレポートとして出力させる一連の工程を、コードの記述なしに実行できる。技術専門家のケースでは、難解なシステムインテグレーションの仕様書をインプットとし、開発チーム向けの平易な導入ガイド、経営陣向けのプレゼンテーションスライド、具体的なステップごとのロードマップというターゲットに応じた3つの異なる成果物を生成するワークフローが示されている。ビジネスオーナーの事例では、広告費と実際の売上データを照合し、キャンペーンの財務的影響を計算させることで、他都市への事業拡大といった経営判断の材料を得ることが可能になる。

これらの大幅な機能強化は6月8日より、Google AI Ultraプランのユーザー、およびAI Ultra AccessやAI Expanded Accessを契約しているGoogle Workspaceのビジネス顧客を対象にグローバルでの展開が開始された。バックエンドで専用のクラウド環境を稼働させ、コード実行や画像生成を伴う性質上、コンピューティングリソースの消費が大きいため、現時点ではプレミアムティアのアカウントに限定されている。しかしGoogleは今後、他のユーザー層へのアクセスを段階的に拡大していく方針を明らかにしており、出力可能なファイルフォーマットのさらなる追加も計画されている。リサーチプロセス全体を再定義するこのツールが、今後どのように普及していくかが注目される。