Googleは2026年3月27日、カメラと音声を組み合わせたリアルタイム対話型検索機能「Search Live」を、AI Modeが提供されているすべての言語・地域へ一斉展開した。これによりSearch Liveは200を超える国と地域で利用可能となり、英語を母語としないユーザーも自国語でリアルタイムの視覚的・音声的な検索体験を得られるようになった。

AD

「検索」の定義を書き換える試み

Search Liveが登場した2025年7月時点では、その対象はアメリカ国内のユーザーに限られていた。同年10月にインドへの展開が発表されたものの、それ以外の地域は長らく蚊帳の外に置かれてきた。今回の全世界展開は、Googleが単なるテキスト検索エンジンから、状況を理解して会話できるリアルタイムアシスタントへと本格的に移行しようとする意志の表れである。

従来の検索は「クエリを入力し、リンクの一覧を受け取る」という一方通行のモデルだった。Search Liveはそのモデルを根本から変える。ユーザーはスマートフォンのカメラを対象物に向けながら、音声で「これは何?」「どう組み立てる?」と聞くだけで、Googleは画面の映像を「見て」理解し、次の質問にも答え続ける。検索窓に文字を入力するという手順が消えることで、情報へのアクセスコストは劇的に下がる。

Gemini 3.1 Flash Liveという技術的裏付け

今回の急速な多言語展開を支える核心は、新しいオーディオ・音声モデル「Gemini 3.1 Flash Live」の導入だ。Googleが公式ブログで明らかにしたところによると、このモデルは「もともと多言語対応を前提に設計されている」という。

これは従来の機械翻訳的なアプローチとは異なる。各言語向けの翻訳レイヤーを重ねる構造ではなく、多様な言語の音声を直接理解できるように訓練されているため、翻訳誤差が生じにくく、自然な語順や文化的ニュアンスも保ちやすい。Googleは「より自然で直感的な会話を実現する」と説明しており、応答速度と信頼性の改善も加わった。

多言語ネイティブモデルという設計思想は、グローバル規模の普及を意図した技術選択といえる。英語優位のサービスを後から他言語に移植するという後付け対応ではなく、最初から多様な言語環境を想定して開発されている点が、これまでのGoogleの多言語展開とは一線を画する。

AD

使い方:カメラを向けて話しかけるだけ

操作の入り口は極めてシンプルだ。AndroidまたはiOSのGoogleアプリを開き、検索バーの下にある「Live」アイコンをタップする。マイクがオンになると音声で質問できるようになり、さらに画面右上からカメラを有効にすると、カメラが捉えた映像もSearch Liveに共有される。

折り畳まれた棚の組み立て方を聞きたい場合を例に考えると、ユーザーはカメラを棚のパーツに向けながら「これ、どうやって組み立てるの?」と話す。Search Liveは映像と音声を同時に受け取り、「このパーツはネジ穴が4箇所あります。まず左側のL字金具を…」というように、目の前の状況に即した回答を返す。テキスト入力の手間も、複数のWebページを渡り歩く手間も不要になる。

Google Lensでカメラを使用中の場合は、画面下部の「Live」ボタンからそのままSearch Liveに切り替えられる。Lensによる視覚認識とSearch Liveのリアルタイム対話を途切れなく使えるため、作業の流れを止めずに検索手段を切り替えられる。

同時発表:Live Translateのクロスプラットフォーム展開

Search Liveの発表と同じタイミングで、Google翻訳の「Live Translate」機能もiOSへの対応が明らかになった。Live Translateはヘッドフォンを装着した状態で、目の前の相手の発言をリアルタイムで翻訳する機能で、これまでAndroid限定だった。

今回のアップデートでiOSが加わり、対応デバイスは「どんなヘッドフォンでも動作する」と明言されている。対応言語は70以上に拡大され、新たに対象となった国にはドイツ、イタリア、スペイン、日本、英国が含まれる。TechCrunchの報道によれば、フランス、ナイジェリア、バングラデシュ、タイも追加されている。

言語の壁を超えたリアルタイムコミュニケーションという観点では、Search LiveとLive Translateは同じ方向を向いている。一方はカメラを通じた視覚情報と音声の統合、他方は異言語話者間のリアルタイム翻訳と、機能の軸は異なるが、「言語・物理的距離・入力の手間を取り除く」というGoogleの設計思想が共通して貫かれている。

AD

AI音楽生成でも動きがあった

Search Liveの展開と同日、GoogleはAI音楽生成モデル「Lyria 3 Pro」も発表した。先月リリースされたLyria初期版が最長30秒の楽曲生成にとどまっていたのに対し、Lyria 3 Proは最大3分間の楽曲を生成できる。イントロ、バース、コーラス、ブリッジといった構成要素をユーザーが個別にプロンプトで指定することも可能になり、楽曲制作の幅が広がった。

既存のGemini有料ユーザーおよびVertex AIのエンタープライズ向けにすでに提供が始まっており、開発者はGemini APIとGoogle AI Studioを通じてアクセスできる。Googleのビデオ生成プラットフォーム「Google Vids」への統合も予定されている。

Googleはモデル開発の際、著作権を保有するコンテンツのみを学習データとして使用したとしており、生成物にはAIコンテンツ識別用の電子透かし技術「SynthID」が埋め込まれる。AI生成音楽への法的・倫理的懸念が高まる中で、権利処理と透明性の確保を前面に出した点は注目に値する。ちなみにSpotifyには1日に約5万曲のAI生成楽曲がアップロードされており、同社は昨年だけで7,500万件のスパム的なトラックを削除したというデータがある。AI音楽の量的爆発が業界インフラに与える負荷については、引き続き議論が必要な局面にある。

Googleが照準を合わせている先

一連の発表を通じて見えてくるのは、Googleが「検索」という行為の定義を2025年代に合わせて再構築しようとしているという点だ。ピュアなテキスト検索はすでに成熟しており、差別化余地が限られている。一方、カメラ・マイク・AIを組み合わせたリアルタイム体験の領域は、まだ競合他社が本格展開しきれていない未開拓地でもある。

AppleのSiri、MicrosoftのCopilot、そしてOpenAIのVoice Modeも音声と視覚情報を組み合わせた機能拡張を進めているが、Googleが持つ強みは検索インフラとの深い統合にある。Search LiveはWeb上の情報へのリンクも提示できるため、会話が一問一答に終わらず、より深い調査や購買行動にまでつなげやすい設計になっている。

200カ国・70言語以上という規模の同時展開は、技術的な準備の到達点であると同時に、Googleが次の検索戦争を多言語圏の日常生活を舞台として争う意図を持っていることを示している。日本語のユーザーも今日から対象となっており、スマートフォンを通じたリアルタイム検索体験は、これまでとは質的に異なるフェーズへと入ったと言えるだろう。


Sources