テクノロジーと科学の最新の話題を毎日配信中!!

Google、Geminiでリアルタイム視覚認識機能を今月提供開始と発表

Y Kobayashi

2025年3月4日

Googleは、スペイン・バルセロナで開催されたMobile World Congress(MWC)において、以前「Project Astra」として紹介されたGemini AIの視覚認識機能を3月後半からGoogle One AI Premiumプランの購読者向けに提供開始すると発表した。この機能により、ユーザーはスマートフォンのカメラや画面共有を通じてAIアシスタントとリアルタイムで視覚情報をやり取りできるようになる。

Gemini Live、ビデオと画面共有でよりインタラクティブなAIアシスタントへ進化

MWCでGoogleが発表した新機能は主に2つある。1つ目は「ライブビデオ分析」機能だ。この機能により、ユーザーはスマートフォンのカメラをかざすだけで、Geminiに目の前の物体や状況を認識させ、質問したり、説明を求めたりすることができるようになる。実際の使用感にもよるだろうが、Geminiが単なるチャットボット以上の存在、つまり実際に何が起こっているかを「見る」ことができるハンズオンAIアシスタントとなる第一歩となる可能性を秘めた進化と言えるだろう。

2つ目は「画面共有機能」で、ユーザーはGemini Liveに自分のスマートフォン画面を表示させることができる。AIはその画面上の要素をリアルタイムで解釈し、アプリの使い方ガイドや表示コンテンツの要約などを行う。これにより、オンラインショッピング中に衣装選びのアドバイスを求めたり、技術的な問題解決のサポートを受けたりするなど、 Geminiはユーザーの状況をより深く理解し、的確なアシスタンスを提供できるようになる。

Project Astraからの進化、より自然なAIインタラクションの実現へ

Gemini Liveの基盤となる技術は、以前「Project Astra」として公開されていたコンセプトデモに遡る。このProject Astraは、より自然な方法でAIと対話する方法を示すものとして話題になったものだ。Googleが公開したデモビデオでは、ユーザーがスマートフォンを部屋にかざしながらGeminiに質問し、AIがリアルタイムで応答する様子が示されていた。

Project Astraのデモでは、コンピュータ画面上のコード、スピーカーの仕組み、ホワイトボード上のネットワーク図など、様々なものに対してGeminiが即座に情報を提示した。さらに、ユーザーが動画の前半で眼鏡を置いた場所をGeminiが記憶している様子も示され、AIが文脈を理解し、長期的な記憶を持つ可能性も示唆されていた。

今回発表されたGemini Liveが、Project Astraのデモと同等の能力を持つかどうかは不明だが、GoogleはGemini 2.0プラットフォームへの今回のアップデートを「Geminiを真のパーソナルアシスタントにするもの」と位置付けており、その進化に自信を示している。

Google One AI Premiumプランで提供、OpenAIとの競争激化

Gemini Liveのビデオ分析および画面共有機能は、Google One AI Premiumプランの加入者向けに提供される。このプランは月額2,900円、Googleの最先端AIモデル「Gemini Advanced」へのアクセスも含まれる。

対応端末は当初Androidデバイスのみだが、iOSデバイスへの対応も間もなく予定されているという。

Googleは例として、新しい場所を探索する際の情報提供や、オンラインショッピング中の洋服コーディネート支援などの用途を挙げている。複数言語にも対応予定だ。

GoogleがGemini Liveの機能強化によって、OpenAIなどの競合に対する市場シェア獲得を目指していることは明らかだ。

AI市場の競争激化とプライバシー問題

視覚機能の追加はAIアシスタントの進化における重要なステップと言えるだろう。GoogleはProject Astraを2025年に向けた目標として位置づけており、今回の機能はその実現に向けた一歩と考えられる。最終的には、テキスト、ビデオ、オーディオをリアルタイムで処理し、10分間会話コンテキストを保持できる普遍的マルチモーダルAIアシスタントの構築を目指している。

この発表はAI市場の競争激化を示すものでもある。OpenAIのChatGPTは昨年12月から高度な音声モードでライブおよび画面共有機能をサポートしており、Googleはこれに対抗する形だ。

ただし、こうした機能がもたらすプライバシーへの懸念も尽きない。リアルタイムアシスタンスの利便性は明らかだが、カメラや画面共有を通じてGoogleに提供されるデータの扱いには注意が必要だろう。

また、Googleにとっても、ビデオ処理はリソース消費が大きいため、短期的損失は増大するものと見られる。しかし、現状でGeminiの月間利用者数はOpenAIのツールより1桁少ない数千万人程度であり、市場シェア獲得のための戦略的投資と位置づけられているようだ。

AIアシスタント市場における競争はますます激化しています。GoogleがGemini Liveを武器に、市場で優位性を確立できるか、今後の展開に注目が集まる。


Source

Follow Me !

\ この記事が気に入ったら是非フォローを! /

フォローする

コメントする