GoogleのAIアシスタント「Gemini」が、iPhoneユーザー向けの専用アプリとしてApp Storeで全世界に向けて公開された。これまでGoogle検索アプリ内の機能として提供されていたGeminiが、独立したアプリとして生まれ変わり、音声による自然な会話機能「Gemini Live」も新たに搭載された。
独立アプリとしての機能拡充
新しいGeminiアプリは、iOS 16以降を搭載したiPhoneで利用可能となる。テキストベースの対話は35言語に対応し、音声会話機能のGemini Liveは英語に加え、日本語、スペイン語、フランス語、ドイツ語、ヒンディー語、ポルトガル語、アラビア語、イタリア語、インドネシア語、トルコ語、ベトナム語の12言語をサポートしている。
ユーザーは10種類の異なる音声から好みの声を選択可能で、会話中に質問を挟んだり、話題を変更したりする自然な対話が可能となった。さらにLive Activities機能により、iPhoneがロック状態でも会話を継続できる。
主要機能と統合サービス
新しいGeminiアプリは、GoogleのAI技術を日常的なタスクに活用できる多彩な機能を実装している。まず注目すべきは、同社の最新画像生成AI「Imagen 3」の統合だ。このモデルは高い写実性と精度を特徴とし、テキストの説明から詳細な画像を生成できる。例えば、銀河をモチーフにしたアーモンド型のネイルアートといった具体的なイメージでも、鮮やかな画像として具現化できる。
学習支援の面では、個々のユーザーの学習スタイルに適応したカスタマイズ機能を提供する。複雑な図表についての質問に答えたり、その内容についてクイズを出題したりすることで、理解度の確認と知識の定着を支援する。また、特定の科目についての質問に応じて、個別の学習プランを作成することも可能だ。
さらに、Googleのエコシステムとのシームレスな統合も特徴だ。「拡張機能」と呼ばれる機能により、YouTube、Google マップ、Gmail、カレンダーなどの主要なGoogleサービスと連携し、単一の会話の中でこれらのアプリケーションから関連情報を取得・表示できる。これにより、例えば旅行の計画を立てる際に、地図情報やレビュー動画、スケジュール管理を一括して行うことが可能となる。
これらの機能はすべて無料で提供され、ユーザーは特別な課金や追加のサブスクリプションなしで利用できる。特に、以前はGemini Advancedの独占機能だったGemini Liveが無料版に組み込まれた点は、Googleの積極的なAIデモクラタイゼーション戦略を示唆している。
Xenospectrum’s Take
Google GeminiのiOS展開は、AppleとのAI戦争の始まりを予感させる物だ。Apple Intelligenceがいまだベータ版であり、英語のみにしか対応していないことを鑑みれば、Gemini Liveでも英語以外での対応を始めている点で、Googleが一歩先んじていることは確かだろう。現在iOS 18.2ベータ版でテスト中のSiri-ChatGPT統合と併せて考えると、音声AIアシスタント市場は新たな局面を迎えつつある。しかし、12言語という現時点での言語サポート数は、グローバル展開を標榜するGoogleとしては控えめだ。おそらく品質担保の観点から慎重なアプローチを取っているのだろう。
Gemini Liveに関しては、実際の使用感はOpenAIのChatGPTの高度な音声モードに比べるとレスポンスに難があると感じる面が多かったが、拡張機能によるGoogleサービスとの連携は特にGmailやGoogle Workspaceユーザーにとっては利便性の高さを実感出来る物だろう。
Source
- Google: The Gemini app is now available on iPhone
- App Store: Google Gemini
コメント