GoogleがAIアシスタント「Gemini」に新たな機能を追加し、Android及びiOSスマートフォンをこれまでにない強力なAIアシスタントへと進化させている。2024年5月のGoogle I/O開発者会議で「Project Astra」として発表された後、Made by Google 2024イベントで正式に公開された「Gemini Live」は、ユーザーとGeminiの間で自然な音声会話を可能にする画期的な機能だ。この新機能は、複雑なタスクをこなし、ユーザーの貴重な時間を大幅に節約することを目指している。
Project Astraの機能の一部が「Gemini Live」として登場
Gemini Liveは、現在AndroidデバイスのGemini Advancedサブスクリプションプラン加入者に対して英語で提供が開始された。iOSデバイスや他の言語への対応は数週間以内に予定されており、グローバルな展開が期待される。この機能は、OpenAIのChatGPTに搭載された「高度な音声モード」に対抗する形で開発されたものと見られている。
Gemini Liveの最も注目すべき特徴は、その自然な会話体験にある。ユーザーはまるで人間の専門家と話すかのように、Geminiと自由に会話を楽しむことができる。さらに、10種類の新しい音声から選択可能で、それぞれが異なる特性やテクスチャを持つ。例えば、「Dipper」は落ち着いた深い声で、「Nova」は中程度のピッチで積極的な印象を与える。これにより、ユーザーは自分の好みや状況に合わせて最適な音声を選択できる。
Gemini Liveはその柔軟性も特筆に値する。ユーザーは会話中に割り込んで質問したり、特定のポイントについて掘り下げたりすることが可能だ。また、アプリがバックグラウンドで動作中や、スマートフォンがロックされている状態でも会話を継続できる。これは通常の電話のように、移動中でも会話を続けられることを意味し、ユーザーの生活スタイルに合わせた柔軟な使用が可能となる。
技術面では、Gemini LiveはGemini 1.5 ProとGemini 1.5 Flashの長いコンテキストウィンドウを活用している。これにより、長時間の会話を記憶して推論することが可能となり、より深い文脈理解と一貫性のある応答を実現している。Googleの担当者によると、この大きなコンテキストウィンドウは、ユーザーが長い会話をLiveで行う際に活用されるという。
Gemini Liveの用途は多岐にわたる。就職面接の練習や、特定のスキルセットに適した職業のブレインストーミングなど、様々なシーンでの活用が期待される。例えば、ユーザーは重要な会話の練習相手としてGemini Liveを利用したり、新しいアイデアについてブレインストーミングを行ったりすることができる。
さらに、GoogleはAndroidデバイス向けに追加の機能を発表した。電源ボタンを長押しするか「Hey Google」と言うことで、使用中のアプリ上にGeminiのオーバーレイを表示させ、画面の内容について質問できるようになる。例えば、YouTubeで動画を視聴中に「この動画について質問する」オプションをタップし、動画で言及されたレストランのリストを作成してGoogleマップに追加するよう依頼することができる。
また、GoogleカレンダーやKeep、タスク、YouTube Musicなどのアプリとの統合も強化される予定だ。例えば、コンサートのチラシの写真を撮影し、Geminiにその日が空いているかを確認させ、チケットを購入するためのリマインダーを設定することができる。
これらの機能拡張により、Geminiはより直感的で使いやすいAIアシスタントへと進化を遂げている。ただし、一部の機能はまだ開発中であり、今後数週間から数ヶ月にかけて段階的にリリースされる予定である。例えば、I/Oで披露されたマルチモーダル入力機能は、今年後半にリリースされる予定だ。
Googleは、AIアシスタントの有用性が課題を上回る転換点に到達したと考えており、同日発表されたPixel 9ではGeminiがデフォルトのアシスタントとして搭載される予定だ。これは、GoogleがAIアシスタントの未来をGeminiに託していることの現れと言えるだろう(Googleが再びGeminiから名前を変えないとも限らないが)
しかし、この新技術には課題もある。大規模言語モデルを使用することで、単純なタスクの完了に少し時間がかかるようになる可能性がある。また、柔軟性が高い反面、予期せぬ動作をしたり不正確な情報を提供したりする可能性もある。Googleはこれらの課題に対処するため、Gemini 1.5 Flashなどの新しいモデルを組み込み、速度と品質の向上に焦点を当てている。
Gemini Liveの登場は、AIアシスタントの概念を根本から再定義しようとするGoogleの野心的な試みである。単純なタスクだけでなく、複雑な課題にも対応できるよう設計されており、ユーザーの日常生活をサポートする強力なツールとなることが期待される。今後のアップデートや新機能の追加により、Geminiがどのように進化し、ユーザーの生活にどのような影響を与えていくのか楽しみだ。
Sources
コメント