OpenAIがChatGPTの高度な音声モードを有料会員のChatGPT Plus、ChatGPT Teamユーザー向けに順次提供を開始した。筆者も早速使えるようになってみたので、使用するための準備や方法、簡単な感想をご紹介しよう。
ChatGPTはWeb、アプリの両方で現在利用が可能だが、高度な音声モードはまずはモバイル向けアプリからの提供になるようだ。ChatGPT Plus / TeamユーザーはiOS/Androidの対応アプリをバージョン1.2024.261以降に更新しておくと、ChatGPTの高度な音声モードが利用可能になった場合通知が来て利用が可能になった事が分かる。
実際に利用可能になると、チャットウィンドウの右下にこれまでのヘッドフォンアイコンから変更になった音声モードアイコンが登場するので、これをタップすることで利用開始となる。
初めてChatGPTの高度な音声モードを利用した際には、以下の様な簡単な案内が表示される。ChatGPTの高度な音声モードではChatGPTの発言中に割り込んで会話ができたり、ユーザーの過去の発言などを記憶して、ユーザー毎にパーソナライズしてくれる機能が搭載されている。
また、利用する音声もこれまでの4つの選択肢に加え、新たに5つの音声が加わり、9つの音声が加わった。それぞれの特徴は以下の通りだ。
- Vale: 明るく好奇心旺盛 (女性音声)
- Maple: 陽気で気さく(女性音声)
- Breeze: 活発で真面目(男性音声)
- Cove: 落ち着いていて率直(男性音声)
- Arbor: おおらかで多才(男性音声)
- Sol: 知識豊かで落ち着いている(女性音声)
- Juniper: 開放的で明るい(女性音声)
- Ember: 自信に満ち、楽観的(男性音声)
- Spruce: 冷静で肯定的(男性音声)
ChatGPTの高度な音声モードの開始には恐らくサーバーとの接続に10秒程度かかるが、接続が確立されればその後はシームレスに利用が可能だ。
UIはシンプルな物で、中央に水色のグラデーション球体が表示されたもので、こちらの発言やChatGPTの発言に応じて大きさやとなる。
ChatGPTの高度な音声モードはバックグラウンドでの動作も可能で、スマートフォンの他のアプリを利用中にバックグラウンドで動作させる事ができ、会話を継続する事も可能だ。
筆者が実際に使ってみたところ、こちらの発言へのレスポンスは確かに良好で、ほとんど遅延を感じる事はなかった。ただし、音声が途切れ途切れになることや、日本語のアクセントはなまりなどが感じられ、まだまだ改良が必要だと感じた。
また、ChatGPTの高度な音声モードは無制限に利用できるわけではなく、1日の利用可能時間に制限が設けられているようだ。具体的な利用可能時間数は不明だが、残り時間が15分を切った段階で通知が来るようになっており、利用時間を使い切ると以降は標準の音声モードの利用に切り替わるようになっている。
また、Webでの検索には対応していないため、筆者の居住地の天気予報を尋ねても「リアルタイムの情報は取り扱いできないので、インターネットで検索して調べてください」と返されてしまい、日々のアシスタントとしての役割を果たすにはまだまだと言う感じだ。
とは言え、こうした制限や不満もあるが、日本語で利用が可能になり、ほとんど発言の認識も誤りがなく、まともに会話ができる点は大きい。工夫次第で大いに楽しめるのも魅力だろう。SNS上では早速色々な面白い使い方が掲載されていたのでいくつかご紹介しよう。
今後は更に洗練されることは間違いなく、また競合のGoogleがGemini Liveを日本語に対応させることも間もなくだろう。これに加えてカメラでの認識機能まで備えられるようになれば、真に使えるAIアシスタントになるはず。今後の進展が楽しみだ。
コメント