OpenAIは、5月13日(現地時間)に“ChatGPTとGPT-4に関するいくつかのアップデート”に関する発表会を行う予定だが、同社が一体何を発表するのかについて注目が集まっている。これまでの噂では、ChatGPTの技術に基づいた検索エンジンを発表するのではと言われていたが、CEOのSam Altman氏自らが「gpt-5ではなく、検索エンジンでもない」と否定していることから、憶測が広がっている。そして新たな情報として、The Informationは、今回のOpenAIによる発表は、新たな「マルチモーダル・AIデジタル・アシスタント」に関する物だと報じている。
OpenAIのアシスタントはGoogleアシスタントやApple Siriの直接の競合となるか
マルチモーダルとは、AIがテキストだけでなく、画像や音声など、複数の入力ソースを扱えることを意味する。もしOpenAIのデジタル・アシスタントがそれに対応するとしたら、カメラとリンクし、現実世界の情報を処理し、そして見たものに関する詳細な情報を語り返してくれるだろう。例えば、異なる言語で書かれた標識にカメラを向け、ChatGPTに標識の識別と翻訳を依頼すれば、AIがそれに応えてくれるのだ。
だが、そうした機能は既に見たことがあるだろう。Googleが同様の機能をGoogleレンズとして提供しているし、音声アシスタントとしてのGoogleアシスタントが有名だ。ChatGPTでも一部同様の機能は実現されているが、あくまでもChatGPTの一つの機能としてであり、ユーザーはインターフェースを切り替える必要があるなど、シームレスな体験を提供する物ではない。OpenAIの新たなモデルは、画像入力と音声応答の両方をアプリにパッケージングし、これらをより高速に、より正確に解釈し、既存のテープ起こしや音声合成のモデルよりも優れた反応を示すという。
もしこれが事実ならば、GoogleアシスタントやAmaozonのAlexa、そしてAppleのSiriとの直接の競合となる。OpenAIがAppleとの提携を交渉中と伝えられている中でのこうした動きは興味深い物でもある。
今回のOpenAIのアップデートはあくまでもGPT-4のマイナーアップデートになり、GPT-5(と呼ばれるかどうかは不明だが)のような大きなアップデートでない事は、Altman氏の発言からも明らかだろう。The Informationによれば、GPT-4が“ひどく劣って見える”程に優れたものになると言われているGPT-5は今年の終わりに登場する可能性があるという。
OpenAIの発表会は5月13日10時(日本時間5月14日午前3時)に開催される。翌日にはGoogleが開発者イベントGoogle I/Oを開催し、AI関連の機能を多数発表すると見られる。OpenAIはGoogleの発表会のすぐ前にあえてぶつけたに違いないだろう。
Source
- The Information: OpenAI Develops AI Voice Assistant It Chases Google, Apple
コメント