今週初め、OpenAIは人気のChatGPTチャットボットを動かしている人工知能(AI)システムの新バージョン、GPT-4o(「o」は「omni」の略)を発表した。GPT-4oは、より自然なAIとの対話を目指した一歩として宣伝されている。デモンストレーションビデオによれば、GPT-4oはユーザーとほぼリアルタイムで音声対話ができ、人間のような個性と行動を示すとのことだ。
この個性に重点を置くことは、議論を呼ぶ可能性が高い。OpenAIのデモでは、GPT-4oは友好的で共感的かつ魅力的に聞こえる。即興のジョークを言ったり、笑ったり、冗談を言ったり、さらには歌ったりする。また、AIシステムはユーザーのボディランゲージや感情のトーンにも反応できることを示している。
洗練されたインターフェースと共にリリースされたGPT-4oは、ユーザーのエンゲージメントを高め、そのテキスト、画像、および音声機能に基づいた新しいアプリケーションの作成を促進するように設計されているようだ。
GPT-4oはAI開発のさらなる飛躍を示している。しかし、エンゲージメントと個性に焦点を当てることは、本当にユーザーの利益に資するのか、そして人間の感情や行動を模倣するAIの倫理的な影響について重要な疑問を提起している。
個性の要素
OpenAIは、GPT-4oをより楽しく魅力的な会話型AIとして位置づけている。原則として、これは対話をより効果的にし、ユーザーの満足度を高める可能性がある。
研究によると、社会的な知性と個性を示すチャットボットに対して、ユーザーはより信頼し協力する傾向がある。これは、教育の分野などで重要であり、AIチャットボットが学習成果や動機を向上させることが示されている。
しかし、一部の論評者は、人間のような個性を持つAIシステムにユーザーが過度に依存することや、一方向の人間-コンピュータ相互作用によって感情的に傷つくことを懸念している。
『Her』効果
GPT-4oはすぐに比較を呼び起こした。OpenAIのボス、Sam Altman氏も含めて、多くの人が2013年のSF映画『Her』に言及している。この映画は、人間とAIの相互作用の潜在的な落とし穴を鮮明に描いている。
映画では、主人公のTheodoreが、洗練されウィットに富んだ個性を持つAIシステム、Samanthaに深く魅了され、愛着を持つようになる。彼らの絆は現実と仮想の境界を曖昧にし、愛と親密さの本質、人間とAIのつながりの価値について疑問を投げかける。
GPT-4oをSamanthaと真剣に比較するべきではないが、同様の懸念を引き起こす。AIの伴侶は既に存在しており、AIが人間の感情や行動を模倣する能力が向上するにつれて、ユーザーが深い感情的な愛着を形成するリスクが高まる。これにより、過度の依存、操作、さらには害を及ぼす可能性がある。
OpenAIは、AIツールが安全に振る舞い、責任を持って展開されることを確保することに関心を示しているが、魅力的なAIを世界に解き放つことの広範な影響についてはまだ学んでいない。現在のAIシステムは、人間の心理的ニーズを満たすように明示的に設計されていない。その目標は定義し測定するのが難しい。
GPT-4oの印象的な能力は、AIツールが公共の価値観や優先事項と一致して開発および使用されるようにするためのシステムやフレームワークが必要であることを示している。
拡張された能力
GPT-4oは、デバイスのカメラを通じてユーザーとその周囲のビデオ(事前録画されたビデオも含む)を使用して対話することもできる。OpenAIのデモでは、GPT-4oがユーザーの環境や衣服についてコメントし、物体、動物、テキストを認識し、顔の表情に反応する様子が示されている。
GoogleのProject Astra AIアシスタントは、GPT-4oの翌日に発表され、同様の能力を示している。Astraも視覚的記憶を持っているようで、Googleのプロモーションビデオの一つでは、AIがユーザーのメガネを見つけるのを助けている。AIには見えていないにもかかわらず、オフィスの中でメガネを見つけるのを支援するシーンがある。
GPT-4oとAstraは、テキスト、画像、音声、ビデオを扱うことができる「マルチモーダル」モデルのトレンドを続けている。GPT-4oの前身であるGPT-4 Turboは、テキストと画像を一緒に処理できるが、音声やビデオは扱えない。ChatGPTのオリジナルバージョンは、2年も前にリリースされ、テキストのみに基づいていた。
GPT-4oは、その前身よりもはるかに高速である。
リアルタイムで音声、視覚、テキストを扱う能力は、世界を理解し、複雑で意味のある目標を効果的に達成できる高度なAIシステムの開発において不可欠とされている。
しかし、一部の批評家は、GPT-4oのテキスト能力がGPT-4 TurboやGoogleのGemini Ultra、AnthropicのClaude 3 Opusなどの競合他社と比べてわずかに改善されているに過ぎないと主張している。
主要なAI研究所が、より大規模で高度なモデルを継続して構築することで、最近の急速な改善ペースを維持できるかどうかは、専門家の間で熱い議論の的となっており、その結果が今後数年間の技術の影響を決定するだろう。
より広いアクセス
GPT-4oのリリースの中で、派手ではないが重要な側面は、GPT-4ファミリーの前身と異なり、新しいAIシステムがChatGPTの無料バージョンの全ユーザーに使用制限付きで提供されることである。
これは、世界中の何百万ものユーザーがGPT-3.5からより強力なAIシステムへとアップグレードされ、より多くの機能を利用できることを意味している。GPT-4oは、仕事や教育などのさまざまな目的でGPT-3.5よりもはるかに有用である。この発展の影響は、時間が経つにつれてより明確になるだろう。
今後の展望
OpenAIのGPT-4oの発表は、より強力なAIシステムを求める愛好者をがっかりさせた。彼らは、GPT-4のリリースから1年以上経過した後、GPT-5の登場を期待していた。
代わりに、今週のGPT-4oとGoogleの最新AI発表は、製品に組み込まれる機能を強調している。これらの新しい開発は、より高度な仮想アシスタントがユーザーに代わって複雑なタスクを遂行し、より豊かな対話や計画を含む可能性を示唆している。
コメント