OpenAIは、低コストでパフォーマンスに優れる新しいマルチモーダルAIモデル「GPT-4o mini」を発表した。GPT-4o miniは、従来のGPT-3.5 Turboに比べて60%低コストでありながら、より高いパフォーマンスを発揮するという。この革新的なモデルは、AIの民主化と幅広い応用を促進することが期待されている。
安価で高性能なGPT-4o miniにより企業でのAI採用を促進させる狙い
GPT-4o miniは、OpenAIが開発した最新の小型マルチモーダルAIモデルである。OpenAIは、モデルのアーキテクチャを改良し、トレーニングデータと方法を最適化することで、小型モデルでありながら高い性能を実現した。現在のAPIではテキストと画像の処理に対応しているが、将来的にはテキスト、画像、動画、音声の入出力をすべてサポートする予定であり、より幅広いアプリケーションでの利用が期待できる。GPT-4o miniの主な特徴は以下の通りである:
- 長文処理能力の向上: 128Kトークンの入力コンテキストをサポートし、最大16Kトークンの出力が可能である。この長文処理能力により、大量のコンテキストを必要とするタスク(例:全コードベースや長い会話履歴の解析)に適している。
- 知識の更新: 2023年10月までの情報を学習しており、比較的最新の情報を扱うことができる。
- 多言語処理の効率化: GPT-4oと同じ改良されたトークナイザーを採用しており、非英語テキストの処理がより効率的になっている。
- 安全性の向上: OpenAIは新たに「instruction hierarchy」と呼ばれる手法を導入し、モデルのジェイルブレイク(制約の回避)やプロンプトインジェクション攻撃、システムプロンプトの抽出に対する耐性を向上させている。
GPT-4o miniは、数学的推論やコーディングタスクにおいても優れた性能を発揮している。例えば、数学的推論を測定するMGSMでは87.0%、コーディング性能を測定するHumanEvalでは87.2%のスコアを記録した。これらの数値は、同じ小型モデル市場の競合製品を大きく上回っている。
また、マルチモーダル推論の評価であるMMMUでも59.4%のスコアを達成し、GoogleのGemini Flashの56.1%、AnthropicのClaude 3 Haikuの50.2%という競合モデルを上回る性能を示している。
OpenAIは、RampやSuperhumanなどの企業と協力して、GPT-4o miniの実用性を検証した。これらの企業は、レシートファイルから構造化データを抽出したり、スレッド履歴を提供して高品質な電子メール応答を生成したりするタスクにおいて、GPT-4o miniがGPT-3.5 Turboよりも大幅に優れていることを確認している。
だが、GPT-4o miniの最も革新的な点は、その低コスト性にある。入力トークンあたり15セント、出力トークンあたり60セントという価格設定は、GPT-3.5 Turboと比較して60%以上安価である。これは、AIモデルの利用コストが劇的に低下していることを示している。OpenAIによると、text-davinci-003(2022年に導入された比較的能力の低いモデル)と比較して、GPT-4o miniのトークンあたりのコストは99%削減されている。この急速なコスト低下とモデル性能の向上は、AI技術の民主化を加速させる可能性がある。
GPT-4o miniの登場により、AI市場の競争は一層激化すると予想される。AnthropicやMicrosoftなど、他のAI企業も小型で効率的な低コストモデルの開発にしのぎを削っており、今後は各社の技術力が試されることになるだろう。この競争は、AI技術の更なる進化と価格の低下を促進し、結果としてユーザーに大きな恩恵をもたらす可能性がある。
また、GPT-4o miniの低コスト高性能という特性は、AI技術の応用範囲を大きく広げることが期待されている。これまでAI導入に二の足を踏んでいた中小企業や個人開発者にとって、AI技術がより身近なものとなる。これにより、AIを活用したアプリケーションやサービスの多様化が進み、様々な産業分野での活用が期待される。
さらに、ChatGPTの無料版やPlus版、Team版でGPT-3.5 TurboがGPT-4o miniに置き換わることで、多くのユーザーがより高性能なAIを日常的に体験できるようになる。これは、AIに対する一般ユーザーの期待値を高め、AI技術の社会への浸透を加速させる要因となるだろう。
GPT-4o miniの実用例としては、複数のAPIを連鎖または並列化するアプリケーション、大量のコンテキストをモデルに渡す必要があるアプリケーション、高速でリアルタイムなテキスト応答が必要な顧客サポートチャットボットなどが挙げられる。これらの用途において、GPT-4o miniは高いコストパフォーマンスを発揮すると期待されている。
OpenAIのAPI製品責任者であるOlivier Godementは、最先端のフロンティアモデルの開発を継続しつつ、最高の小型モデルも提供したいという意欲を示している。この姿勢は、AIの裾野を広げながらも最先端技術の追求を怠らないOpenAIの戦略を表すものと言えるだろう。
GPT-4o miniは、本日からChatGPTの無料ユーザー、有料プランのChatGPT PlusとTeam加入者に提供され、来週にはChatGPTエンタープライズユーザーにも提供される予定だ。
Source
コメント