OpenAIは、新たな大規模言語モデル「GPT-4.5」を研究プレビューとしてリリースした。このモデルは前世代より計算効率が10倍以上向上し、より自然な対話能力を実現しているが、同社は最先端の「フロンティアモデル」ではないと明言している。
OpenAI、最新AIモデル「GPT-4.5」発表
OpenAIは、最新かつ最大規模のAIモデル「GPT-4.5」(コードネーム:Orion)を発表した。このモデルは、同社の月額200ドルのChatGPT Proプランの加入者と、有料APIティアの開発者向けに研究プレビューとして提供が開始されている。他のChatGPTユーザー(PlusおよびTeamプラン)は、来週中にGPT-4.5を利用できるようになる予定だ。
GPT-4.5は、OpenAIがGPT-4、GPT-3などの先行モデルの開発で用いたスケールアップ戦略、すなわち計算能力とデータ量を大幅に増加させることで開発された。OpenAIは、GPT-4.5の規模拡大により、「より深い世界知識」と「より高い感情知能」を獲得したと述べている。
しかし、GPT-4.5はOpenAI自身によって「フロンティアモデルではない」と位置づけられている。実際、複数のAIベンチマークでは、GPT-4.5はDeepSeek、Anthropic、そしてOpenAI自身が開発したより新しいAI「推論」モデルに及ばない結果も出ている。また、GPT-4.5のAPI利用料金は、GPT-4oと比較してinputトークンで30倍、outputトークンで15倍と高額であり、OpenAI自身も長期的なAPI提供を検討中であると認めている。
GPT-4.5 Orion:GPT-4oを超える性能と大規模モデル
OpenAIによると、GPT-4.5はGPT-4oの代替を意図したものではない。GPT-4.5はファイルや画像のアップロード、ChatGPTのCanvasツールなどの機能はサポートしているものの、GPT-4oが持つリアルな双方向音声モードのような機能は現時点では実装されていない。
しかし、性能面ではGPT-4oを含む多くのモデルを上回る。OpenAIが実施したSimpleQAベンチマークでは、GPT-4.5はGPT-4oやOpenAIの推論モデルであるo1、o3-miniよりも高い精度を示した。OpenAIは、GPT-4.5は他のモデルと比較してハルシネーション(もっともらしい嘘をつくこと)を起こしにくいと主張しており、事実に基づいた回答をする能力が高いことを示唆している。


一方で、SWE-Bench Verifiedベンチマーク(コーディング問題)では、GPT-4.5の性能はGPT-4oやo3-miniと同程度であり、OpenAIのDeep ResearchやAnthropicのClaude 3.7 Sonnetには及ばなかった。ただし、SWE-Lancerベンチマーク(ソフトウェア機能開発能力)では、GPT-4.5はGPT-4oやo3-miniを上回る性能を示している。
GPT‑4.5 | GPT‑4o | OpenAI o3‑mini (high) | |
---|---|---|---|
GPQA (science) | 71.4% | 53.6% | 79.7% |
AIME ‘24 (math) | 36.7% | 9.3% | 87.3% |
MMMLU (multilingual) | 85.1% | 81.5% | 81.1% |
MMMU (multimodal) | 74.4% | 69.1% | – |
SWE-Lancer Diamond (コーディング) | 32.6% $186,125 | 23.3% $138,750 | 10.8% $89,625 |
SWE-Bench Verified (コーディング) | 38.0% | 30.7% | 61.0% |
学術的なベンチマーク(AIME、GPQAなど)では、GPT-4.5はo3-mini、DeepSeekのR1、Claude 3.7 Sonnetなどの推論モデルには及ばないものの、非推論モデルの中ではトップレベルの性能を示しており、数学や科学関連の問題に強いことがうかがえる。
OpenAIは、GPT-4.5はベンチマークでは測れない定性的な面でも優れていると主張する。例えば、人間の意図を理解する能力が高く、より温かく自然なトーンで応答し、執筆やデザインなどの創造的なタスクで優れた性能を発揮するという。実際にOpenAIが実施した非公式テストでは、GPT-4.5はグラフィック作成や感情的な質問への応答において、GPT-4oやo3-miniと比較して、より人間らしい、感情豊かで創造的なアウトプットを生成している。
技術詳細:教師なし学習の進化とGPT-4.5の特徴
OpenAIは、GPT-4.5を「教師なし学習で可能なことの最前線」に位置づけている。GPT-4.5は、教師なし学習をスケールアップすることで、パターン認識、関連性の抽出、創造的な洞察の生成能力を向上させている。
GPT-4.5の開発では、計算能力とデータ量を増やす従来のスケールアップに加え、アーキテクチャと最適化における技術革新も導入された。また、GPT-4.5は、より小さなモデルで生成されたデータを用いて、より大規模で強力なモデルを訓練する新しいスケーラブルな技術で訓練されている。これにより、GPT-4.5は、人間との協調性、ニュアンスの理解、自然な会話能力が向上している。
OpenAIの研究者であるRaphael Gontijo Lopes氏は、GPT-4.5はGPT-4oと比較してハルシネーションが大幅に減少しており、また、GPT-4.5は会話をより温かく、直感的で、感情的なニュアンスを持たせるように調整されており、人間による評価でもGPT-4oを上回る結果が出ているという。

GPT-4.5 Orionの利用方法とAPI料金
GPT-4.5は、ChatGPT ProユーザーはWeb、モバイル、デスクトップアプリで利用可能。ChatGPT PlusおよびTeamユーザーへは来週から提供開始予定。APIは、すべての有料APIティアの開発者が利用可能だ。
GPT-4.5は、検索機能、ファイルと画像のアップロード、ChatGPT Canvasに対応。ただし、Voice Mode、ビデオ、画面共有などのマルチモーダル機能は現時点では非対応。
API料金は、inputトークン100万トークンあたり75ドル、outputトークン100万トークンあたり150ドル。GPT-4oと比較して非常に高額であり、OpenAIはAPI提供の長期的な継続を検討している。
スケーリングの限界とOpenAIの次なる一手
GPT-4.5は、教師なし学習のスケールアップの限界に近づいている可能性を示唆している。OpenAIの共同創設者であるIlya Sutskever氏は、2024年12月に「我々はデータ量のピークに達した」と発言しており、事前学習の手法の限界を示唆している。
業界では、事前学習の限界に対処するため、推論モデルに注目が集まっている。OpenAIも推論モデル「oシリーズ」を開発しており、将来的にはGPTシリーズとoシリーズを統合する計画である。GPT-4.5は、GPTシリーズとoシリーズを統合したGPT-5の開発に向けた中間的なステップと見ることができる。
XenoSpectrum’s Take
GPT-4.5 Orionの発表は、大規模言語モデル(LLM)の進化における重要なマイルストーンと言えるだろう。GPT-4oから着実に性能を向上させ、より自然で人間らしい対話能力、創造性を獲得したことは評価に値する。特に、感情知能や創造性が向上した点は、AIの応用範囲を広げる可能性を秘めている。
しかし、GPT-4.5がフロンティアモデルではないというOpenAI自身の評価、そして高額なAPI料金は、大規模モデルの限界とコスト問題を示唆している。今後は、推論能力の強化、効率的な学習方法の開発、そして特定用途に特化した専門モデルの開発が、AI進化の鍵となるだろう。
OpenAIがGPT-5でGPTシリーズとoシリーズを統合する戦略は、この方向性を示唆している。GPT-4.5 Orionは、大規模モデルの成果と課題を浮き彫りにし、今後のAI開発の方向性を指し示す、重要な過渡期のモデルと言えるだろう。
Sources
- OpenAI:
コメント