ChatGPTの基盤となるGPT-4oモデルが進化を遂げた。OpenAIは、知識ベースを2024年6月まで拡張し、画像認識能力を大幅に強化したアップデートを発表。特にSTEM分野での性能向上が特徴的な進化となっている。
知識ベースの拡張と性能向上
新たにアップデートされたGPT-4oは、従来の2023年11月から2024年6月まで知識ベースを拡張。これにより、より最新の文化的・社会的トレンドや研究内容に関する文脈を考慮した応答が可能となった。特筆すべきは、Web検索の効率性と有効性が向上している点である。
検索機能の向上は、単なるデータベースの更新に留まらない。モデルの理解力と分析能力の向上により、クエリの文脈をより深く理解し、より適切な検索結果を提供できるようになっている。
画像認識能力の飛躍的進化
今回のアップデートで最も注目すべき進化の一つが、画像認識能力の向上だ。新しいGPT-4oは、MMMLUやMathVistaといったマルチモーダルベンチマークにおいて顕著な性能向上を示している。
具体的な改善点として以下が挙げられる:
- 空間的関係性の理解向上
- 複雑な図表やグラフの分析能力強化
- 視覚情報とテキストコンテンツの連携強化
- デザインレイアウトや空間計画における指導能力の向上
これらの改善により、建築やデザイン、エンジニアリングなど、視覚的な要素が重要な分野での活用可能性が広がっている。
STEM分野での卓越した性能
今回のアップデートでは、STEM(科学、技術、工学、数学)分野での性能向上が特に顕著だ。GPQAやMATHといった学術評価指標での成績が向上し、言語理解力、知識の幅広さ、推論能力を測定するMMMLUベンチマークでも進歩を見せている。
これは、クロスドメインでの問題解決能力が向上したことを示唆しており、特にプログラミングや数学的問題解決において、より正確で効果的なサポートが期待できる。
インターフェースの進化と対話性の向上
興味深い更新点として、新たに「Use more intelligence」ボタンが追加された。これにより、ユーザーは必要に応じてモデルにより深い処理時間を与えることが可能となった。
また、やや異色な更新として、絵文字の使用がより積極的になった点が挙げられる。特にユーザーが絵文字を使用した場合、それに呼応してよりエモーショナルな応答を行うという特徴が加わっている。
Sources
- ChatGPT — Release Notes: Updates to GPT-4o in ChatGPT (January 29, 2025)
コメント