テクノロジー
OpenAI、GPT-5.5 Instantを発表:誤答52.5%減のChatGPT新既定モデル
OpenAIはChatGPTのデフォルトモデルをGPT-5.5 Instantに更新し、医療・法律・金融の高リスク質問におけるハルシネーションを52.5%削減したと発表した。このモデルは、AIME数学テストのスコア向上や回答の簡潔化も実現し、業務利用への拡大を後押しする。
別名: Massive Multi-discipline Multimodal Understanding-Pro
MMMU-Proは、テキストだけでなく画像などの複数のモダリティを組み合わせた理解力を測定するベンチマークです。大学レベルの専門知識を必要とする多分野の課題を含み、AIが複雑な視覚情報と論理をいかに統合して処理できるかを評価します。