テクノロジー
OpenAI、GPT-5.5 Instantを発表:誤答52.5%減のChatGPT新既定モデル
OpenAIはChatGPTのデフォルトモデルをGPT-5.5 Instantに更新し、医療・法律・金融の高リスク質問におけるハルシネーションを52.5%削減したと発表した。このモデルは、AIME数学テストのスコア向上や回答の簡潔化も実現し、業務利用への拡大を後押しする。
別名: American Invitational Mathematics Examination, AIME
AIME(American Invitational Mathematics Examination)は、米国数学オリンピックへの予選を兼ねた難易度の高い数学試験です。AIモデルの性能評価において、論理的思考や多段階の推論が必要な数学問題を解く能力を測定するベンチマークとして広く活用されています。
OpenAIはChatGPTのデフォルトモデルをGPT-5.5 Instantに更新し、医療・法律・金融の高リスク質問におけるハルシネーションを52.5%削減したと発表した。このモデルは、AIME数学テストのスコア向上や回答の簡潔化も実現し、業務利用への拡大を後押しする。
AI企業Anthropicは9月30日、最新モデルClaude Sonnet 4.5を発表した。同社は「世界最高のコーディングモデル」と明言し、複雑なエージェント構築とコンピューター操作において最強のモデルであると位置づ […]