Term

FrontierMath

Overview

FrontierMathは、Epoch AIが主導し、フィールズ賞受賞者を含む世界トップクラスの数学者たちと協力して作成された、AI向けの極めて高度な数学ベンチマークです。既存の数学テストとは異なり、計算機で解くことが困難な現代数学の未解決問題に近いレベルの問題が含まれています。従来のAIモデルの正答率は数パーセントに留まっていましたが、OpenAIのo3などの最新推論モデルがどこまでスコアを伸ばせるかが、AIの知能の進化を測る新たな基準となっています。

Mentioned Articles

2 件

External Mentions

3 件