Term

ARC-AGI-2

Overview

Abstraction and Reasoning Corpus for Artificial General Intelligenceの略称で、AIが訓練データにない未知の論理規則をその場で推論し、回答を構築する能力を測定するテスト。単なるパターンマッチングや暗記では高得点を得られないため、現行のAIが真の論理的思考能力を備えているかを測る重要な指標とされる。Gemini 3.1 Proはこのテストで77.1%という業界トップクラスのスコアを記録し、AIが「予測する機械」から「思考するエンジン」へ進化していることを証明した。

Mentioned Articles

3 件

External Mentions

1 件