Term

ARC-AGI-2

Overview

最終更新: 2026年7月9日

Abstraction and Reasoning Corpus for Artificial General Intelligenceの略称で、AIが訓練データにない未知の論理規則をその場で推論し、回答を構築する能力を測定するテスト。単なるパターンマッチングや暗記では高得点を得られないため、現行のAIが真の論理的思考能力を備えているかを測る重要な指標とされる。Gemini 3.1 Proはこのテストで77.1%という業界トップクラスのスコアを記録し、AIが「予測する機械」から「思考するエンジン」へ進化していることを証明した。

Mentioned Articles

3 件

External Mentions

10 件

arXivThink Through a Bottleneck: Hourglass Reasoning for Rigorous Induction
▲ 0Huan Zhu2026年7月13日
arXivARCANA: A Reflective Multi-Agent Program Synthesis Framework for ARC-AGI-2 Reasoning
▲ 0Kunbo Zhang2026年7月10日
arXivCost-Effective Agent Harnesses for Abstract Reasoning and Generalization on ARC-AGI-1
▲ 0Kabir Moghe2026年7月7日
arXivModality-Driven Search with Holistic Trace Judging for ARC-AGI-2
▲ 0Johan Land2026年6月30日
arXivYou Don't Need to Run Every Eval
▲ 0Yuchen Zeng2026年6月22日
arXivStructural Grid Descriptors Predict Within-Task Solver Success on ARC-AGI
▲ 0Ayan Pendharkar2026年6月8日
arXivGIM: Evaluating models via tasks that integrate multiple cognitive domains
▲ 0Rohit Patel2026年5月18日
arXivMAP: A Map-then-Act Paradigm for Long-Horizon Interactive Agent Reasoning
▲ 0Yuxin Liu2026年5月13日
arXivMulti-Perspective Transformers in ARC-AGI-2 Challenge
▲ 0Caleb Talley2026年5月1日
arXivCompositional Neuro-Symbolic Reasoning
▲ 0Anugyan Das2026年4月2日