テクノロジー
Google、AIモデルの推論能力をゲームで測る「Kaggle Game Arena」を始動──初陣はチェスでの頭脳戦
GoogleがAIベンチマークの再定義に乗り出した。従来の静的テストに代わり、動的かつ対話的なゲーム環境でAIの「思考」を可視化する試みとして、同社は新プラットフォーム「Kaggle Game Arena」を正式発表。初 […]
Google傘下のデータサイエンスコミュニティであるKaggleが立ち上げた、AIモデルの性能を評価するための新しいベンチマークプラットフォーム。従来の静的なデータセットによる評価の限界を克服するため、チェスや将棋などの戦略ゲームを用いた動的かつ対話的な環境を提供する。AIモデル同士を直接対決させ、その勝敗や思考プロセスをEloレーティングなどの指標で定量化することで、モデルの戦略的思考、長期的計画、即時対応力といった汎用的な推論能力を可視化することを目的としている。