テクノロジー
Google、AIモデルの推論能力をゲームで測る「Kaggle Game Arena」を始動──初陣はチェスでの頭脳戦
GoogleがAIベンチマークの再定義に乗り出した。従来の静的テストに代わり、動的かつ対話的なゲーム環境でAIの「思考」を可視化する試みとして、同社は新プラットフォーム「Kaggle Game Arena」を正式発表。初 […]
Anthropicの次世代大規模言語モデル「Claude 4」ファミリーにおけるフラグシップモデル。前世代を上回る高度な推論、創造性、および複雑な指示への理解力を備える。特に人間のような自然な対話と、安全性・倫理性を維持しながらの高度な問題解決能力に定評があり、AIベンチマークにおいて業界トップクラスの性能を示すことが期待されている。
GoogleがAIベンチマークの再定義に乗り出した。従来の静的テストに代わり、動的かつ対話的なゲーム環境でAIの「思考」を可視化する試みとして、同社は新プラットフォーム「Kaggle Game Arena」を正式発表。初 […]
中国のAIスタートアップ、Moonshot AIが発表したオープンソースモデル「Kimi K2」がAI業界に波紋を広げそうだ。これは単なる高性能な大規模言語モデル(LLM)の登場ではなく、AI開発の根底に横たわる「経済学 […]
OpenAIが、同社の強力な推論モデル「o3」のAPI価格を実に80%も引き下げることを発表し、さらに、その上位に位置する新たなフラッグシップモデル「o3-pro」を同時にリリースした。ライバルのGoogleやAnthr […]