テクノロジー
AIは嘘を見破るか?人狼ゲームでGPT-5が驚異の勝率97%を記録
フランスのスタートアップFoaster.aiが開発したAI評価ベンチマーク「Werewolf」で衝撃的な結果が報告された。OpenAIの最先端モデルGPT-5が、210回に及ぶゲームで96.7%という驚異的な勝率を叩き出 […]
別名: Qwen3
Qwen3-235B-Instructは、中国のテック大手Alibaba(アリババ)が開発したオープンウェイトの大規模言語モデルです。2350億という膨大なパラメータ数を誇り、指示追従能力に最適化されています。Foaster.aiの社会的知性ベンチマークに参加し、世界の主要なAIモデルと人狼ゲームを通じて対戦しました。中国発のモデルとして、複雑な議論の誘導や矛盾の検出といった高度な言語的駆け引きにおいて、国際的なトップクラスのモデルに匹敵する実力を示しています。