テクノロジー
OpenAI、最新AIモデル「GPT-5.4」を発表:完全自律型エージェントが会話型AIの終局と「行動する知能」への移行を加速する
OpenAIが突如として発表した「GPT-5.4」は、事前の予告通り単なる大規模言語モデルのバージョンアップや性能向上という枠組みに収まるものではなかった。これまで個別に発展してきた高度な推論能力(GPT-5.2シリーズ […]
WebArena-Verifiedは、AIモデルがWebブラウザを通じて、情報の検索、フォームへの入力、複数サイトを跨ぐ処理などの複雑なオンラインタスクをどの程度自律的に実行できるかを測定する指標です。静的な解析ではなく、動的に変化するWeb環境への対応力が問われます。