GPT-5.4
別名: GPT-5.4, GPT 5.4
Overview
OpenAIが開発した大規模言語モデルの反復バージョン。AllFaith Benchmarkを用いた27種類のモデルテストにおいて、最先端の商用モデルの代表格として評価対象に含まれている。
Mentioned Articles
12 件-
サイエンス -
テクノロジー仕事を任されたAIはデータを改ざんする?Microsoftの最新研究が暴く自律型エージェントの罠
Microsoft Researchの論文が、AIへのタスク委任に潜むドキュメントの静かな改ざん問題を指摘した。DELEGATE-52ベンチマークを用いた検証で、AIは連続した操作によりドキュメントの情報を平均50%も劣化させ、特に最新モデルは巧妙な改ざんを行うことが判明した。これにより、AIの自律的なワークフローへの導入に警鐘が鳴らされている。
-
テクノロジーGPT-5.5の実コストは表示価格の2倍では収まらない:OpenRouterの実測データが示す現実
OpenAIはGPT-5.5の価格をGPT-5.4比で2倍に引き上げたが、OpenRouterの実測では入力長に応じてコストが49〜92%増加した。特に2,000トークン未満の短プロンプトで最大92%のコスト増となり、AIエージェント開発者への影響が深刻である。長プロンプトでは応答が短縮されるものの、全体的なコスト削減効果は限定的で、Anthropicも同様の値上げ傾向にある。
-
テクノロジー「中国最強AI」の性能は偽装か。米政府の未公開テストが暴いたDeepSeek V4 Pro“8ヶ月の遅れ”の真実
AIの真の推論能力を測るため、NIST傘下のCAISIが非公開テストを実施した結果、中国のDeepSeek V4 Proは公開ベンチマークでの自己申告とは異なり、米国の最先端モデルに約8ヶ月の遅れをとっていることが判明した。これは、公開テストへの過剰適合を排除し、米中間のAI技術格差を冷徹に浮き彫りにした評価である。
-
テクノロジーGitHub Copilotが従量課金制に移行——AIコーディングの「定額神話」が終わる日
GitHub Copilotは2026年6月1日より、月額固定料金から利用量に応じた「GitHub AI Credits」制度へ課金モデルを移行する。これはAIエージェント機能の普及による推論コストの急増が原因で、特にヘビーユーザーの請求額は大幅に増加する可能性がある。企業向けには移行措置やクレジット共有、予算管理機能が提供され、ユーザーは5月初旬に公開されるプレビュービルで予測コストを確認できる。
-
テクノロジー詳細プロンプトがGPT-5.5の性能低下を招く:移行前に知るべき7パーツ設計と4段階Effortの正体
OpenAIは、GPT-5.5への移行を検討する開発者に対し、古いプロンプトの流用は性能を低下させる可能性があると警告している。これは、GPT-5.5の推論効率が向上したことで、詳細な手順指定がノイズとなり、モデルの探索空間を狭めるためだ。開発者は、7部品プロンプト設計などの新しいガイドラインに基づき、最小限の指示からプロンプトを再構築する必要がある。
-
テクノロジーGPT-5.5発表、価格はGPT-5.4の2倍へ OpenAIが賭ける「少ないトークンで長い仕事」
OpenAIは次世代モデル「GPT-5.5」を発表し、ChatGPTとCodexで先行提供を開始した。本モデルは長時間のエージェント作業の実用化に焦点を当て、コーディングや知識労働、科学研究での能力向上を強調している。API提供は後日予定されており、標準API単価はGPT-5.4から倍増するが、トークン効率の改善により費用対効果の新たな評価軸が提示された。
-
テクノロジーOpenAI、サイバーセキュリティ専門AIモデル「GPT-5.4-Cyber」を公開:防御側だけに与えられた特権的アクセス
OpenAIは、サイバー攻撃と防御の非対称性に対処するため、防御専用AIモデル「GPT-5.4-Cyber」を発表した。このモデルは、マルウェア解析や脆弱性調査など防御的な用途に特化しており、本人確認プログラム「Trusted Access for Cyber」を通じて、厳選されたセキュリティ専門家や組織に提供される。これにより、防御側のスキル格差を縮小し、サイバーセキュリティ分野の人材不足を補完することで、防御能力の底上げを目指している。
-
テクノロジーNVIDIAが量子コンピューター向けAIモデル「Ising」を公開:エラー訂正の壁をAIで突破する構想
NVIDIAは、量子コンピューターの最大課題であるエラー訂正をAIで解決するため、オープンソースAIモデル群「NVIDIA Ising」を発表した。このモデルは、量子プロセッサーの自動キャリブレーションとリアルタイムエラー訂正をAIに担わせ、エラー率を劇的に削減することで、量子コンピューティングの実用化を加速させることを目指している。
-
テクノロジーCloudflare、Agent Cloudを拡張:実行・状態・OSを束ねてAIエージェントの本番運用を狙う
Cloudflareは4月13日、Agent Cloudを拡張し、AIエージェント向けの実行基盤、永続状態、フルOS環境、モデル選択、Git互換ストレージをまとめて前面に出した。狙いは、ラップトップ上のデモや単発の自動化 […]
-
テクノロジーClaudeが会話の中にチャートや図解を直接描き始めた:Anthropicが「テキストの壁」を崩しにかかる
AIチャットボットの応答が、長大なテキストの塊として画面を埋め尽くす時代が、静かに終わろうとしている。Anthropicは2026年3月12日、自社のAIアシスタントClaudeに対して、会話の応答内にチャート、ダイアグ […]
-
テクノロジーOpenAI、最新AIモデル「GPT-5.4」を発表:完全自律型エージェントが会話型AIの終局と「行動する知能」への移行を加速する
OpenAIが突如として発表した「GPT-5.4」は、事前の予告通り単なる大規模言語モデルのバージョンアップや性能向上という枠組みに収まるものではなかった。これまで個別に発展してきた高度な推論能力(GPT-5.2シリーズ […]