Anthropic、天井知らずの推論コスト削減のためDRAMレスAI推論チップ開発のFractileと交渉を開始
大規模言語モデルの推論コストが利益を圧迫する中、AnthropicはAI推論チップの自前調達を急いでおり、未製造の英国スタートアップFractileと交渉を進めている。Fractileは、プロセッサとメモリ間のボトルネックを解消するMemory Compute Fusionアーキテクチャを提案し、既存GPU比で25倍速くコスト10分の1の推論を目指している。
Topic
全 3,269 件 / 273 ページ
大規模言語モデルの推論コストが利益を圧迫する中、AnthropicはAI推論チップの自前調達を急いでおり、未製造の英国スタートアップFractileと交渉を進めている。Fractileは、プロセッサとメモリ間のボトルネックを解消するMemory Compute Fusionアーキテクチャを提案し、既存GPU比で25倍速くコスト10分の1の推論を目指している。
AIの真の推論能力を測るため、NIST傘下のCAISIが非公開テストを実施した結果、中国のDeepSeek V4 Proは公開ベンチマークでの自己申告とは異なり、米国の最先端モデルに約8ヶ月の遅れをとっていることが判明した。これは、公開テストへの過剰適合を排除し、米中間のAI技術格差を冷徹に浮き彫りにした評価である。
エージェント型AIの台頭が、AIデータセンターの根本的な設計を書き換えようとしている。GPU:CPU比率は従来の8:1から1:1へと縮小しつつあり、それに伴いCPU搭載DRAMは現行比最大4倍の400GBへ膨張する計画が進んでいる。既に逼迫しているDRAM市場は、この需要増によってスーパーサイクルの到来が2027年以降に押し延ばされる見通しだ。なぜCPUがここまで大容量メモリを必要とするのか、その構造を解説する。
自社のAIモデルが自律型ドローンの制御や国内監視に転用されるリスクをどう制御すべきか。この問いを巡り、米国防総省(ペンタゴン)とAI開発企業の思想的対立が激化している。2026年5月1日、ペンタゴンは主要AI企業8社と機密ネットワーク協定を締結し、軍事利用における制約を事実上撤廃する方針を打ち出した。一方で、独自のセーフガードを譲らなかったAnthropicは協定から除外され、法廷闘争へと発展している。
Robloxは、ゲームロジックと映像生成を分離し、AIによる写実的な映像をクラウドで生成する新レンダリング構想「Roblox Reality」を発表した。これは、ユーザー生成コンテンツの視覚品質を向上させ、端末性能差を吸収することを目指す。NVIDIA DLSS 5がローカルGPUで処理するのに対し、Roblox Realityはクラウドを活用し、2K/60Hzと数百万同時接続を目標とするが、遅延や費用、制作者の表現制御が課題となる。
IntelとAMDが共同開発した「APX(Advanced Performance Extensions)」は、x86アーキテクチャの汎用レジスタ数を倍増させ、メモリアクセスを削減することで性能と電力効率を向上させる。また、非破壊的命令や条件付き実行の拡張により、命令スループットの最大化と分岐予測ペナルティの回避を図り、現代の複雑なワークロードに対応する。
ローカルAIの実験環境を自宅に置きたい開発者にとって、Mac miniの最安構成が94,800円から124,800円へ上がったことは何を意味するのか。2026年5月1日、Appleの販売ラインからM4/256GB構成が消え、512GB構成が入口になった。同時期にMac miniとMac Studioは、AI(人工知能)エージェント用途の需要増で供給制約を受けている。これは小型Macが安価な入門機から、常時稼働するローカルAIサーバーへ役割を変え、購入計画の基準価格が一段上がったことを示す変化だ。
2026年4月公開のGPT-5.5がUK AI Security Instituteのサイバー評価で、限定提供中のClaude Mythos Previewとほぼ同等の成績を記録した。この結果は、公開モデルと限定モデルの能力差が縮まり、危険なAI能力が特定の非公開モデルに限定されないことを示唆している。そのため、AIの安全対策はモデル性能よりも、誰にどの権限で利用させるかが中心となる。
マサチューセッツ工科大学を中心とした国際研究チームは、多スライス電子タイコグラフィ(MEP)を駆使し、これまで不明だったリラクサー強誘電体の3次元原子構造と電荷分布を直接観測することに成功した。この発見は、従来のシミュレーションが描いた原子レベルの乱れが巨視的な性能に結びつくメカニズムを覆し、高感度センシング技術の飛躍的発展に貢献する可能性を秘めている。
MicrosoftはAIビジネスの急成長を受け、従量課金・成果報酬型のハイブリッドモデルへ移行し、CopilotなどのAIエージェントが普及している。一方で、Windows 11ではユーザーの不満を解消するため、AI統合の削減や基本機能への回帰を進め、インフラ投資も強化している。
Anthropicが発表した「Claude Security」は、LLMの推論能力を活用し、従来のSASTツールでは見落とされがちな複数コンポーネント間の相互作用から生まれるパターン化されていない脆弱性を検出する。既存のセキュリティ運用フローに統合され、SnykやSemGrepといった既存ツールの隙間を埋める新たな防御レイヤーとして機能する設計だ。
Linuxカーネルの脆弱性「Copy Fail」(CVE-2026-31431)は、AF_ALG、splice()、2017年の性能最適化が交差する点に潜み、732バイトのPythonスクリプトでsetuidバイナリのページキャッシュを書き換え、root権限を奪取する。この脆弱性はディスク上のファイル変更を伴わず、チェックサム比較も通過するため検出が困難であり、主要なLinuxディストリビューションに広範な影響を与える。