Anthropic、天井知らずの推論コスト削減のためDRAMレスAI推論チップ開発のFractileと交渉を開始
大規模言語モデルの推論コストが利益を圧迫する中、AnthropicはAI推論チップの自前調達を急いでおり、未製造の英国スタートアップFractileと交渉を進めている。Fractileは、プロセッサとメモリ間のボトルネックを解消するMemory Compute Fusionアーキテクチャを提案し、既存GPU比で25倍速くコスト10分の1の推論を目指している。
別名: Language Processing Unit, LPU
Language Processing Unitの略称。逐次的な処理が求められる大規模言語モデル(LLM)の推論に最適化されたプロセッサ。従来のGPUが使用するHBM(広帯域メモリ)の代わりに、チップ内に統合された高速なSRAMを使用することで、メモリ待ち時間を極限まで削減している。また、命令の実行タイミングをコンパイラが静的に管理する決定論的設計により、予測可能で超高速な応答速度を実現する。
大規模言語モデルの推論コストが利益を圧迫する中、AnthropicはAI推論チップの自前調達を急いでおり、未製造の英国スタートアップFractileと交渉を進めている。Fractileは、プロセッサとメモリ間のボトルネックを解消するMemory Compute Fusionアーキテクチャを提案し、既存GPU比で25倍速くコスト10分の1の推論を目指している。
2025年9月、世界を驚かせたNVIDIAとOpenAIによる「1000億ドル(約15兆円)の巨額投資と10ギガワット規模のAIインフラ構築」という壮大な合意。AI時代の「黄金の同盟」と目されたこの計画が、発表からわずか […]
2025年12月25日、テクノロジー業界に激震が走った。AI半導体の絶対王者であるNVIDIAが、AI推論チップのスタートアップであるGroqの資産と人材を獲得するため、約200億ドル(約3兆円規模)という巨額の資金を投 […]
AIスタートアップGroqは、公開ベンチマークで全ての競合を上回る、非常に高速なLPU推論エンジンを発表した。 Groqによると、LPU(Language Processing Unit™)は、大規模言語モ […]