Google、第8世代TPU「8t / 8i」を発表:「エージェントAI時代」に向けた学習・推論アーキテクチャの分離戦略
Googleは、AIエージェントの台頭によるインフラ要求の変化に対応するため、第8世代TPUで学習特化の「TPU 8t」と推論特化の「TPU 8i」という2つの独立したチップを導入した。これにより、フロンティアモデルの学習時間短縮と低遅延推論を実現し、用途特化によるパフォーマンスと電力効率の最大化を追求している。
別名: Ironwood TPU, 第7世代 TPU
Googleが第8世代の前に展開していた第7世代のTensor Processor Unit。学習と推論の双方に対応する汎用的な設計思想を持っていたが、第8世代ではこの路線を転換し、学習用と推論用のチップに分離されることとなった。
Googleは、AIエージェントの台頭によるインフラ要求の変化に対応するため、第8世代TPUで学習特化の「TPU 8t」と推論特化の「TPU 8i」という2つの独立したチップを導入した。これにより、フロンティアモデルの学習時間短縮と低遅延推論を実現し、用途特化によるパフォーマンスと電力効率の最大化を追求している。
GoogleはBroadcomとの長期契約を継続しつつ、推論向けAIチップの最適化を進めている。Marvellとの協議は、推論専用TPUとメモリ処理ユニットの2チップ構成により、演算とメモリ階層の分業で推論性能とコスト効率を改善する狙いがある。これは、推論のボトルネックが演算性能だけでなくメモリ帯域やデータ移動にあるという認識に基づき、推論向け半導体競争が単なる演算性能から総合的な効率へと移行していることを示唆している。
人工知能(AI)ハードウェア市場において絶対的な支配力を誇るNVIDIAに対し、新たな陣営が包囲網を敷きつつある。米国時間2026年2月24日、AIチップスタートアップのSambaNova Systemsは、総額3億5, […]
生成AI革命の第二幕が開かれようとしている今、業界の注目は「学習(Training)」から「推論(Inference)」へと急速にシフトしている。この転換期において、Googleが満を持して投入した第7世代TPU「Iro […]
Googleの次世代AI基盤モデル「Gemini 3」が2025年にリリースされることが、同社のSundar Pichai CEOによって公式に明言された。Alphabet史上初となる1000億ドル超の四半期収益という記 […]
Googleが自社設計による初のArmベースCPU「Axion」をデータセンター向けに投入することが報じられている。ここ最近サーバー市場においてもArmベースCPU開発の報道が相次ぎ、Intel x86アーキテクチャが長 […]