AI半導体スタートアップのEtchedが、推論専用チップをめぐる競争を「設計構想」から「契約と量産準備」の段階へ押し出した。2026年6月30日にステルスから脱した同社は、TSMCのN4PプロセスでA0シリコンが動作したこと、累計8億ドルを調達したこと、10億ドル超の署名済み顧客契約を得たことを発表した。直近の未公表ラウンドは2025年12月に実施した5億ドルの資金調達で、post-money評価額は50億ドルだった。

Etchedは「NVIDIA対抗のAIチップ」を名乗るだけでなく、初のラック規模製品を顧客と検証し、今夏に最初のラックを出荷する計画を示した。台湾工場、サンノゼ本社内のデータセンター、test house、NPI prototyping labも整えており、チップそのものより、チップ、ラック、ソフトウェア、製造を束ねた推論インフラ企業としての構えを前面に出している。

AD

10億ドル超の契約は、売上よりも量産移行のシグナルになる

Etchedの発表に出てくる10億ドル超の数字は、認識済み売上ではなく署名済みの顧客契約である。この区別は重要だ。売上として計上されるには出荷、検収、契約条件の履行が必要になるが、量産前の半導体スタートアップにとって、契約額は顧客が設計検証と供給リスクを引き受ける意思を示す材料になる。

同社は、DeepSeek、Qwen、Mamba、Llamaなどのモデルを自社システム上で動かしていると説明している。対象は特定の大規模言語モデルにとどまらず、MoE、長文コンテキスト、エージェント型ワークロードを含むfrontier inference clustersに及ぶ。推論では、入力を読み込むprefillと、回答を1トークンずつ生成するdecodeの両方が遅延、電力、コストを左右する。Etchedはこの2つを同じラック規模システムで処理する設計を掲げている。

評価額50億ドルという数字は、需要の先読みも含んだ価格である。Etchedは2022年創業で、今回の発表時点でも顧客名、価格、出荷数量、独立ベンチマークを公開していない。したがって、50億ドルの評価額は製品の市場支配を意味するものではない。一方で、A0シリコン、顧客検証、署名済み契約、量産準備が同時に示されたことで、同社は研究開発中心の段階から、顧客が導入可否を判断する段階へ移った。

LVIとCSMは、推論の熱とメモリ遅延を直接狙う

Etchedが前面に出した技術は、Low Voltage InferenceとCluster Scale Memoryである。LVIは、演算ブロックを一般的なAIチップの半分未満の電圧で動かす設計だと説明されている。AIチップはFLOPs利用率を上げるほど消費電力と発熱が増え、クロックを下げざるを得ない場面がある。Etchedは、trillion parameter sparse MoEで80%超のPeak FLOPsを熱制限なしに狙うとしている。

この主張は、トランジスタの工夫だけでは成立しない。同社は、分割可能な演算アレイ、回路技術、タイル分割とスケジューリング、電源供給網、VRM、先端パッケージング、冷却板までを一体で設計したと説明している。AI推論のボトルネックがチップ内部の演算だけで決まらない以上、ラック内の電力と熱を含めた設計が性能の上限を決める。

CSMは、HBMとSRAMを組み合わせ、scale-up domain全体で低遅延の共有メモリプールを作る発想だ。HBMは容量と帯域に強いが、decodeで求められる応答性ではメモリ階層とインターコネクトが制約になりやすい。SRAMだけに寄せれば遅延は下げやすいが、容量、歩留まり、熱、コストの課題が大きくなる。Etchedは独自の低遅延・高帯域インターコネクトでこの間を狙うとしており、推論専用チップの競争点を「FLOPsの多さ」から「モデルを止めずに読み書きできるか」へ寄せている。

AD

NVIDIAと同じ土俵は、単体チップではなくラック規模システムだ

Etchedの競争相手として最も分かりやすい名前はNVIDIAだが、実際の土俵はGPU単体ではない。NVIDIAのGB200 NVL72は、36基のGrace CPUと72基のBlackwell GPUを液冷ラックにまとめ、72 GPUのNVLinkドメインを1つの巨大なGPUのように扱う。NVIDIAは、H100比でリアルタイムtrillion-parameter LLM推論30倍、MoE性能10倍、性能/電力25倍を掲げている。

ここで見えてくるのは、NVIDIAが汎用GPU、NVLink、ネットワーク、ソフトウェア、運用管理をまとめ、学習と推論の両方を処理する巨大なプラットフォームを作っている一方、Etchedは推論専用の電圧設計、メモリ設計、ラック設計だけでその一角に挑んでいるという構図である。汎用性で勝つのではなく、frontier modelの推論で遅延、電力、コストを押し下げられるかを問う戦いだ。

AWS Trainiumも同じ流れを示している。AWSはTrainiumを、チップ、サーバー、ネットワーク、ソフトウェア、サービスを一体で作るAIインフラとして説明している。Trainium3 UltraServersは最大144個のTrainiumチップ、362 MXFP8 PFLOPs、20.7TBのHBM3e、706TB/sのaggregate memory bandwidthを掲げる。Groqは推論専用LPUで低遅延のクラウドを売り、Cerebrasはwafer-scaleで4兆トランジスタ、125 petaflopsのWSE-3を前面に出す。推論インフラは、GPUかASICかという単純な分類ではなく、モデル、メモリ、接続、冷却、開発者体験をどこまでまとめて提供できるかの競争になっている。

次に必要なのは、顧客名より再現できる性能開示だ

Etchedの発表には、まだ空白も多い。顧客名、価格、出荷数量、トークン/秒、消費電力あたりの性能、代表モデルごとのレイテンシは公表されていない。同社は今夏に性能とロードマップの追加情報を出すとしているが、現時点で外部から比較できる材料は限られる。10億ドル超の契約がどの時期にどの条件で売上化するのかも、公開資料だけでは確定できない。

ただし、Etchedが今回示した情報は、AIチップ新興企業を評価する基準を具体的にした。設計思想や資金調達だけでは足りず、A0シリコン、顧客検証、製造拠点、初回出荷計画、ラック単位の運用までを同時に見なければならない。とくに推論は、研究所のベンチマークではなく、実際のトラフィック、長いコンテキスト、モデル更新、故障対応、電力制約の中で性能が決まる。

EtchedがNVIDIAの牙城を崩すかどうかは、まだ判断できない。だが、同社のステルス解除は、推論専用AIチップの競争が投資家向けの構想から、顧客がラックを受け入れ、データセンターで検証する段階へ移ったことを示している。今夏の初回出荷と性能開示で、50億ドルの評価額が期待先行なのか、それとも推論インフラの新しい選択肢を示しているのかが問われる。