AIチップのスタートアップである「Etched」は、シリーズAラウンドで1億2,000万ドルの資金を調達したことを報告している。このスタートアップは、AIチップ市場で支配的な地位にあるNVIDIAに対抗する専用AIチップを市場に供給し、新たなリーダーとなることを目指しているという。
160個のNVIDIA H100 GPUに相当するTransfomerの処理能力
ハーバード大学を中退したGavin Uberti氏とChris Zhu氏の2人によって、Appleのお膝元カリフォルニア州クパチーノに2022年に創業されたEtched.aiは、「Sohu」と呼ばれるAIチップを開発している。これは、OpenAIのGPT-4oやGoogleのGeminiと言った大規模言語モデル(LLM)や、DALL-EやStable Diffusionなどの基盤となるニューラルネットワークアーキテクチャの一種「Trnasformer」モデルの駆動に最適化されているという。
Etched.aiのSohuは特定用途向け集積回路(ASIC)であり、特定のアプリケーションを実行するためにカスタマイズされたチップの一種だ。ASICの主な目的は、特定の機能を可能な限り最高の効率で実行する事にある。
SohuはTransfomer特化型ASICとなっており、ディープラーニング推薦モデル(DLRM)や再帰型ニューラルネットワーク(RNN)などの従来のAIモデルのほとんどを実行することはできないが、Trasformerモデルを最大効率で実行するように設計されている。SohuはTSMCの最先端の4nmプロセスを使用して製造され、NVIDIA のGPUやその他のAIチップと比較して、推論性能が大幅に向上していると同社は主張している。また、消費電力も低減されていると述べている。
Etched.aiのUberti氏によれば、SohuはNVIDIAの次世代Blackwell GB200 GPUと比較しても、Transfomerベースのテキスト、画像、ビデオ生成において「桁違いに高速で安価」であるとのことだ。例として、8個のSohuチップを搭載したサーバーは1秒間に50万以上のLlama 70Bトークンを処理できるとしている。同社は、NVIDIA H100 サーバーの公開された MLperf ベンチマークデータを引用して比較を行っているが、それによれば「1台のSohu サーバーが160台の H100 GPU に相当する」とのことだ。
Uberti氏によれば、Sohuの主な革新点は、より合理化された推論用ハードウェアとソフトウェアのパイプラインを持つことにあるという。Transfomerモデルのみを実行することに焦点を当てたことで、Transfomerと関係のないハードウェアコンポーネントを排除できたと説明した。さらに、他の種類のワークロードをデプロイおよび実行できるチップに伴うソフトウェアのオーバーヘッドも排除できたという。
Uberti によると、同社はTSMCと提携してチップを製造しており、シリーズA資金調達は同社でのチップ設計のテープアウトに伴う高コストをカバーするために必要だと説明している。既に同社は「トップベンダー」から高帯域幅メモリ(HBM)とサーバーの供給も確保したと述べているが、これらの企業名は明かされていない。
Transformerの発展にオールインの開発
CNBC とのインタビューで、Uberti氏はAI産業が進化し成長するにつれて、カスタマイズされた省電力AIチップの需要が高まるだろうと述べた。NVIDIA の GPU は非常に強力で汎用性が高いが、その柔軟性はより高いコストとエネルギー使用量を伴うと彼は述べた。「私たちはAIにおいて最大の賭けをしています。Transfomerが消えれば、私たちは消滅します。しかし、Transfomerが存続すれば、私たちは史上最大の企業となるでしょう」。
今回のシリーズAラウンドは Primary Venture Partners が主導し、元PayPalの最高経営責任者であるPeter Thiel氏やAIソフトウェア開発プラットフォームReplitの最高経営責任者であるAmjad Masad氏を含む著名な個人投資家も参加した。同社は今回のラウンド後の評価額を公表しなかったが、2023年3月に540万ドルのシード投資を完了した時点では3,400万ドルと評価されていた。
Sources
コメント