テクノロジーと科学の最新の話題を毎日配信中!!

Cohere、2台のGPUで動作する高効率多言語AIモデル「Command A」をリリース

2025年3月16日

カナダのAIスタートアップCohereが、わずか2台のGPUで動作する最新の大規模言語モデル「Command A」をリリースした。23の言語に対応し、GPT-4oやDeepSeek-V3と同等以上の性能と高い効率性を実現したこのモデルは、特に企業向けAI導入のコスト削減と処理速度向上を目指している。

わずか2台のGPUで稼働する効率性が最大の特徴

Command Aの最大の特徴は、そのハードウェア効率性にある。同モデルはNVIDIAのA100またはH100 GPU2台で動作可能ということで、競合する同等レベルのモデルが最大32台のGPUを必要とすることと比較すれば、大幅な削減となる。この効率性は特に、セキュリティ上の理由から社内にAIモデルを配置する必要がある金融や医療などの業界にとって重要な意味を持つ。

Cohereの発表によると、Command Aは最大156トークン/秒の速度でトークンを生成でき、これはGPT-4oの1.75倍、DeepSeek-V3の2.4倍の速度だ。また、初トークン生成時間(time-to-first-token)も6,500ミリ秒と、GPT-4oの7,460ミリ秒、DeepSeek-V3の14,740ミリ秒と比較して高速であることが強調されている。

コンテキスト長(一度に処理できる文脈の長さ)も256,000トークンと業界平均の2倍を実現。これは約600ページの文書に相当し、企業が持つ長大な文書処理に対応できる。前身モデルのCommand R+(128,000トークン、約300ページ相当)からも大幅に拡張されている。

また、ビジネス、STEM、コーディング タスク全体における人間による直接評価でも、より大きく速度に劣るモデルと比較しても同等以上のパフォーマンスを示している。

23言語に対応し、アラビア語で高い精度を実現

Command Aは世界の主要言語23種に対応している。具体的には英語、フランス語、スペイン語、イタリア語、ドイツ語、ポルトガル語、日本語、韓国語、中国語、アラビア語、ロシア語、ポーランド語、トルコ語、ベトナム語、オランダ語、チェコ語、インドネシア語、ウクライナ語、ルーマニア語、ギリシャ語、ヒンディー語、ヘブライ語、ペルシャ語をサポートしている。

特筆すべきは、アラビア語処理におけるパフォーマンスの高さである。英語からアラビア語への応答で98.2%の精度を示し、これはDeepSeek-V3の94.9%、GPT-4oの92.2%を上回る結果となっている。また、アラビア語の方言一貫性を測るADI2スコアでも24.7を記録し、GPT-4oの15.9、DeepSeek-V3の15.7を大きく上回っている。

Cohereによれば、Command Aはユーザーの方言に合わせてアラビア語で回答する能力が、GPT-4oやDeepSeek-V3よりも優れているという。

エンタープライズ向け機能を強化しAIエージェントへの対応を拡充

Command Aは企業ニーズを念頭に設計されており、高度な検索拡張生成(RAG:Retrieval-Augmented Generation)機能を備えている。RAGとは、AIが生成する回答を外部の情報源で補強する技術で、これにより企業内の情報に基づいて検証可能な高精度な応答を生成できる。実際の活用例としては、オフィスの場所ごとの適切な人事ポリシーの提供、法的規制の確認、長大な財務レポートの分析などが挙げられている。

また、エージェンシックツール使用をサポートし、顧客関係管理(CRM)や企業資源計画(ERP)ソフトウェアなどの企業ツールと連携できる。これはCohereのセキュアなAIエージェントプラットフォーム「North」と統合することで、企業システムのファイアウォール内でエージェントがタスクを実行できるようになる。

Cohereの共同創業者Nick Frosst氏は、「私たちはあなたの仕事をより良くするためだけにモデルをトレーニングしています。それは、あなたの心のためのメカニズムに乗り込むような感覚であるべきです。あなたを強化するようにトレーニングしているので、特にその点で優れた感覚を持つはずです」とコメントしている。

API価格と多様な提供形態で柔軟な導入を可能に

Command Aは現在、Cohereプラットフォーム上で利用可能であり、研究用途に限りHugging Face上でオープンウェイト(モデルの重みを公開した形態)として提供されている(Creative Commons Attribution Non Commercial 4.0 International ライセンス下)。また、主要クラウドプロバイダーへの提供も近日中に予定されている。

API価格は入力トークンが100万あたり2.50ドル、出力トークンが100万あたり10.00ドルに設定されている。また、プライベートデプロイメントはAPIベースのアクセスと比較して最大50%のコスト削減が可能とされている。

競争激化するAIモデル市場でのCohereの挑戦

Menlo Venturesが2024年11月に発表した調査によると、企業におけるCohereのシェアは約3%で、OpenAI(34%)、Anthropic(24%)、さらには小規模スタートアップのMistral(5%)と比較しても低い水準にある。しかし、Command AはOracle、Notion、Scale AI、Accenture、McKinseyなどの企業ソリューションに統合されており、今後の成長が期待される。

Cohereチームメンバーのプリトレーニング担当Dwaraknath Ganesanは「過去数ヶ月間取り組んできたものを明らかにできることに非常に興奮しています!Command Aは素晴らしいです。わずか2台のH100 GPUでデプロイ可能!256Kコンテキスト長、拡張された多言語サポート、エージェンシックツールの使用…これは本当に誇りに思えるものです」とコメントしている。

また、CohereのAI研究者Pierre Richemondは「Command Aは、GPT-4o/DeepSeek V3レベルの新しいオープンウェイト111Bモデルで、256Kコンテキスト長を備え、企業ユースケースでの効率性のために最適化されています」と述べている。

Command Aは、そのハードウェア効率性と多言語対応、高速な処理能力により、特に企業の内部デプロイメントにおいて競争力を持つモデルとして位置づけられている。


Source

Follow Me !

\ この記事が気に入ったら是非フォローを! /

フォローする

コメントする