90%コスト削減も？AIを劇的に効率化する「Chain of Draft」とは

2025年3月4日

当記事のリンクにはアフィリエイト広告が含まれています。

Zoom Communicationsの研究チームが開発した「Chain of Draft（CoD）」と呼ばれる新しいAI推論手法により、大規模言語モデル（LLM）の運用コストを最大92%削減しながら、精度を維持または向上させることが可能になった。この技術は特に企業のAI導入において、高コストと応答遅延という二つの大きな障壁を解消する可能性を秘めている。

人間の思考過程を模倣した効率的なAI推論

大規模言語モデル（LLM）は、複雑な推論タスクにおいて目覚ましい成果を上げているが、その計算コストと応答遅延が課題となっている。従来の手法である「Chain-of-Thought (CoT) 」は、段階的な推論によってAIの性能を向上させる一方で、冗長な説明生成により計算資源を大量に消費していた。

今回新たに提案された「Chain of Draft（CoD）」は、人間が複雑な問題を解決する際のアプローチからインスピレーションを得ている。人間は数学問題やロジックパズルに取り組む際、すべての詳細を言語化するのではなく、重要なポイントのみを簡潔なメモとして書き留める傾向がある。CoDはこの行動パターンを模倣し、AIに各推論ステップを最大5語程度の簡潔な表現に制限するよう指示する。

「複雑なタスクを解決する際、私たちは数学問題を解いたり、エッセイを書いたり、コーディングをする場合でも、進捗に役立つ重要な情報だけをメモします。この行動を模倣することで、LLMは冗長な推論なしに解決策に向かって効率的に進めるようになります」と研究者たちは説明している。

印象的な性能改善とコスト削減効果

従来の推論手法である「Chain of Thought（CoT）」が詳細なステップバイステップの思考過程を重視するのに対し、CoDはミニマリスト的なアプローチを取る。例えば、ある算術問題では：

標準的なプロンプト：「8」（直接答えを出力）
Chain of Thought：「最初、ジェイソンは20個のロリポップを持っていました。デニーに何個か渡した後、ジェイソンには12個のロリポップが残っています。ジェイソンがデニーに渡したロリポップの数を見つけるには、初期の数から残りの数を引く必要があります…」（詳細な説明）
Chain of Draft：「20 – x = 12; x = 20 – 12 = 8」（簡潔な式のみ）

と、かなり簡潔になっているのが見て取れるだろう。

CoDは、CoTと同様に段階的な推論を行うプロンプトを使用するが、各ステップにおける単語数を最大5語に制限する。このシンプルな変更により、CoDは推論の正確性を維持しつつ、大幅な効率化を実現するのだ。

研究チームは複数のベンチマークテストでCoDの有効性を検証した。算術推論（GSM8k）、常識推論（日付理解とスポーツ理解）、記号推論（コインフリップタスク）など様々なタスクでCoDは従来のCoTと同等以上の精度を維持しながら、トークン数を大幅に削減した。

特に注目すべき結果として、Claude 3.5 Sonnetがスポーツ関連の質問を処理した例では：