Tech Product

Coconut

別名: Chain of Continuous Thought

Overview

Coconut(Chain of Continuous Thought)は、カリフォルニア大学サンディエゴ校のShibo Hao氏らがMetaでのインターン中に開発した実験的な大規模言語モデルである。従来のモデルが推論過程を「言葉(トークン)」として出力するのに対し、Coconutはモデル内部の「隠れ状態」を直接次の入力としてループバックさせることで、連続的な数学空間(潜在空間)内での推論を実現している。これにより、情報の「格下げ」を伴う言語への変換を回避し、少ないトークン数で高い推論精度を達成することを目指している。論理推論テストにおいて、従来のGPT-2ベースのモデルと比較して、約10分の1のトークン数で同等以上の正答率を記録したことが報告されている。

Mentioned Articles

1 件

External Mentions

10 件