Term

隠れ状態

別名: hidden state

Overview

隠れ状態(hidden state)とは、ニューラルネットワーク、特に再帰型ニューラルネットワーク(RNN)やTransformerの各層において生成される中間的なベクトル表現のことである。入力データが各層を通過する際、モデルが学習した重みに基づいて計算が行われ、その結果が隠れ状態として次の層へ渡される。LLMにおいては、最終層の隠れ状態が次に続くべき最も可能性の高いトークンを予測するための情報源となる。この数値データはモデル内部の「思考」の断片とも言えるものであり、これを言語に変換せずに直接次の入力として利用する手法が、効率的な推論を実現する鍵として注目されている。

Mentioned Articles

1 件