Term

チャンキング

別名: Chunking

Overview

RAG(検索拡張生成)などのシステムにおいて、膨大なテキストデータをベクトルデータベースに登録する際、意味のある適切な単位(段落や固定文字数など)で分割する作業。分割の仕方は検索精度に直結し、文脈を維持しつつモデルの入力制限に収める必要がある。File Searchのようなマネージドサービスでは、この戦略が自動化されている。

Mentioned Articles

1 件