Term

RAG

別名: 検索増強生成, Retrieval-Augmented Generation, RAG, 検索拡張生成, Retrieval-Augered Generation

Overview

Retrieval-Augmented Generation (RAG) は、大規模言語モデル(LLM)が持つ学習データ以外の外部情報を活用して回答を生成する技術です。ユーザーの質問に関連する文書をベクトルデータベースなどから検索し、その内容をコンテキストとしてLLMに渡すことで、ハルシネーション(事実に基づかない回答)の抑制や、最新情報・専門情報の提供を可能にします。しかし、検索結果をそのままプロンプトに積み込むと入力トークンが膨大になるため、Headroomのようなツールによる情報の選別や圧縮が、コストと精度のバランスを保つ上で重要となっています。

Mentioned Articles

20 件

External Mentions

10 件