Term

KVキャッシュ

別名: Key-Value Cache, KV Cache, KVキャッシュ

Overview

KVキャッシュ（Key-Value Cache）は、大規模言語モデル（LLM）がテキストを生成する際、過去のトークンの計算結果（KeyとValue）をメモリ上に保持しておく仕組みである。これにより、新しいトークンを生成するたびに過去の文脈を再計算する必要がなくなり、推論速度が大幅に向上する。しかし、文脈（コンテキストウィンドウ）が長くなるほどKVキャッシュのデータ量は肥大化し、HBMの容量を圧迫するため、HBFのような大容量メモリでの管理が期待されている。

Mentioned Articles

7 件

External Mentions

7 件

arXiv ImageWAM: Do World Action Models Really Need Video Generation, or Just Image Editing?
▲ 0 Yuyang Zhang 2026年6月17日
arXiv ReMP: Low-Downtime Runtime Model-Parallelism Reconfiguration for LLM Serving
▲ 0 Haipeng Yuan 2026年6月17日
arXiv Dual Dimensionality for Local and Global Attention
▲ 0 Zhiyuan Wang 2026年6月17日
arXiv SpecGen: Accelerating Agentic Kernel Optimization with Speculative Generation
▲ 0 Jihu Guo 2026年6月16日
arXiv Models Take Notes at Prefill: KV Cache Can Be Editable and Composable
▲ 0 Bojie Li 2026年6月14日
Hacker News Show HN: Rivet – Open-source game server management with Nomad and Rust
▲ 327 NathanFlurry 2023年8月19日
Hacker News How are images compressed? An explanation of JPEG [video]
▲ 103 davidbarker 2022年6月27日

KVキャッシュ

Overview

Mentioned Articles

AIサーバーを増やすほどPC・スマホのメモリが高くなる理由：HBM需要が生んだ逆説的な供給構造

DRAM価格58-63%高騰で浮上するCXLメモリプール、AI推論が次の需要源に変わる

Google、Gemma 4向けに推論速度を最大3倍向上させるMTP(Multi-Token Prediction)ドラフトモデルを公開

DeepSeek V4プレビュー公開、1.6兆MoEで100万トークン文脈を狙う

2027年、NVIDIAのAI製品に採用が予測される「HBF」とは何か？HBMの容量限界を突破する次世代メモリの全貌

Phison、「aiDAPTIV+」を拡張しPC上のAI推論を強化：ノートPCで120Bモデルが動く「エッジAI民主化」の正体

ChatGPTがAppleのXcodeなど一部のサードパーティアプリの内容を読み取ることが出来る様になった

External Mentions