kv 캐시 - 하루 한 AI

로컬AI, 학습2026년 06월 03일2026년 06월 03일

KV 캐시가 뭐길래 — 긴 컨텍스트가 빠르게 비싸지는 이유

Claude 200K, Gemini 1M이 왜 갑자기 비싸지는지 KV 캐시의 메모리 구조로 풀었다. 컨텍스트 윈도우와 KV 캐시 크기가 어떻게 연결되는지, GQA·PagedAttention·RadixAttention이 이 문제를 어떻게 다르게 푸는지 한국어로 정리한다.