하루 한 AI - 매일 하나씩, AI로 똑똑해지기

로컬AI, 학습2026년 06월 03일2026년 06월 03일

KV 캐시가 뭐길래 — 긴 컨텍스트가 빠르게 비싸지는 이유

Claude 200K, Gemini 1M이 왜 갑자기 비싸지는지 KV 캐시의 메모리 구조로 풀었다. 컨텍스트 윈도우와 KV 캐시 크기가 어떻게 연결되는지, GQA·PagedAttention·RadixAttention이 이 문제를 어떻게 다르게 푸는지 한국어로 정리한다.

로컬AI, 학습2026년 05월 29일2026년 06월 02일

M3 Pro에서 vLLM 돌려보기 — Mac 3경로와 솔직한 한계 (2026)

M3 Pro 36GB 맥북에서 vLLM을 띄우는 세 경로(CPU backend·vllm-metal·Docker Model Runner)와 단일 스트림 실측, 그리고 왜 혼자 쓰면 Ollama가 더 빠른지까지 정리한 운영자 실측 노트.

로컬AI, 학습2026년 05월 27일2026년 06월 03일

vLLM은 왜 빠른가 — PagedAttention을 OS 페이징으로 이해하기

vLLM이 왜 빠른지 PagedAttention 원리를 OS 가상 메모리·페이징 비유로 직관적으로 풀었다. KV 캐시 단편화 60~80%를 4% 미만으로 줄이는 구조와 continuous batching, 그리고 vLLM vs Ollama 목적 차이까지.

비교2026년 05월 24일2026년 05월 25일

월 $20 AI 구독 비교: ChatGPT Plus·Claude Pro·Gemini Advanced (2026-05)

월 $20 AI 구독 한 자리, ChatGPT Plus·Claude Pro·Google AI Pro 중 어디? 셋 다 약 ₩29,000(VAT 포함). 글쓰기·코딩·이미지·검색 6축으로 30초에 결정한다. +한국 결제 디테일까지 2026-05-24 기준.

로컬AI, 학습2026년 05월 21일2026년 06월 02일

Ollama로 M3 Pro 맥북에 로컬 LLM 띄우기 — 30분 실측 가이드

M3 Pro 36GB 맥북에서 Ollama로 Llama 3.1 8B를 30분 안에 띄운 운영자 실측 가이드. 설치·Metal GPU 확인·tokens/sec 측정·MLX 함정·36GB 메모리로 가능한 한계까지 1인칭으로 정리했다. (2026-05-21 측정)

비교2026년 05월 17일2026년 05월 21일

Cursor vs Claude Code 결정 트리: 백엔드 개발자가 6개 축으로 골라봤다 (2026)

Cursor vs Claude Code 차이를 작업·환경·비용 6개 축으로 정리한 결정 트리. 한국 백엔드 개발자가 두 도구를 같은 코드베이스에서 써본 2026년 5월 기준 비교와 원화 환산 가격, ‘둘 다 쓰는’ 운영자 결론.

Claude2026년 05월 14일2026년 05월 21일

클로드 이상한 답변? Claude 8가지 증상 진단·해결법 (2026)

Claude(클로드) 답변이 이상하다면? 환각·답변 거부·짧은 응답·번역체·코드 오류 등 8가지 증상별 진단표와 한국어 실전 해결법을 2026년 Sonnet 4.6·Opus 4.7 기준으로 정리한 트러블슈팅 카탈로그.

Claude2026년 04월 29일2026년 05월 21일

Claude 코딩으로 생산성 2배? 내가 매일 쓰는 5가지 활용 패턴 (2026)

Claude로 매일 코딩하면서 자리잡은 5가지 활용 패턴(코드 리뷰·디버깅·새 기능 초안·테스트·한국어 주석/커밋)을 프롬프트 템플릿과 함께 정리. 2배는 후크일 뿐, GitHub 55%·McKinsey 25-30% 정량과 1인칭 헤맴 단편을 함께 담은 2026년 4월 기준 실전 가이드.

Claude, 비교2026년 04월 26일2026년 06월 03일

Claude API 비용 완벽 가이드 2026: 토큰 단가·캐싱·배치 할인 한 번에

Claude API 비용을 토큰 단위로 정확히 계산하는 법. 2026년 4월 기준 Opus·Sonnet·Haiku 단가, Prompt Caching 90%·Batch 50% 할인 stack, Pro 손익분기점, 4가지 실전 시뮬레이션을 한 번에 정리.