M3 Pro 36GB 맥북에서 vLLM을 띄우는 세 경로(CPU backend·vllm-metal·Docker Model Runner)와 단일 스트림 실측, 그리고 왜 혼자 쓰면 Ollama가 더 빠른지까지 정리한 운영자 실측 노트.
Ollama로 M3 Pro 맥북에 로컬 LLM 띄우기 — 30분 실측 가이드
M3 Pro 36GB 맥북에서 Ollama로 Llama 3.1 8B를 30분 안에 띄운 운영자 실측 가이드. 설치·Metal GPU 확인·tokens/sec 측정·MLX 함정·36GB 메모리로 가능한 한계까지 1인칭으로 정리했다. (2026-05-21 측정)