M3 Pro 36GB 맥북에서 vLLM을 띄우는 세 경로(CPU backend·vllm-metal·Docker Model Runner)와 단일 스트림 실측, 그리고 왜 혼자 쓰면 Ollama가 더 빠른지까지 정리한 운영자 실측 노트.
매일 하나씩, AI로 똑똑해지기
M3 Pro 36GB 맥북에서 vLLM을 띄우는 세 경로(CPU backend·vllm-metal·Docker Model Runner)와 단일 스트림 실측, 그리고 왜 혼자 쓰면 Ollama가 더 빠른지까지 정리한 운영자 실측 노트.
Begin typing your search term above and press enter to search. Press ESC to cancel.