Drift하는 것들
- Ollama daemon — Major 버전이 기능 (OpenAI compat, Apple의 MLX backend) 추가하고 가끔 default 바꿈.
- 모델 tag —
qwen2.5:7b가 한 달 후엔 다른 실제 GGUF로 resolve할 수 있음. - Capability — Tool 지원 안 했던 모델이 새 release로 얻을 수 있음.
- System prompt template — Minor template 변경이 어제 동작했던 Modelfile이 오늘 garbage 만드는 이유.
업데이트 전략
- 알려진 cadence (월별)에 Ollama 자체 업데이트 — breaking change 위해 release note 읽어.
- Production은 모델 tag pin.
qwen2.5말고ollama pull qwen2.5:7b-instruct-q5_K_M. 완전 자격 가진 tag가 조용히 움직일 가능성 훨씬 적음. - Daemon 업데이트 후 벤치마크 suite 다시 돌려. Ship 전에 perf regression 잡아.
- "Last-known-good" 모델 디스크에 유지. 새 pull이 prompt 깨면 이전 tag로 fallback.