C.W.K.
Stream
Lesson 04 of 05 · published

업데이트 규율

~14 min · ops, updates

Level 0Downloader
0 XP0/41 lessons0/11 achievements
0/120 XP to next level120 XP to go0% complete

Drift하는 것들

  • Ollama daemon — Major 버전이 기능 (OpenAI compat, Apple의 MLX backend) 추가하고 가끔 default 바꿈.
  • 모델 tagqwen2.5:7b가 한 달 후엔 다른 실제 GGUF로 resolve할 수 있음.
  • Capability — Tool 지원 안 했던 모델이 새 release로 얻을 수 있음.
  • System prompt template — Minor template 변경이 어제 동작했던 Modelfile이 오늘 garbage 만드는 이유.

업데이트 전략

  1. 알려진 cadence (월별)에 Ollama 자체 업데이트 — breaking change 위해 release note 읽어.
  2. Production은 모델 tag pin. qwen2.5 말고 ollama pull qwen2.5:7b-instruct-q5_K_M. 완전 자격 가진 tag가 조용히 움직일 가능성 훨씬 적음.
  3. Daemon 업데이트 후 벤치마크 suite 다시 돌려. Ship 전에 perf regression 잡아.
  4. "Last-known-good" 모델 디스크에 유지. 새 pull이 prompt 깨면 이전 tag로 fallback.

Code

업데이트 + verify·bash
# Ollama 자체 업데이트 (Homebrew)
brew upgrade ollama

# 설치된 각 모델을 최신 tag로 업데이트
for m in $(ollama list | tail -n +2 | awk '{print $1}'); do
  echo "=== updating $m ==="
  ollama pull "$m"
done

# 벤치마크 다시 돌려 — 아무것도 안 변했다고 가정 X
python3 ~/scripts/ollama_bench.py

# 깨졌으면 Ollama downgrade하고 이전 모델 tag pin
Production 코드에서 tag pin·python
# 잘못 — 움직이는 tag, 밑에서 변할 수 있음
adapter = OllamaAdapter(model="qwen2.5:7b")

# 옳음 — 완전 자격, pinned
adapter = OllamaAdapter(model="qwen2.5:7b-instruct-q5_K_M")

External links

Exercise

ollama list 돌려서 짧은 tag로 (예: qwen2.5:7b) pull한 거랑 완전 자격 (qwen2.5:7b-instruct-q4_K_M)으로 pull한 거 식별. 짧은 tag 들 명시적 완전 자격 tag로 다시 pull. ollama show가 안정적 tag 보고하는지 확인.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.