Options block — generation 정밀 컨트롤
모든 generation parameter는 options 객체 아래 살아. 자주 쓰는 거:
temperature— 무작위성 (0 = deterministic, 1.5+ = 카오스). Default 0.8.top_p— Nucleus sampling cutoff. Default 0.9.top_k— Top-K sampling. Default 40.num_ctx— Context window 토큰 (모델마다 다름; 보통 4096; 실전엔 8192 / 16384 / 32768로 올려).num_predict— 최대 생성 토큰.-1= 무제한.repeat_penalty— 반복 토큰 penalty. Default 1.1.seed— 정수; 재현 가능한 run 위해 고정.stop— Stop sequence array.num_gpu— GPU layer 수.999= 전부 GPU.
JSON Schema로 Structured output
format 필드가 JSON Schema 객체 받아. 모델이 그 schema 매칭하는 JSON emit하도록 강제됨. API에서 가장 유용한 기능 중 하나야 — chat 모델을 prompt engineering 없이 typed data extractor로 바꿔.
Options vs Modelfile 언제?
Request의 options가 Modelfile default override해. 안정적인 default는 Modelfile에 박고 (이 variant는 coder; ctx는 항상 16K), temperature, seed, num_predict는 request마다 변화시켜.