/api/generate 쓸 때
/api/generate는 messages array 대신 prompt 문자열 하나 받아. 이런 모양이 맞을 때:
- Fill-in-the-middle (FIM) 코드 자동완성.
suffix필드에 cursor 뒤 코드 박으면 모델이 가운데 채워. - 대화 framing 없이 one-shot completion 원할 때.
- Raw mode (
raw: true) 보내서 모델 chat template 완전 우회 — 커스텀 prompt 형식 가진 fine-tuned 모델에 유용.
FIM이 킬러 use case
코딩 튜닝 모델 (Qwen3-Coder, Code Llama 변형, DeepSeek-Coder)이 FIM 토큰 이해해서 prefix + suffix 주면 함수 가운데 완성해. Continue.dev, Cursor (local 모델 쓸 때), Aider 같은 에디터의 local GitHub-Copilot-스타일 자동완성을 이게 굴리는 거야.
다른 유용한 필드
images— base64 image string array (멀티모달 모델용).options—/api/chat이랑 동일.format—/api/chat이랑 동일.raw— boolean;true면 prompt에 template 안 적용.