detail 은 cost knob 이지 quality knob 이 아니야 (대부분의 경우). low 는 flat 85 token, high 는 patch grid 로 dimension 따라 폭증. 'auto' 는 모델 결정 — batch eval 에선 non-deterministic cost.
Low: 85 token flat
Image 크기 무관 85 token. 일반 UI ('이 사진에 뭐가 있어') 엔 충분. 빠르고 쌈.
High: dimension × detail 로 폭증
32×32 patch tile 로 분할 → 패치당 과금. 큰 이미지에 high 는 수천 token 가능. OCR, dense chart, fine detail 에 필요할 때만.
Auto 의 함정
'auto' 는 모델이 low/high 결정. 합리적 default 지만 — batch eval 에선 같은 input 도 cost 가 달라질 수 있어. Determinism 필요하면 명시.