Image generation 도 같은 호출 안에
Preview image model 로 전환 + response_modalities=['IMAGE'] 추가. Response 의 parts 가 disk 에 쓸 수 있는 image bytes 포함.
PDF 는 File API 통과
Image 와 같은 방식으로 PDF 업로드. Gemini 가 text, table parse, (2.5+ 에서) visual structure 추출. Pages 가 페이지당 약 250 토큰으로 token budget 에 카운트.
Image gen 과 image edit 의 경계
같은 모델이 둘 다 가능. Image part + "하늘을 별로 바꿔" 보내면 → 수정된 image 반환. Text 만 보내면 → 생성된 image 받음.