네이티브 PDF 지원
Claude가 document 타입 콘텐츠 블록으로 보내면 PDF 직접 읽을 수 있어. 모델이 텍스트랑 visual 요소(테이블, figure) 둘 다 parse. 대부분 문서 — 계약서, 논문, 매뉴얼 — 에 마찰 가장 적은 길.
Files API는 재사용용
같은 PDF가 많은 턴 먹이면 Files API로 한 번 업로드하고 매 턴 file_id로 참조. 대역폭과 지연 절약. Trade-off는 업로드 단계랑 옛 파일 cleanup 잊지 않기.
스캔 PDF엔 OCR fallback
Born-digital PDF가 네이티브로 잘 동작. 무거운 스캔 PDF(특히 옛 계약서)는 가끔 텍스트 추출 fail — 보내기 전에 Tesseract나 managed OCR service로 preprocess, 또는 layout 중요하면 페이지마다 vision 블록.
원칙: One-shot 읽기엔 네이티브 PDF, 재사용 자산엔 Files API, 레거시 paper 세계엔 OCR fallback.