가장 간과되는 production 관심사
클라우드 warehouse 가 멋지고 초당 청구. 같은 워크로드가 single-machine DuckDB stack 에서 월 $50, Snowflake 에서 월 $5,000 일 수 있어 — 또는 모양에 따라 반대. 어느 게 어느 건지 아는 게 2026 진짜 데이터 엔지니어의 일부.
DuckDB / Polars on single machine 이 이길 때
- 데이터 disk 에 < 500GB 고 single fat 머신이 워크로드 fit.
- 워크로드가 batch (하루 몇 cron 작업) — 지속 인터랙티브 query 아님.
- 동시성 낮음 (분석가 한 명, 대시보드 몇 개).
- 이미 운영 부담 가졌거나 가지고 싶음.
클라우드 warehouse 가 이길 때
- 많은 분석가와 BI 도구의 많은 동시 query.
- 데이터 > 1TB 또는 연 50% 성장.
- 인프라 안 돌리고 싶음 (DBA 없음, platform 팀 없음).
- Cross-region 복제, 깊은 BI 도구 통합, 자동 scaling 필요.
자주 이기는 중간
Dev 와 ad-hoc 분석엔 local DuckDB; BI 도구가 query 하는 production mart 엔 진짜 warehouse. Storage 공유 (S3 / GCS / R2 의 Parquet), compute layer 가 consumer 에 옳은 거. 이 분리가 dev 비용 0 가깝게 유지하면서 production 이 warehouse 의 동시성 + 신뢰성 받게 함.