많은 production 팀의 default
Apache Airflow (2026.4 기준 2.10) 는 세계에서 가장 많이 배포된 orchestrator. 2014 년 Airbnb 에서 시작, 2019 년 Apache top-level project, Lyft, Stripe, Netflix, Spotify, 그리고 들어본 모든 "data platform team" 의 production 파이프라인 운영. 모델은 task 의 DAG — Directed Acyclic Graph.
3가지 architectural piece
- Webserver / UI — DAG, run, task instance, log 보기.
- Scheduler — DAG 정의 읽고, 뭐 돌릴지 결정, task queue 에.
- Worker / executor — 실제 task 실행. 한 머신엔 local executor; cluster 엔 Celery 또는 Kubernetes.
메타데이터 DB 도 필요 (production 에선 Postgres). Dagster 와 Prefect 가 깎아내리는 마찰이 이거 — Airflow 가 경쟁자보다 배포 부품 많지만, 성숙한 ecosystem (1,500+ provider operator, 거대 커뮤니티) 이 많은 팀에 그 값어치 함.