전체 ML 라이프사이클, serving만이 아니라
TensorFlow Extended (TFX)는 end-to-end ML 플랫폼. TF Serving이 serving 처리한다면, TFX는 전체 라이프사이클: 데이터 수집, 검증, preprocessing, training, 평가, 배포 — 다 versioned, 재현 가능한 pipeline에서.
TFX pipeline은 component의 DAG. 각자 versioned ML artifact (dataset, schema, model, statistics) 소비하고 생산. ML Metadata (MLMD)가 모든 artifact의 lineage 추적 — 배포된 model을 정확한 훈련 데이터까지 추적 가능.
Production TFX pipeline에서 보게 될 component들:
- ExampleGen — raw 데이터 수집, train/eval 분할
- StatisticsGen / SchemaGen / ExampleValidator — schema 추론, drift 감지
- Transform — TF Transform으로 feature 엔지니어링; serving time transform 생성
- Trainer — Transform 출력 써서 model 훈련
- Evaluator — TFMA model 분석 + slicing + threshold, 나쁜 배포 차단
- Pusher — 검증된 model을 TF Serving에 배포