실제로 출시할 pipeline
Production-ready TFLite workflow 전체 — transfer learning classifier 훈련, 여러 TFLite variant로 변환, 각각 정확도 검증.
패턴: float32 정밀도로 훈련, SavedModel 저장, 그 다음 세 TFLite variant (baseline / dynamic-range / int8) 생성. 타깃 배포에서 정확도 기준 만족하는 가장 작은 variant 골라.
제품에 왜 중요하냐면: Quantized MobileNetV2 classifier가 ~14MB (float32)에서 ~3.5MB (int8)로 줄면서 CPU 3× 빠르게 돌아. Mobile 앱에서 작은 바이너리는 빠른 다운로드, 적은 storage 사용, WiFi 필수냐 셀룰러로 출시 가능이냐의 차이. 학술 숫자가 아니라 실제 비즈니스 제약이야.