서버가-아닌-걸 위해 만든 런타임
TensorFlow Lite (TFLite)는 mobile, embedded, edge device에서 TF model 돌려 — 폰, microcontroller, Raspberry Pi, 카메라. Full TF runtime은 수십 MB 무게에 float32 compute 가정. TFLite는 floating-point 하드웨어 없는 프로세서에서 KB 단위 RAM으로 돌도록 깎아낸 거.
Workflow는 두 단계. 먼저 강한 머신에서 full TF/Keras 스택으로 model training. 그 다음 TFLiteConverter로 .tflite FlatBuffer 포맷으로 변환. 결과는 자기완결적 — graph + weight 한 파일에 — device의 TFLite Interpreter가 로드.
LiteRT 이전: TF 2.19+부터
tf.lite.Interpreter가 별도 LiteRT repo의 ai_edge_litert.interpreter로 대체되는 중. TFLite가 자기만의 프로젝트가 되고 있어. 기존 코드는 계속 작동하지만 새 코드는 장기 유지보수 위해 LiteRT 타깃해.