GPU 떠나는 세 path
server inference 가 한 deployment target. mobile 과 edge 가 매우 다름. PyTorch 생태계에 dedicated 도구:
- ExecuTorch — PyTorch 의 mobile / edge runtime. iOS, Android, microcontroller 타겟. 옛 PyTorch Mobile 후계자.
- CoreML — Apple 의 on-device ML framework. iOS / macOS 위 max 성능.
coremltools다리 통해 PyTorch 에서 변환. - MLX — Apple Silicon 위 Apple 의 native ML framework. unified memory architecture 둘러 짓기. Mac 또는 iPhone 의 마지막 한 비트 짜낼 때 옳은 선택.
흐름
ExecuTorch 와 CoreML 의 modern path 는 같음: torch.export → backend-specific lowering. ExecuTorch 가 너 app 과 ship 하는 .pte 파일로 lowering. CoreML 이 .mlpackage 로.
MLX 위 두 옵션: PyTorch weight 를 MLX format 으로 변환 (많은 architecture 작동) 또는 model 을 MLX 직접 다시 짜기 (best perf, 근데 porting 노력).