2026 년에 실제로 만지는 것
연구와 production 작업의 dominant frontend 는 PyTorch. JAX 는 연구 중심 lab (Google DeepMind, Apple ML) 에서 강한 추종자가 있어. TensorFlow 는 일부 legacy system 에 여전히 ship. 대부분의 학습자와 팀에게 PyTorch 를 깊이 배우는 게 가장 leverage 높은 선택이야.
Hugging Face 가 PyTorch 위에 pretrained model 의 de-facto distribution layer 로 앉아 있어. transformers 는 text/vision/multi-modal, diffusers 는 image/video generation, datasets 는 streaming/processing, accelerate 는 multi-GPU/mixed-precision boilerplate.
Inference 는 별도 stack 이야. vLLM 과 TGI 는 high-throughput LLM serving. ONNX Runtime 과 TensorRT-LLM 은 production. llama.cpp 와 Ollama 는 local quantized model. MLX 는 Apple Silicon native.
경계에 사는 것들
Experiment tracking — Weights & Biases, MLflow, plain JSON. Hyperparameter search — Optuna, Ray Tune. Retrieval 용 vector storage — FAISS, ChromaDB, Qdrant. 각각 작은 라이브러리고 focused job 을 풀어 — 각각 하나씩 골라서 일관되게 써.