MLX 가 엔진, 다른 도구가 차체
MLX-as-a-backend 가 이 시점 주요 LLM orchestration framework 에 엮였어. LangChain, LlamaIndex, OpenAI SDK (mlx-lm 의 server 통해, lm 의 lesson 6), 그리고 자라는 dev 도구 리스트에서 MLX 모델 사용 가능. 통합은 보통 framework 의 기존 모델 추상화를 로컬 mlx-lm server 또는 직접 mlx_lm.load 가리키는 얇은 shim.
맞는 질문은 "X 와 함께 MLX 쓸 수 있어?" 가 아냐 — 답이 거의 항상 yes. 맞는 질문은 "내 워크플로에 통합이 가치 있어?". 대부분 프로젝트엔 답도 yes; LLM-orchestration framework 가 RAG 파이프라인, agent loop, chat-history 관리 같은 거 손으로 박는 거 절약. 일부 프로젝트엔 framework 를 그림에 끌어오는 것보다 mlx_lm.generate 직접 호출이 더 솔직하고 디버깅 쉬워.
알 가치 있는 통합
- OpenAI SDK — 어떤 OpenAI 클라이언트 (Python, JS, Cursor, Continue, Aider) 든 로컬 mlx-lm server 가리켜. lm.lesson6 에서 다룸. 이미 OpenAI 말하는 도구에 가장 적은 마찰의 path.
- LangChain — LangChain chain, agent, RAG 파이프라인 안에서 사용 위해 mlx-lm 모델 wrap 하는
ChatMLX통합 가짐. LangChain 에 이미 invest 했으면 유용; MLX 와 말하려고만 채택할 가치 없음. - LlamaIndex — mlx-lm 포함 로컬 LLM provider 가짐. LangChain 이야기와 같은 모양 — 기존 LlamaIndex codebase 안에선 유용, 일회성 사용엔 overkill.
- Ollama (v0.19, 2026-03 부터) — MLX 직접 위에 빌드. Python 전혀 안 박고 "모델 그냥 도는 거" 원하면, Mac 의 Ollama 가 가장 부드러운 경험이고 근본적으로 MLX wrapper.
- LM Studio — 코드 전혀 없이 mlx-lm 모델 도는 데스크탑 GUI. Mac 의 비-프로그래머 사용자에 맞는 도구, 그리고 mlx-lm 이 뭐 하는지 그래픽 view 원할 때 존중할 만한 디버깅 환경.
눈에 띄게 부재한 통합
2026-05 기준 학습-면 ecosystem (DeepSpeed, Accelerate, training-cluster orchestration) 의 MLX-native 등가물이 thin to nonexistent. Mac single-machine 배포 이야기 강함; multi-machine 학습 이야기 아직 진짜 거기 아냐. JACCL (prod.lesson6 에서 짧게 다룸) 이 가장 활동적인 distributed-training 연구 영역이지만 아직 PyTorch distributed-training 도구의 drop-in-replacement 아님.
통합 mental model
MLX 통합을 기존 framework 가 MLX 모델 보게 하는 adapter 로 다뤄. MLX 모델 자체가 상수 — hood 아래 같은 load + generate 모양. Framework wrapper 는 자기 추상화와 MLX 사이 번역만. 통합 이슈 디버깅 시, 첫 move 는 보통 wrapper 건너뛰고 mlx-lm 직접 호출해서 모델 동작 확인 — 버그가 보통 MLX 가 아니라 wrapper 에 있음.