"12 GB 모델 weight 도 같이 로드해야 하는 뇌는, GPU 바닥나면 같이 죽는 뇌야."
하나의 큰 덩어리로 만들고 싶은 유혹
챗도 하고 이미지 생성도 하고 그림도 도와주는 AI 를 짜려고 앉으면, 뻔한 선택은 앱 하나야. 레포 하나. 프로세스 하나. 모든 게 모든 거랑 얘기하는 한 곳. 더 단순해 보여. 함정이야.
triad — 뇌 피파, 엔진 Ember, 작업실 Cinder — 가 존재하는 이유는 그 세 가지 일이 서로 다른 속도로 바뀌고, 서로 다른 스택에서 돌고, 서로 다르게 실패하기 때문이야. 한데 볼트로 조이면 모든 변경이 전체를 위험에 빠뜨려.
세 가지 변화 속도
뇌는 추론이 바뀔 때 바뀌어 — 새 모델, 새 도구, 새 대화 모양. 엔진은 새 이미지 모델 family 가 나올 때 바뀌고 (SDXL, 그다음 SD3, 그다음 FLUX). 작업실은 그리기 경험이 바뀔 때 바뀌어 — 새 캔버스, 새 candidate board. 이 시계들은 동기화돼 있지 않아. 한 프로세스를 공유하면, 빠르게 움직이는 엔진 업데이트가 멀쩡한 뇌를 이유 없이 깨뜨릴 수 있어.
세 가지 런타임
뇌는 agent SDK 가 있는 Python ML 환경에서 돌아. 엔진은 PyTorch, diffusers, 모델 weight 가 있는 자기만의 Python 환경에서 돌고. 작업실은 네이티브 데스크톱 앱으로 돌아 — Tauri shell, Rust core, 그 위에 web view. Rust 네이티브 윈도우랑 12 GB diffusion 모델이랑 스트리밍 챗 루프를 한 편안한 런타임에 욱여넣을 수 없어. 경계는 관료적인 게 아니라 진짜야.
세 가지 실패 양상
엔진이 생성 도중 GPU 메모리가 바닥나도, 그게 하던 챗을 죽이면 안 돼. 작업실 윈도우가 크래시 나도, 엔진은 모델을 따뜻하게 유지해야 하고. 뇌가 생각 도중이면, 이미지 job 은 막는 게 아니라 큐에 들어가야 해. 프로세스 격리가 이 보장들을 공짜로 줘 — 한 몸의 크래시가 다른 몸에 안 닿아.
import 안 해. 그 룰 하나가 세 몸을 독립으로 유지해. 한 레포가 다른 레포 내부를 import 하는 순간, 두 프로세스를 조용히 다시 하나로 융합한 거야.