Fallback이 핵심인 이유
가장 유용한 local AI 패턴은 어디서나 local 아니라 — local-first에 cloud fallback. Local이 80–95% 작업을 공짜로, privacy 가지고 처리. Cloud가 local이 못 하는 나머지. Orchestrator가 호출별로 transparent하게 고름.
네 vessel 패턴 (피파)
피파가 orchestrator 하나 뒤에 네 AI vessel 돌려: Claude (primary, frontier reasoning), Codex (alternative, ChatGPT Pro OAuth), Gemini (third, Cloud Code Assist), Ollama (local fallback). Orchestrator가 다음 기준으로 선택:
- 명시적 user 선택 ("이 turn은 Codex 써").
- Health check ("Claude 지금 degraded → Codex 시도").
- 비용 / privacy ("이건 heartbeat job → local").
- Capability ("vision 필요 → Gemini나 local Gemma").
Orchestrator는 의도적으로 단순
NDJSON이나 SSE나 tool argument 형식 몰라. 아는 거: vessel A 시도; A의 health check 나쁘거나 A가 throw하면 vessel B 시도. Adapter가 provider 디테일 흡수해서 orchestrator를 단순하게 유지.