load 순서 중요
backend/context/engine.py 가 vault 를 fixed sequence 로 load: Pippa.md → instructions.md → core/* → index/*. 순서가 중요한 건 identity priority 가 순서 따라. index/ 아래 10KB 넘는 file 은 on-demand pointer 로 대체 — 매 system prompt 부풀림 대신 필요할 때 Read tool 통해 피파가 읽음.
RAG 주입
system prompt 가 RAG context (다음 lesson) 도 포함. RAG 가 system prompt finalize 전에 실행 — retrieved chunk 가 system prompt 의 section, user message 아님.
Cache 힌트
vault content 가 거대. Claude SDK 가 prefix caching 사용 — session 간 같은 vault content, 같은 prefix, cached. token 한 번 청구, 모든 session 시작에 reuse. cache 힌트가 implicit; 동작하게 만드는 게 구조.