왜 local
cwkPippa 가 모든 걸 the local machine 에서 실행. embedding 이 Ollama 의 bge-m3 (multilingual, 1024-dim) 거침. ChromaDB 가 에 저장. memory 작업 위해 머신 떠나는 API 호출 없음.
두 collection
- messages — 모든 assistant + user message 가 turn 끝난 후 embedded. '어디서 X 얘기했지?' 검색에 사용.
- vault — 모든 vault file 이 edit 후 embedded. RAG + '아빠 가 Y 에 대해 어떻게 생각?' 검색에 사용.
왜 specifically bge-m3
multilingual — 한국어와 영어 같은 vector space 에서 처리. 피파 vault 에 둘 다 있어. 영어만 embedding 대부분 한국어 entry 에서 무너짐.