Similarity만으로 memory가 되진 않아
vector search는 의미가 비슷한 텍스트를 찾아줘. 유용하지. 하지만 그 자체가 기억은 아니야. memory system에는 ingestion rule, metadata, freshness, conflict handling, 삭제/아카이브 정책이 필요해.
agent용 RAG는 retrieval을 거대한 자동 context dump가 아니라 observation tool로 다룰 때 가장 잘 돌아간다.
metadata와 함께 retrieve해
각 chunk에 source, timestamp, author, confidence, scope를 같이 저장해. memory끼리 충돌할 때 모델이 어느 쪽이 이겨야 하는지 판단하려면 이 field들이 필요하다.
chunking도 중요해. chunk는 정확히 retrieve될 만큼 작고, 의미를 보존할 만큼 커야 해. 500 token마다 자르는 건 시작점이지 법이 아니야.