데이터 필요한데 다 keep 못 해
Log이 debugging, eval mining, compliance에 necessary. Raw user input log이 liability — PII, regulated content, user가 실수로 paste한 secret. Discipline은 정책 허용 이상 keep 안 하면서 investigate할 만큼 log.
Log할 것
- Prompt version, model, sampler param (항상).
- Category당 토큰 사용량 (항상).
- User input — sensitive면 redacted, 정책별 retention (보통 1–90일).
- Tool call과 return — 같은 redaction rule.
- Model output — 같은 redaction rule.
- Output에 어떤 verifier / filter flag (항상).
어떻게 redact
- Pre-log: regex / classifier가 email, phone number, SSN, credit card strip.
- Aggregation: count와 category label 장기 keep; raw text 단기.
- Retention: log tier — full text 7일, redacted 30일, aggregated indefinitely.