첫 답은 draft야
reflection은 신비한 자기의식이 아니야. review pass야. agent가 output을 requirement와 비교하고, gap을 찾고, 고치거나 residual risk를 보고한다.
가장 믿을 만한 verification은 tool-based야. test, linter, schema check, DB query, diff inspection. 품질 판단에는 모델을 쓰되, fact 검증은 가능하면 tool로 해.
generator와 reviewer 역할을 분리해
같은 모델을 쓰더라도 generation instruction과 review instruction을 분리해. 위험도가 높으면 다른 모델, deterministic checker, 혹은 사람을 써.
reflection이 무한 polish가 되면 안 돼. review cycle 최대 횟수와 acceptance criteria를 명확히 둬.