모델은 default로 confident한 거짓말쟁이
Explicit calibration 없이 모델이 맞는 답과 틀린 답 모두에 대해 "I'm sure"라 report해. downstream에서 위험 — 인간이 AI confidence를 signal로 다뤄. Calibration은 reported confidence가 actual 정확도에 match하게 만드는 일이야.
3가지 calibration technique
- Self-reported probability — "confidence (0–1)와 reasoning 명시." 유용한데 거칠어.
- Verbalized uncertainty — "답이 evidence-grounded인지, inferred인지, unknown인지 명시." 종종 numeric보다 유용.
- Sample-vote signal — N개 sample 돌려; 동의 안 하면 그게 uncertainty signal. self-report보다 reliable.
confidence를 router로 써
모델 confidence가 threshold 미만이면 route to: human review, 더 강한 모델, 추가 retrieval, 또는 refusal. UI display로의 confidence보다 routing signal로의 confidence가 더 유용.