AI 를 자기 자신에게서 구한 주문
AI 에 가장 중요한 로그 항등식:
다시 읽기. 왼쪽은 곱셈, 오른쪽은 덧셈. 로그가 어려운 연산 (작은 float 많이 곱하기) 을 쉬운 거 (그 로그 합) 로 trade. 이건 표기 편의가 아니야 — 엔지니어링 기적.
수치 underflow: 이 항등식이 푸는 버그
Float32 가 약 까지 표현. 0.001 짜리 100 확률 곱:
결과는 수학적으로 작지만 0 아님. Float32 가 어쨌든 0 으로 round. 이제 손실 = , 학습 crash.
로그 먼저: . 완벽 정상 float. 확률 곱하기 대신 로그-확률 합. 끝.
Log-Likelihood 가 곳곳에
이래서 거의 모든 확률 ML 손실에 로그:
- Cross-entropy 손실: — 참 클래스 로그-확률 합.
- 최대 likelihood 추정: X, maximize.
- 언어 모델 학습: 다음 토큰의 negative log-likelihood 최소화, 수백만 토큰 합.
확률 많이 곱해야 하면 로그 먼저 합쳐. 수학 동일; 수치 훨씬 나음.