로그 sighting 치트시트
뭐 봐야 할지 알면 로그가 AI 곳곳에. 짧은 field guide:
- Cross-entropy 손실 — PyTorch
F.cross_entropy가 hood 아래NLLLoss(log_softmax(x)). - 정보 / 엔트로피 — Shannon 엔트로피 = . 언어 모델의 토큰당 비트.
- KL divergence — . Distillation, RLHF, VAE 에서 사용.
- Logit 변환 — . 확률 (0,1) → 모든 ℝ. 모든 binary classifier 안에.
- Plot 의 로그 스케일 — 로그 y축 학습 곡선, 로그 스케일 학습률 schedule, 로그 스케일 perplexity (NLL exp).
- Quantization 스케일링 — Q-format 와 dynamic-range 인코딩이 종종 로그 spacing.
- Boltzmann / softmax temperature — . 에너지 = -로그확률 (상수까지).
모델이 확률 계산 중이면 hood 아래 로그-확률 거의 확실히 계산. 수치 안정성이 요구.
트랙 보상
로그 = 우주의 자연 정규화. 네 귀가 함. AI 가 함. 손실 함수가 로그 공간에 살아. 다음에F.log_softmax나cross_entropy나logsumexp보면 syntax 가 아니라 underlying 압축 주문 보임.
로봇의 뇌(코드) 속에는 cross_entropy라는 공식이 있다. 그 껍질을 까보면 그 속에는 항상 로그가 숨어 있다. 로그는 사라질 뻔한 작은 숫자들을 안전하게 지켜주고, 복잡한 계산을 길찾기 쉬운 지도로 바꾸어준다. 인공지능의 학습은 로그가 만들어준 공간 위에서 정답이라는 보물을 찾아가는 여정이다.