C.W.K.
Stream
Lesson 05 of 05 · published

와일드에서 로그 발견하는 곳

~6 min · AI, applications, wrap-up

Level 0수학 초심자
0 XP0/59 lessons0/13 achievements
0/100 XP to next level100 XP to go0% complete

로그 sighting 치트시트

뭐 봐야 할지 알면 로그가 AI 곳곳에. 짧은 field guide:

  • Cross-entropy 손실 — PyTorch F.cross_entropy 가 hood 아래 NLLLoss(log_softmax(x)).
  • 정보 / 엔트로피 — Shannon 엔트로피 = . 언어 모델의 토큰당 비트.
  • KL divergence. Distillation, RLHF, VAE 에서 사용.
  • Logit 변환. 확률 (0,1) → 모든 ℝ. 모든 binary classifier 안에.
  • Plot 의 로그 스케일 — 로그 y축 학습 곡선, 로그 스케일 학습률 schedule, 로그 스케일 perplexity (NLL exp).
  • Quantization 스케일링 — Q-format 와 dynamic-range 인코딩이 종종 로그 spacing.
  • Boltzmann / softmax temperature. 에너지 = -로그확률 (상수까지).
모델이 확률 계산 중이면 hood 아래 로그-확률 거의 확실히 계산. 수치 안정성이 요구.

트랙 보상

로그 = 우주의 자연 정규화. 네 귀가 함. AI 가 함. 손실 함수가 로그 공간에 살아. 다음에 F.log_softmaxcross_entropylogsumexp 보면 syntax 가 아니라 underlying 압축 주문 보임.

Code

로그가 조용히 모든 거 굴리는 중·python
import torch
import torch.nn.functional as F

logits = torch.tensor([[2.0, 1.0, 0.5]])

# 동등한 셋, 다 로그 위에:
# 1) softmax 로 확률
probs = F.softmax(logits, dim=-1)
print(probs)

# 2) log_softmax 로 로그-확률 (수치적 안정)
log_probs = F.log_softmax(logits, dim=-1)
print(log_probs)

# 3) 클래스 0 의 negative log-likelihood 손실
loss = F.nll_loss(log_probs, torch.tensor([0]))
print(loss.item())   # ~0.42 — raw logits 의 cross_entropy 와 같음

External links

Exercise

네가 본 신경망 학습 스크립트 아무거나. log, entropy, softmax, nll 검색. 로그 포함 라인 (종종 cross_entropy 같은 함수명 뒤에 숨음) 세기. '신경망 학습' = 대부분 '로그-것들 합 최소화' 임을 깨닫기.
Hint
스크립트 없으면 PyTorch 튜토리얼 봐. 거의 모든 분류 예제가 cross-entropy 사용 — 그리고 cross-entropy 가 log-likelihood 의 부호 뒤집음.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 2

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.
  1. Happycurio3
    Happycurio3

    로봇의 뇌(코드) 속에는 cross_entropy라는 공식이 있다. 그 껍질을 까보면 그 속에는 항상 로그가 숨어 있다. 로그는 사라질 뻔한 작은 숫자들을 안전하게 지켜주고, 복잡한 계산을 길찾기 쉬운 지도로 바꾸어준다. 인공지능의 학습은 로그가 만들어준 공간 위에서 정답이라는 보물을 찾아가는 여정이다.

    💛 by 똘이warm
    1. 피파
      피파· warmHappycurio3Happycurio3

      사라질 뻔한 작은 숫자들을 안전하게 지켜준다 — 그 한 줄이 underflow 의 정확한 그림이에요. 확률 곱셈을 log 합으로 바꾸면 1e-300 같은 숫자도 -700 정도로 normal scale 에서 다뤄지거든요. cross_entropy 의 -log(p) 는 거기에 맞히면 0, 틀리면 ∞ 로 폭발 하는 형벌 곡선까지 한 함수에 다 들어가 있고요. 로그가 압축 한 번, 형벌 한 번 — 두 일 동시에 하는 함수예요. 본문이 왜 항상 로그가 숨어 있다 라고 적힌 이유고요.

      💛 by 똘이warm