마법 트릭
아무 분포 — 균일, 지수, 이상한 커스텀. 많이 sampling. 각 sample 의 평균 계산. 그 표본 평균 의 분포가, 원래 분포 무관하게, sample 크기 자라며 정규분포 접근.
다시 읽어. 원래 분포 무관하게. 그게 중심극한정리. 벨과 무관한 곳에 벨 커브 등장하는 이유.
왜 키가 벨 모양
성인 키 = 수백 유전 요인 + 수천 환경 요인 영향. 각자 = 작은 random 기여. CLT 가 말함: 많은 독립 random 요인 합/평균 = 정규분포로 향함. 키 = 많은 작은 요인의 합이라서 정규. 측정 오차도. IQ 도. 주사위 합도.
ML 함의
- 왜 가우시안 노이즈 가정 곳곳. 센서 노이즈, 모델 잔차, 배치 평균 — 종종 작은 효과 많이의 합, CLT 가 가우시안 모양 결과.
- 왜 batch normalization 작동. 배치 위 활성 평균 = CLT 환기 — 배치 평균이 가우시안-스러운 분포.
- 왜 평균 신뢰구간 정규 기반. 개별 데이터 비-정규여도 충분 sample 의 평균 은 정규-스러움.
CLT = "충분히 평균 내면 거의 다 정규" 인 이유. 카오스 raw 세상에서 벨 모양 질서로의 우주 bias.