C.W.K.
Stream
Lesson 04 of 05 · published

중심극한정리: 왜 벨이 곳곳에

~10 min · CLT, averages, magic

Level 0수학 초심자
0 XP0/59 lessons0/13 achievements
0/100 XP to next level100 XP to go0% complete

마법 트릭

아무 분포 — 균일, 지수, 이상한 커스텀. 많이 sampling. 각 sample 의 평균 계산. 그 표본 평균 의 분포가, 원래 분포 무관하게, sample 크기 자라며 정규분포 접근.

다시 읽어. 원래 분포 무관하게. 그게 중심극한정리. 벨과 무관한 곳에 벨 커브 등장하는 이유.

왜 키가 벨 모양

성인 키 = 수백 유전 요인 + 수천 환경 요인 영향. 각자 = 작은 random 기여. CLT 가 말함: 많은 독립 random 요인 합/평균 = 정규분포로 향함. 키 = 많은 작은 요인의 합이라서 정규. 측정 오차도. IQ 도. 주사위 합도.

ML 함의

  • 왜 가우시안 노이즈 가정 곳곳. 센서 노이즈, 모델 잔차, 배치 평균 — 종종 작은 효과 많이의 합, CLT 가 가우시안 모양 결과.
  • 왜 batch normalization 작동. 배치 위 활성 평균 = CLT 환기 — 배치 평균이 가우시안-스러운 분포.
  • 왜 평균 신뢰구간 정규 기반. 개별 데이터 비-정규여도 충분 sample 의 평균 은 정규-스러움.
CLT = "충분히 평균 내면 거의 다 정규" 인 이유. 카오스 raw 세상에서 벨 모양 질서로의 우주 bias.

Code

비-벨에서 벨 등장·python
import numpy as np

# 미친 듯 비-정규 분포 — 균일 [0, 1]
samples = np.random.uniform(0, 1, size=(100_000, 30))   # 100k 개 30 크기 sample

# 각 sample 평균
sample_means = samples.mean(axis=1)

# 표본 평균 분포가 대략 정규!
print(f"평균의 평균: {sample_means.mean():.3f}")  # ≈ 0.5
print(f"평균의 std : {sample_means.std():.3f}")   # ≈ 1/sqrt(12*30) ≈ 0.053

# sample_means 히스토그램 plot — 벨, 원래 분포가 평평 균일이었는데도.

External links

Exercise

지수 분포 (매우 skewed, 비-벨) 에서 50 크기 sample 10,000 개. 각 sample 평균 계산. 그 평균들 히스토그램. CLT 가 벨 예측.
Hint
np.random.exponential(scale=1.0, size=(10000, 50)).mean(axis=1). 비뚤어진 원본 분포에도 평균-of-평균 히스토그램은 대칭 벨.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.