C.W.K.
Stream
Lesson 02 of 06 · published

중심극한정리: 종 모양이 어디서 오는가

~14 min · clt, sum, convergence, why-bell

Level 0통계 초심자
0 XP0/55 lessons0/14 achievements
0/100 XP to next level100 XP to go0% complete
"종 모양이 등장하는 건 중심극한정리 때문이야. *자연에서 직접 정규인 것은 거의 없어*. *자연의 거의 모든 게 작은 것들의 합* — 그리고 *작은 독립적인 것들의 합은 종이 돼*."

진술, 평이하게

중심극한정리 (CLT) 가 말해: *N 개 독립 동일분포 무작위 변수 (유한 분산) 의 합 (또는 동치로 평균) 을 취하고, 그 합을 표준화 (평균 빼고 표준편차로 나눔) 하면, 결과 분포가 N 이 커질수록 표준 정규에 접근*. 기호로:

(X₁ + X₂ + ... + Xₙ − nμ) / (σ√n) → N(0, 1)    n → ∞ 일 때

*입문 통계학에서 가장 깊은 진술*이야. 기저 X 들이 *어떤 분포에서 와도* — 균등, 지수, 못생긴 비대칭 — *표준화된 합은 여전히 종으로 감*. 그 *보편성*이 정규분포에 *어디에나 있는 성질*을 주는 것.

실생활에서 이게 사주는 것

*많은 실제 양이 많은 작은 독립적 기여의 결과*:

  • 성인 키가 *수많은 유전·발달 요인의 합*.
  • 측정 오차가 *많은 작은 기기·환경 노이즈 소스의 합*.
  • IQ 점수는 *설계상 정규로 구성*되지만, 기저 인지 능력 자체가 *많은 작은 유전·경험 기여의 합*.
  • 잘 설계된 다문항 시험의 점수가 *많은 작은 문항별 결과를 집계*.

CLT 가 *이런 집계가 종 모양으로 보이는 정확한 이유*를 알려줘: *그건 합이고, 많은 작은 독립적인 것의 합은 개별 분포에 상관없이 정규로 수렴*.

이걸 *클릭하게* 만드는 데모

*깊이 비정규인 분포*를 잡아 — 단일 주사위 굴림 결과 같은, {1,2,3,4,5,6} 위에서 균등. 한 굴림의 히스토그램은 *평평하고 명백히 종 모양 아님*. 이제 *N 개 독립 굴림의 합*. *합의 히스토그램이 N 이 커질수록 가시적으로 더 종 모양*. N=30 이면 *이미 완벽한 종에 가까움*. *마법이 아니야; CLT 가 라이브로 작동하는 것*.

전제조건이 떠받치는 기둥

표준 CLT 는 두 가지 요구: *X 들 사이의 독립성*, 그리고 *각 X 의 유한 분산*. 어느 한쪽이 *조용히 실패*하면 *종이 등장 안 함*. *상관된 샘플* (위기 중 금융 수익률, 바이럴 캠페인의 유권자, 발작 중 뉴런) 이 *독립성 위반*; 합의 분포가 *더는 정규 아님*. *멱법칙 꼬리*가 *유한 분산 위반*; *표준화된 합이 정규로 *전혀* 수렴 안 함*. *이 두 전제조건이 종 모양 가정을 믿을지 말지에 대한 시민의 숨겨진 테스트*고 — *정확히 트랙 07 이 자세히 분해할 것*.

Code

CLT 데모: 균등 주사위 합이 종으로 수렴·python
import numpy as np
rng = np.random.default_rng(40)

# CLT 데모: N 개 균등 주사위 굴림 합이 *종 모양*이 되는 걸 봐.
M = 20_000   # N 당 시뮬레이션 '합 실험' 수

for N in (1, 2, 5, 30):
    # M 개 실험, 각각 N 개 독립 주사위 굴림 합.
    rolls = rng.integers(1, 7, size=(M, N))
    sums = rolls.sum(axis=1)
    # Skewness 와 kurtosis 가 N 이 커질수록 *정규 값 (0, 3) 으로 collapse*.
    mean = sums.mean()
    std = sums.std()
    # 표준화된 skewness 점검 (대략).
    skew = ((sums - mean) ** 3).mean() / std ** 3
    kurt = ((sums - mean) ** 4).mean() / std ** 4
    print(f"N={N:>3d}  평균={mean:>6.2f}  std={std:>5.2f}  "
          f"skew={skew:+.3f}  kurt={kurt:.3f}  (정규: skew=0, kurt=3)")

# N=1: 단일 주사위, 균등 — *시각적으로 비정규*.
# N=30: 30개 주사위 합 — *skewness ~0, kurtosis ~3*.
# 같은 주사위; *합이 종 모양이야*, *개별 굴림은 그렇지 않은데도*.
# *그게 CLT 가 눈앞에서 작동하는 것*.

External links

Exercise

본인 인생에서 *많은 작은 독립적 기여의 합* 인 양 하나 찾아 (주간 총 지출, 월간 타이핑 양, 일일 평균 심박 변이도). CLT 직관 확인: *이 양의 분포가 여러 주/달/일에 걸쳐 종 모양으로 보일 거라 예상해*? 그러고 나서 *CLT 전제조건이 위반된 양* 하나 찾아 (상관된 효과 또는 지배하는 단일 요인) 그리고 *거기서는 종 모양을 예상 안 한다는 걸 알아채*.
Hint
CLT yes: 작음 + 독립 + 많음. CLT no: 상관됨, 또는 *한 지배자*, 또는 *두꺼운 꼬리의 개별 기여*.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.