"종 모양이 등장하는 건 중심극한정리 때문이야. *자연에서 직접 정규인 것은 거의 없어*. *자연의 거의 모든 게 작은 것들의 합* — 그리고 *작은 독립적인 것들의 합은 종이 돼*."
진술, 평이하게
중심극한정리 (CLT) 가 말해: *N 개 독립 동일분포 무작위 변수 (유한 분산) 의 합 (또는 동치로 평균) 을 취하고, 그 합을 표준화 (평균 빼고 표준편차로 나눔) 하면, 결과 분포가 N 이 커질수록 표준 정규에 접근*. 기호로:
(X₁ + X₂ + ... + Xₙ − nμ) / (σ√n) → N(0, 1) n → ∞ 일 때
*입문 통계학에서 가장 깊은 진술*이야. 기저 X 들이 *어떤 분포에서 와도* — 균등, 지수, 못생긴 비대칭 — *표준화된 합은 여전히 종으로 감*. 그 *보편성*이 정규분포에 *어디에나 있는 성질*을 주는 것.
실생활에서 이게 사주는 것
*많은 실제 양이 많은 작은 독립적 기여의 결과*:
- 성인 키가 *수많은 유전·발달 요인의 합*.
- 측정 오차가 *많은 작은 기기·환경 노이즈 소스의 합*.
- IQ 점수는 *설계상 정규로 구성*되지만, 기저 인지 능력 자체가 *많은 작은 유전·경험 기여의 합*.
- 잘 설계된 다문항 시험의 점수가 *많은 작은 문항별 결과를 집계*.
CLT 가 *이런 집계가 종 모양으로 보이는 정확한 이유*를 알려줘: *그건 합이고, 많은 작은 독립적인 것의 합은 개별 분포에 상관없이 정규로 수렴*.
이걸 *클릭하게* 만드는 데모
*깊이 비정규인 분포*를 잡아 — 단일 주사위 굴림 결과 같은, {1,2,3,4,5,6} 위에서 균등. 한 굴림의 히스토그램은 *평평하고 명백히 종 모양 아님*. 이제 *N 개 독립 굴림의 합*. *합의 히스토그램이 N 이 커질수록 가시적으로 더 종 모양*. N=30 이면 *이미 완벽한 종에 가까움*. *마법이 아니야; CLT 가 라이브로 작동하는 것*.
전제조건이 떠받치는 기둥
표준 CLT 는 두 가지 요구: *X 들 사이의 독립성*, 그리고 *각 X 의 유한 분산*. 어느 한쪽이 *조용히 실패*하면 *종이 등장 안 함*. *상관된 샘플* (위기 중 금융 수익률, 바이럴 캠페인의 유권자, 발작 중 뉴런) 이 *독립성 위반*; 합의 분포가 *더는 정규 아님*. *멱법칙 꼬리*가 *유한 분산 위반*; *표준화된 합이 정규로 *전혀* 수렴 안 함*. *이 두 전제조건이 종 모양 가정을 믿을지 말지에 대한 시민의 숨겨진 테스트*고 — *정확히 트랙 07 이 자세히 분해할 것*.