"종 모양은 통계의 슈퍼스타 중 하나야 — 그리고 모든 슈퍼스타가 그렇듯, *안 맞는 곳에서도 자주 끌려나와*."
종 모양이 *실제로 뭔지*
정규분포 (Gaussian — Carl Friedrich Gauss 이름) 는 *두 숫자*로 정의되는 연속 분포: 평균 μ (봉우리 위치) 와 표준편차 σ (종이 얼마나 퍼져 있는지). 확률 밀도가 그 유명한 *종 모양*으로 보여, *완벽히 대칭*, 봉우리는 평균에, 퍼짐은 *오직 σ 가 통제*.
PDF 공식은 위협적으로 생겼지만 *시민에게는 안 중요해*: *시각 직관*이 중요한 거. 종은 양쪽으로 *똑같이* 떨어져; *떨어지는 속도가 σ 에 의해 통제*. 작은 σ = 좁고 높은 종. 큰 σ = 넓고 납작한 종.
왜 그렇게 자주 나오는지 (트랙 03 예고)
트랙 03 에서 유도할 *중심극한정리*가 말해: *많은 작은 독립적 무작위 효과를 합 (또는 평균)* 하면 결과가 *정규처럼 보이는 경향이 있다* — *개별 효과가 어떻게 생겼든 상관없이*. 이게 측정 오차, 성인 키, IQ 점수, 그리고 천 가지 다른 양이 *대략 종 모양 분포*인 이유야.
종 모양은 *자연의 신비로운 보편 법칙*이 아니야. *한 특정 setup 의 수학적 결과*야: 많은 작은 독립적 요인이 합해질 때. 그 setup 이 성립하면 종이 *자동으로 등장*. 성립 안 하면 — 요인들이 상관되거나, 한 요인이 지배하거나, 기저 과정이 *덧셈이 아니라 곱셈*이거나 — 종은 *안 등장*하고, 가정하면 *거짓말해*.
그 유명한 어림셈 규칙
정규분포에서 *68–95–99.7 규칙*이 성립:
- 값의 약 68% 가 평균에서 1σ 안.
- 약 95% 가 2σ 안.
- 약 99.7% 가 3σ 안.
이 렌즈를 트랙 04 가 *날카롭게* 갈 거야: *σ 는 직관적 놀람의 단위*야. 2σ 값은 *적당히 놀라움*; 3σ 는 *매우 놀라움*; 5σ 또는 6σ 는 *정규 가정 하에 사실상 불가능*. 실제 데이터에서 5σ 사건이 *자주* 일어나면 그 데이터는 *정규가 아니야* — 끝.