"세 숫자 — 68, 95, 99.7 — *대부분 종 모양 주장을 첫눈에 읽기에 충분*해."
경험적 규칙
*어떤 평균 μ 와 어떤 표준편차 σ 의 정규분포에 대해*:
- 값의 약 68% 가 평균에서 ±1σ 안.
- 값의 약 95% 가 ±2σ 안.
- 값의 약 99.7% 가 ±3σ 안.
*세 숫자, 한 규칙*. *종의 대칭 꼬리가 제곱-거리 의미에서 지수적으로 감소*해서, *이 구간이 분포를 점진적으로 더 많이 포착*. *외워두면 표 참조 없이 대부분의 종 모양 통계를 첫눈에 읽기* 가능.
꼬리가 어떻게 생겼는지
*±3σ 밖에는 분포의 0.3% 미만만 남아* — *두 꼬리에 나눠짐* (*각 쪽 약 0.13%*). *±4σ 에서 꼬리당 질량이 약 3만 분의 1*. *±5σ 에서 약 350만 분의 1*. *±6σ 에서 약 10억 분의 1*. *꼬리 확률이 매우 빨리 줄어들어* — *그 얇은-꼬리 속성이 정확히 두꺼운 꼬리 분포가 위반하는 것*, 그리고 *정확히 트랙 07 이 시민 실수를 분해하는 데 이용할 속성*.
실제 통계를 어떻게 읽나
'*30세가 10K 를 50분에 달림; 그게 훈련된 러너 평균 위 2σ*'. 번역: *훈련된 러너의 대략 상위 2.5%* — *의미 있게 강하지만 괴물은 아님*.
'*시험 점수가 평균 위 3.5σ*'. 번역: *약 4,500명에 1명이 이 점수에 도달*. *진정으로 흔치 않음*, *점수 분포가 대략 정규일 때* (잘 설계된 시험 대부분이 *그걸 목표*로 함).
'*시장 변동이 전형에서 6σ*'. 번역: *정규 하 약 10억 분의 1*. *현실 하 번역*: *시장 수익률은 정규가 아니야*; *이런 일이 백억 분의 1 보다 훨씬 자주 일어남*. *6σ 진술이 기술적으로 맞고 운영적으로 호도*.