C.W.K.
Stream
Lesson 02 of 05 · published

68-95-99.7 렌즈

~10 min · 68-95-99.7, empirical-rule, rule-of-thumb, normal

Level 0통계 초심자
0 XP0/55 lessons0/14 achievements
0/100 XP to next level100 XP to go0% complete
"세 숫자 — 68, 95, 99.7 — *대부분 종 모양 주장을 첫눈에 읽기에 충분*해."

경험적 규칙

*어떤 평균 μ 와 어떤 표준편차 σ 의 정규분포에 대해*:

  • 값의 약 68% 가 평균에서 ±1σ 안.
  • 값의 약 95% 가 ±2σ 안.
  • 값의 약 99.7% 가 ±3σ 안.

*세 숫자, 한 규칙*. *종의 대칭 꼬리가 제곱-거리 의미에서 지수적으로 감소*해서, *이 구간이 분포를 점진적으로 더 많이 포착*. *외워두면 표 참조 없이 대부분의 종 모양 통계를 첫눈에 읽기* 가능.

꼬리가 어떻게 생겼는지

*±3σ 밖에는 분포의 0.3% 미만만 남아* — *두 꼬리에 나눠짐* (*각 쪽 약 0.13%*). *±4σ 에서 꼬리당 질량이 약 3만 분의 1*. *±5σ 에서 약 350만 분의 1*. *±6σ 에서 약 10억 분의 1*. *꼬리 확률이 매우 빨리 줄어들어* — *그 얇은-꼬리 속성이 정확히 두꺼운 꼬리 분포가 위반하는 것*, 그리고 *정확히 트랙 07 이 시민 실수를 분해하는 데 이용할 속성*.

실제 통계를 어떻게 읽나

'*30세가 10K 를 50분에 달림; 그게 훈련된 러너 평균 위 2σ*'. 번역: *훈련된 러너의 대략 상위 2.5%* — *의미 있게 강하지만 괴물은 아님*.

'*시험 점수가 평균 위 3.5σ*'. 번역: *약 4,500명에 1명이 이 점수에 도달*. *진정으로 흔치 않음*, *점수 분포가 대략 정규일 때* (잘 설계된 시험 대부분이 *그걸 목표*로 함).

'*시장 변동이 전형에서 6σ*'. 번역: *정규 하 약 10억 분의 1*. *현실 하 번역*: *시장 수익률은 정규가 아니야*; *이런 일이 백억 분의 1 보다 훨씬 자주 일어남*. *6σ 진술이 기술적으로 맞고 운영적으로 호도*.

작동 기술

*68-95-99.7 규칙이 'X-시그마' 주장을 머릿속에서 '인구의 약 Y%' 로 읽게 해줘*. *연습하면 반사적*이 되는 기술 — 그리고 *기술에는 *번역을 떠받치는 종 곡선 가정이 실제로 성립하는지* 잠시 묻는 것이 포함*. *정규 하 6σ 는 10억 분의 1*. *현실 하 자주 그렇지 않음*.

Code

각 시그마 레벨에서의 정규 꼬리 확률·python
import numpy as np
from math import erf, sqrt

# 표준 정규가 z 를 초과할 확률, 한 꼬리.
def one_tail(z):
    return 0.5 * (1 - erf(z / sqrt(2)))

# 각 시그마 레벨의 희귀성 출력 — 한 꼬리와 양 꼬리.
for z in (1, 2, 3, 4, 5, 6):
    p = one_tail(z)
    one_in = 1 / (2 * p) if p > 0 else float('inf')   # 양 꼬리 합
    print(f"z = {z}: 꼬리당 prob = {p:.6e}   total (양 꼬리) ≈ 1 in {one_in:>15,.0f}")

# *희귀성이 자라는 속도에 주목*.
# z=3 에서: ~370 에 1.
# z=4 에서: ~16,000 에 1.
# z=5 에서: ~170만에 1.
# z=6 에서: ~5억에 1.
# *그게 종 곡선의 꼬리*. *두꺼운 꼬리를 가진 실제 데이터는 이 희귀성에 *복종 안 함**
# — *같은 z-값이 훨씬 더 빈번한 사건에 해당할 수 있어*. 트랙 07 이 그 비용을 보일 거.

External links

Exercise

*'시그마' 수치를 인용한 최근 과학 또는 비즈니스 기사* 읽어. *68-95-99.7 규칙으로 σ 를 해당 희귀성으로 번역*. 그러고 나서 *두 번째 질문*: *기저 양이 실제로 정규분포돼 있어*? Yes 면 *희귀성이 의미 있어*. No 면 *σ 진술이 카테고리 에러*고 *실제 희귀성은 다름* — *대개 종이 시사하는 것보다 더 높음*.
Hint
*종이 합리적인 경향이 있는 도메인*: 물리 측정, 생물학 신체 측정, 잘 설계된 설문 응답. *종이 보통 틀린 도메인*: 금융 수익률, 소셜 미디어 지표, 파일 크기, 스트레스 받은 시스템의 응답 시간.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.