실전 시그마: IQ, 키, 시험 점수

"σ 렌즈는 *종 곡선 가정이 가장 참에 가까운 곳*에서 가장 강해. IQ, 신체 측정, 잘 설계된 시험 점수가 *교과서 정전*인 이유."

IQ: 고전적인 calibrated 종

IQ 점수는 *설계상 평균 100, σ = 15 의 정규분포를 따르도록 구성*. *그 구성이 요점* — 심리측정학자가 *이 모양을 만드는 정규화를 선택*. *IQ 분포가 종처럼 보이는 게 우연이 아니야*; *종처럼 보이도록 엔지니어링됨*.

이게 주는 것:

IQ 115 → z = +1 → 인구의 상위 ~16%.
IQ 130 → z = +2 → 상위 ~2.5% — *전형적인 '영재' 임계*.
IQ 145 → z = +3 → 상위 ~0.13% — 매우 희귀.
IQ 160 → z = +4 → 상위 ~0.003% — 약 3만에 1.

IQ 의 극단 끝에서는 종 곡선 가정이 *완벽히 참은 아니야* (꼬리가 정규에서 벗어남), 그런데 *−2σ 에서 +2σ 범위에서는 어림셈 해석이 작동할 만큼 가까워*.

성인 키: 자연적으로 종 모양인 양

*단일 인구, 단일 성별, 단일 연령 범위 내의 성인 키는 *놀라울 정도로 정규*. 한국 성인 남성 키, 예를 들어 *평균 ~174cm, σ ≈ 7cm* 주변. *여기서 종이 엔지니어링된 게 아니야* — *인간 키가 많은 작은 유전·발달 요인의 합인 자연적 결과*. *CLT 가 생물학에서 자기 일을 하는 것*.

그래서 188cm 인 한국 남성은 z = +2 — *명확히 큼, 인구의 상위 ~2.5%*. 195cm 에서 z = +3 — *시각적으로 흔치 않음*. 210cm (농구선수 키) 에서 z ≈ +5 — *예외적으로 희귀*.

시험 점수: σ 로 읽도록 엔지니어링됨

*잘 설계된 표준화 시험* (SAT, GRE, TOEFL, 대학 입학시험) 은 *의도적으로 원시 점수를 알려진 평균과 σ 의 정규화된 점수로 변환 가능하도록 구성*. *요점은 '상위 X%' 해석을 의미 있게 만드는 것*. SAT, 예를 들어, *점수의 백분위 순위가 종의 CDF 에 직접 해당하는 척도로 보고*.

*시험이 이를 위해 설계되지 않으면* — *비공식 수업 시험, ad-hoc 설문* — *종을 가정하면 호도할 수 있어*. *σ 렌즈는 여전히 거친 휴리스틱으로 작동*, *그런데 정밀도 저하*.

공통 줄기

*σ 렌즈는 분포가 *진정으로 종 모양*인 양에 대해 calibrated 됐어* — *자연 집계로 (키) 또는 의도적 엔지니어링으로 (IQ, 표준화 시험)*. *이들에 대해 σ-기반 해석이 운영적으로 의미 있어*. *분포가 종 모양이 *아닌* 양에 대해* (소득, 자산 수익률, 파일 크기, 등) *같은 σ 어휘가 산술적으로 적용*되지만 *어림셈 해석이 깨져*. *첫 렌즈-기술은 *어느 종류의 양을 들고 있는지 아는 것*.

Code

세 calibrated 도메인의 σ-기반 백분위 읽기·python

import numpy as np
from math import erf, sqrt

# (평균, sigma) 가 주어졌을 때 정규 값의 백분위.
def pct_below(value, mean, sigma):
    z = (value - mean) / sigma
    return 0.5 * (1 + erf(z / sqrt(2)))

# 실제 값을 *각각의 분포에서의 백분위*로 변환.
cases = [
    ("IQ",                  (100, 15),  [115, 130, 145, 160]),
    ("한국 남성 키 (cm)",     (174, 7),   [181, 188, 195, 210]),
    ("SAT 총점",             (1050, 200), [1250, 1450, 1600]),
]

for label, (mu, sigma), values in cases:
    print(f"\n{label}: mu={mu}, sigma={sigma}")
    for v in values:
        p = pct_below(v, mu, sigma)
        z = (v - mu) / sigma
        print(f"  값={v:>6}  z={z:+.2f}  백분위≈{p*100:6.3f}%")

# 같은 변환 기계; 다른 도메인.
# *σ 렌즈는 분포가 대략 정규인 어떤 양에든 보편적*.
# *비정규 분포에 대해서는 백분위→z 번역이 실패*하고, *다른 렌즈가 필요*
# (트랙 05 의 t-분포, 또는 비모수 도구).

Exercise

*자신에 대해 정량화한 성취* 하나 가져와 (개인 베스트, 시험 점수, 대회 순위). *그 양의 합리적인 peer 그룹의 평균과 σ 추정*. *본인의 z-score 계산*. 그러고 나서 *'상위 X%' 진술로 번역*. *연습은 살짝 어색하게 느껴지도록 의도됨* — *대부분 사람은 자기 성취를 σ-단위로 생각 안 함*, 그런데 *그렇게 하면 peer 비교가 즉시 다루기 쉬워짐*.

Hint

*σ 를 정확히 모르면 본 극단치들로부터 추정*. *peer 그룹 내 최고와 중앙값 사이의 폭이 종종 약 2-3σ*.