신뢰구간: *실제로 뭘 말하는지* · Statistics Fundamentals Quest

"신뢰구간은 *모수에 대한 진술이 아니라 *절차*에 대한 진술*이야."

CI 의 메커니즘

*샘플 잡기, 표본 평균 계산, 표준 오차 계산 (σ/√N), 그리고 구간 구성*:

CI(95%) = 표본 평균 ± 1.96 × SE

그 *±1.96 가 종에서 옴* — *표준 정규 질량의 약 95% 가 −1.96 과 +1.96 사이에 앉음*. *결과가 평균의 95% 신뢰구간*. *산수는 간단*. *해석이 시민을 걸려넘어뜨리는 것*.

시민 오독과 올바른 해석

시민 (그리고 캐주얼하게 많은 과학자) 이 '95% CI [42, 58]' 을 *'참 평균이 42 와 58 사이일 확률이 95%'* 로 읽음. *Frequentist frame 에서 틀림*. *참 평균은 고정되지만 알 수 없는 숫자*; *구간 안이거나 안이거나 둘 중 하나*. *확률이 거기에 직접 적용 안 됨*.

*올바른 frequentist 해석*: *'이 구간을 구성하는 데 쓰인 절차가, 많은 연구에 걸쳐 반복되면, 95% 시간 참 평균을 포함하는 구간을 만들어낼 것'*. *확률이 *절차*에 관한 것* (CI-구성 과정의 *장기 적중률*), *이 특정 구간에 관한 게 아니야*.

*시민에게 실질적 차이는 작아*: *대부분의 합리적 경우, CI 를 참 값의 그럴듯한 범위로 다루는 게 OK*. *수학자가 정확한 표현을 고집하는 건 *시민 해석이 *절차-기반 해석이 가시적으로 유지하는 전제조건* (독립성, 정규성, 큰 N) 을 *조용히 삼키기 때문**.

CI 폭을 결정하는 것

표본 크기 N: 큰 N → 작은 SE → 좁은 CI. 의존성 = √N — *CI 폭을 절반으로 하려면 데이터가 4배 필요*.
모집단 변동성 σ: *더 변동 큰 데이터 → 큰 SE → 넓은 CI*. *σ 는 못 바꿈*; *더 많은 데이터만 가능*.
신뢰 수준: *99% CI 가 95% 보다 넓고, 90% 보다 넓음*. *높은 신뢰는 더 넓은 그물을 사주지만 정밀도는 향상 안 함*.

물어대는 전제조건

*CI 의 커버리지 보장은 CLT 와 같은 전제조건 위에 서*: 독립성과 유한 분산. *상관된 샘플이 너무 좁은 CI 생성* (*절차의 참 적중률이 명목 95% 미만*). *두꺼운 꼬리 데이터가 산수-만 있고 *의미 있는 커버리지 보장이 없는* CI 생성*. *출판된 논문에서 '±X' 를 읽을 때 암묵적 초대는 저자가 전제조건을 검증했다고 믿어달라는 것*. *자주 그렇지 않았어*.

베이즈 각주

*'모수가 구간 안일 확률' 해석이 *베이즈 frame 에서 valid*, *근데 *베이즈 credible interval 을 계산할 때만* — *다른 절차, 다른 해석, prior 가 필요*. 트랙 08 이 이걸 다룰 거. *Frequentist CI 와 베이즈 credible interval 이 깨끗한 데이터에 대해 종종 수치적으로 일치*; *해석은 항상 다르고, prior 가 영향력 있으면 숫자도 갈라짐*.

Code

'95% 신뢰' 가 *실제로 의미*하는 것, 검증·python

import numpy as np
rng = np.random.default_rng(110)

# 95% CI 의 '장기 적중률' 해석 시연.
# 평균 50, std 15 인 정규에서 N=100 의 10,000 샘플 잡기.
# 각 샘플에 대해 평균의 95% CI 계산. 그러고 나서 물어: *얼마의 CI 가 실제로 참 평균 50 을 커버하는가*?

true_mean = 50
N = 100
sigma = 15
M = 10_000

coverage = 0
for _ in range(M):
    sample = rng.normal(loc=true_mean, scale=sigma, size=N)
    sample_mean = sample.mean()
    se = sigma / np.sqrt(N)              # 명확성 위해 알려진 sigma 사용
    low, high = sample_mean - 1.96 * se, sample_mean + 1.96 * se
    if low <= true_mean <= high:
        coverage += 1

print(f"{M:,} 시뮬레이션 연구에 걸친 95% CI 커버리지 비율: {coverage / M * 100:.2f}%")
# *95% 에 가까워야 함*. *그 숫자가 '95% 신뢰' 가 의미하는 것*.
# *많은 반복에 걸친 절차의 속성*, *어떤 단일 구간에 대한 확률 진술이 아님*.

Exercise

*신뢰구간을 보고하는 최근 여론조사 또는 과학 연구* 찾아 (예: '52% 지지, 95% CI [49%, 55%]'). *CI 를 절차-기반 언어로 재진술*: *'이 연구가 같은 조건 하 여러 번 반복되면, 구성된 구간의 95% 가 참 값을 포함할 것'*. 그러고 나서 물어: *어떤 조건 하에서 절차의 적중률이 95% 미만으로 떨어질 수 있나*? *거의 항상: 상관된 응답자 또는 두꺼운 꼬리 결과*.

Hint

*대부분 대중-향 보고가 시민 표현 사용*. *절차 표현이 전제조건 미확인된 구간을 과신하지 않도록 보호*.

신뢰구간: 실제로 뭘 말하는지

CI 의 메커니즘

시민 오독과 올바른 해석

CI 폭을 결정하는 것

물어대는 전제조건

베이즈 각주

Code

External links

Exercise

Progress

댓글 0