"신뢰구간은 *모수에 대한 진술이 아니라 *절차*에 대한 진술*이야."
CI 의 메커니즘
*샘플 잡기, 표본 평균 계산, 표준 오차 계산 (σ/√N), 그리고 구간 구성*:
CI(95%) = 표본 평균 ± 1.96 × SE
그 *±1.96 가 종에서 옴* — *표준 정규 질량의 약 95% 가 −1.96 과 +1.96 사이에 앉음*. *결과가 평균의 95% 신뢰구간*. *산수는 간단*. *해석이 시민을 걸려넘어뜨리는 것*.
시민 오독과 올바른 해석
시민 (그리고 캐주얼하게 많은 과학자) 이 '95% CI [42, 58]' 을 *'참 평균이 42 와 58 사이일 확률이 95%'* 로 읽음. *Frequentist frame 에서 틀림*. *참 평균은 고정되지만 알 수 없는 숫자*; *구간 안이거나 안이거나 둘 중 하나*. *확률이 거기에 직접 적용 안 됨*.
*올바른 frequentist 해석*: *'이 구간을 구성하는 데 쓰인 절차가, 많은 연구에 걸쳐 반복되면, 95% 시간 참 평균을 포함하는 구간을 만들어낼 것'*. *확률이 *절차*에 관한 것* (CI-구성 과정의 *장기 적중률*), *이 특정 구간에 관한 게 아니야*.
*시민에게 실질적 차이는 작아*: *대부분의 합리적 경우, CI 를 참 값의 그럴듯한 범위로 다루는 게 OK*. *수학자가 정확한 표현을 고집하는 건 *시민 해석이 *절차-기반 해석이 가시적으로 유지하는 전제조건* (독립성, 정규성, 큰 N) 을 *조용히 삼키기 때문**.
CI 폭을 결정하는 것
- 표본 크기 N: 큰 N → 작은 SE → 좁은 CI. 의존성 = √N — *CI 폭을 절반으로 하려면 데이터가 4배 필요*.
- 모집단 변동성 σ: *더 변동 큰 데이터 → 큰 SE → 넓은 CI*. *σ 는 못 바꿈*; *더 많은 데이터만 가능*.
- 신뢰 수준: *99% CI 가 95% 보다 넓고, 90% 보다 넓음*. *높은 신뢰는 더 넓은 그물을 사주지만 정밀도는 향상 안 함*.
물어대는 전제조건
베이즈 각주
*'모수가 구간 안일 확률' 해석이 *베이즈 frame 에서 valid*, *근데 *베이즈 credible interval 을 계산할 때만* — *다른 절차, 다른 해석, prior 가 필요*. 트랙 08 이 이걸 다룰 거. *Frequentist CI 와 베이즈 credible interval 이 깨끗한 데이터에 대해 종종 수치적으로 일치*; *해석은 항상 다르고, prior 가 영향력 있으면 숫자도 갈라짐*.