가설-검정 프레임

"가설 검정은 *축소판 법정*이야: *한 가지에 대한 추정, 그것에 반하는 증거를 찾는 시도, 증거가 임계를 넘었을 때를 위한 결정 규칙*."

구조

Frequentist 가설 검정의 *네 움직이는 부분*:

귀무가설 (H₀): *세상의 디폴트 상태*; 보통 '*효과 없음, 차이 없음, 동전이 공정함*'. *증거가 뒤집기 전에는 참으로 추정되는 것*.
대립가설 (H₁): *증거가 충분히 강하면 받아들일 주장*.
검정 통계량: *H₀ 에 반하는 증거의 강도를 포착하는 데이터에서 계산된 숫자*.
결정 규칙: *임계 (α, 보통 0.05) 위에서 증거가 H₀ 를 기각하기에 충분히 강하다고 간주*.

*프레임이 비대칭*. *H₀ 가 디폴트*; *H₁ 이 도전자*. *증거가 약할 때 H₀ 를 '받아들이는' 게 아니야*; *'기각 못 함'*. *이 표현이 학술적 까탈이 아니야* — *증거를 못 찾는 것과 부정을 확인하는 것이 같지 않다는 사실을 반영*.

법정 비유

트랙 06 이 이걸 명시적으로 만들 거지만, *여기서 예고할 가치 있어*. *법체계가 가설 검정*:

H₀ = 무죄 (*무죄 추정*).
H₁ = 유죄.
검정 통계량 = *검찰 증거의 강도*.
결정 규칙 = *'합리적 의심을 넘어서' = 매우 작은 α*.

*법체계가 α 를 매우 작게 설정한 선택이 *Type I 오류 (무고한 사람 유죄) 가 Type II 오류 (죄인 무죄) 보다 훨씬 더 나쁘다는 판단을 반영*. *프레임은 통계 검정과 같음*; *α 의 보정이 정책 결정*.

가설 검정이 못 하는 것

*가설 검정이 P(H₀ | 데이터) 를 안 줘*. *P(데이터 | H₀) 를 줘* — *귀무가 주어졌을 때 데이터의 확률*. *이 둘은 다름* (*검사의 오류 다시*). *가설 검정은 또한 효과 크기를 안 알려줘* — *오직 증거가 *선택한 α 에서 H₀ 를 기각하기에 충분히 강한지*만*. *통계적으로 유의한 작은 효과와 통계적으로 무의한 큰 효과 둘 다 가능하고, 둘 다 흔함*.

유지할 프레임

*가설 검정은 '증거가 디폴트 가정을 뒤집기에 충분히 강한가?' 라고 묻는 구조화된 절차야*. *'대립이 참인가?' 라고 묻는 절차가 아니야*. *두 질문이 비슷해 보이지만; 같지 않아*. *트랙 06 (법정) 이 이 구분이 가장 시민-관련 일을 하는 곳*; *트랙 08 (베이즈 frame) 이 완전히 뒤집히는 곳*.

Code

동전-공정성 가설 검정, 반복 실행·python

import numpy as np
rng = np.random.default_rng(120)

# 고전 가설 검정: *이 동전이 공정한가?*
# H0: P(앞면) = 0.5
# H1: P(앞면) != 0.5
# N=200 던지기 수집하고 k 앞면 관측.
# 검정 통계량: z = (k/N - 0.5) / sqrt(0.5*0.5/N).

N = 200
p_true = 0.55     # *비밀스럽게, 동전이 살짝 불공정*
for trial in range(3):
    flips = rng.binomial(n=1, p=p_true, size=N)
    k = flips.sum()
    p_hat = k / N
    se = np.sqrt(0.5 * 0.5 / N)     # 귀무 하 SE
    z = (p_hat - 0.5) / se
    print(f"시행 {trial+1}: k={k}/{N}  p_hat={p_hat:.3f}  z={z:+.2f}  "
          f"(|z| > 1.96 → alpha=0.05 에서 H0 기각)")

# *각 시행이 노이즈에 따라 H0 를 기각할 수도 안 할 수도*.
# *검정은 잘 정의됨*; *결정은 시행마다 흔들릴 수 있음*.
# *그게 정확히 'alpha=0.05 에서의 유의' 의 의미*:
# *참인 H0 를 거짓으로 기각하는 5% 비율을 받아들임*.

Exercise

*일상에서 돌릴 만한 가설 검정* 설정. 예시: *'이 카페의 아침 라떼가 실제로 메뉴에 적힌 것보다 큰가?'*. *H0 정의* (라떼가 정확히 광고된 양), *H1* (다름), *어떻게 데이터 수집* (2주에 걸쳐 라떼 열 잔 무게 재기), 그리고 *결정 임계*. *연습은 실제로 실행하는 게 아니야* — *'디폴트 하에서 예상되는 것' 과 '나를 마음 바꾸게 할 것' 을 분리하는 규율 느끼기*.

Hint

*디폴트가 보통 '특별한 효과 없음'*. *규율은 *모든 관측에 업데이트하는 게 아니라 거짓 알람에 대한 본인의 관용에 보정된 증거를 요구*하는 것*.

구조

법정 비유

가설 검정이 못 하는 것

유지할 프레임

Code

External links

Exercise

Progress

댓글 0

구조

법정 비유

가설 검정이 *못 하는 것*

유지할 프레임

Code

External links

Exercise

Progress

가설 검정이 못 하는 것