"P-value 는 *현대 생활에서 가장 오독되는 숫자 중 하나*야. *그게 *아닌 것*을 이름 붙이는 게 lesson 의 반*."
정의
P-value 는: *귀무가설이 참이라고 가정할 때, 실제 데이터만큼 (또는 더) 극단인 데이터를 관측할 확률*. 형식적으로:
p-value = P(이만큼 극단 또는 더 | H₀ 참)
*작은 p-value 는 귀무가 참이면 관측된 데이터가 가능성 낮다는 의미*. *작은 p-value 가 귀무 기각의 이유를 줘*. *그 자체로 귀무가 참일 확률, 대립이 참일 확률, 효과 크기, 효과의 실용적 중요성, 결과가 재현될지를 알려주지 안 함*.
시민이 하는 오독
가장 흔한 오독: *'p = 0.03 은 귀무가설이 참일 확률이 3% 라는 뜻'*. *틀림*. *그 문장이 조건부를 뒤집어*. *P-value 는 P(데이터 | 귀무), P(귀무 | 데이터) 가 아니야*. *둘을 뒤집는 게 다시 *검사의 오류*.
*P(데이터 | 귀무) 에서 P(귀무 | 데이터) 로 가려면 베이즈 정리와 prior 가 필요* — *정확히 트랙 08 이 할 동작*. *Frequentist p-value 만으로는 그 posterior 를 못 줘*. *대부분 출판된 '통계적으로 유의' 한 결과가 *조용히 그렇게 다뤄짐*, 그리고 그 *조용한 미끄러짐이 현대 과학 재현 위기의 주요 엔진 중 하나*.
'통계적 유의' 가 *실제로 사주는 것*
*'α = 0.05 에서 유의' 가 의미*: *귀무가 참이면 이런 종류의 증거가 무작위 노이즈로 5% 이하 시간에만 나타남*. *효과가 *실제, 큰, 중요한, 재현 가능* 하다는 의미가 아니야*. *데이터가 5% 노이즈 관용에서 귀무와 양립 불가*. *그게 *일상 언어에서 '통계적으로 유의' 가 시사하는 것보다 훨씬 작은 주장**.