마무리: 도구는 *자기 전제조건에 정직*해

"Frequentist 도구상자는 *강력하고 자기 전제조건에 정직*해. *전제조건 확인 없이 쓰는 시민은 *강력한 도구를 정직하지 않게 쓰는 것*."

이 트랙이 정착시킨 것

여섯 lesson, 한 도구상자. *신뢰구간 (구간-구성 절차의 장기 적중률), 가설 검정 (디폴트를 뒤집기에 증거가 충분히 강한지 묻는 구조화된 절차), p-value (P(데이터 | 귀무), P(귀무 | 데이터) 가 아님), p-hacking (분석 파이프라인 내부의 선택 편향), 그리고 Type I / Type II 비대칭 (모든 검정에 박힌 정책 결정)*. *합쳐서 *frequentist 작업장*.

*모든 도구가 CLT 가 이름 붙인 같은 전제조건 위에 서*: *독립성과 유한 분산, 그리고 종이 적용될 충분히 큰 N*. *이들이 성립할 때 도구가 잘 정의되고 운영적으로 유용*. *성립 안 할 때 도구는 여전히 숫자 출력* — *근데 숫자가 *과학적 의미 없는 산수**.

트랙 06 으로의 다리

트랙 06 이 *가설-검정 프레임을 그 시민-관련 응용으로* 바꿈: *법정*. *거기*:

H₀ = 무죄.
H₁ = 유죄.
*'합리적 의심을 넘어서' = α 가 매우, 매우 작게 설정*.
*Type I / Type II 비대칭이 최대 강도* — *무고한 사람 유죄가 재앙; 죄인 무죄가 받아들일 만한 비용*.

*'왜 저 괴물을 풀어주냐?' 프레임이 Type II 오류 (죄인이 풀려나는 것) 에 고착하고 *시스템이 그 주변에 세워진 의도적·원칙적 Type I 회피에 눈멈*. *비대칭이 이름 붙는 순간 불만이 녹아 사라짐*. *시스템이 *설계된 일을 한 것*.

트랙 08 로의 다리

트랙 08 (베이즈 프레임) 이 *같은 가설-검정 퍼즐을 베이즈 엔진으로 돌려*. *P(유죄 | 증거) 가 계산 가능해지지만, *오직 prior P(유죄) 와 함께만* — *법체계가 *정치적으로 독성이라 명시적 진술을 신중히 회피*하는 것*. *Frequentist 프레임이 *P(유죄 | 증거) 를 *아예* 계산 거부함으로써 prior 문제 회피*; *베이즈 프레임이 그걸 받아들이고 prior 에 대한 정직 강제*. *두 프레임 다 합법*; *둘 사이의 대화가 시민의 기술*.

가지고 가

*Frequentist 도구상자가 *하는 것과 안 하는 것에 정직*. *대부분 시민 오용이 *답하지 않는 질문에 대한 답으로 출력을 읽는 데서 옴**. *P-value 는 P(귀무 참) 이 아니야*. *CI 는 '모수가 여기 있을 확률' 이 아니야*. *통계적 유의는 *효과 크기나 중요성이 아니야*. *이 구분 유지하면 이미 *모달 오독에서 분리됨*. *트랙 06 이 도구상자를 법정에 향함*; *트랙 08 이 프레임을 완전히 뒤집음*. *셋 사이 대화가 quest 나머지가 가는 렌즈*.

Code

Frequentist 출력 cheat-sheet: IS vs NOT·python

# 종합 cheat-sheet: 각 frequentist 출력이 *뭐고, 뭐가 아닌지*.
print("""
FREQUENTIST 출력         IS (참)                            NOT (아님)
---------------------    -------------------------------   --------------------------------
p-value                  P(이만큼 극단 | H0 참)             P(H0 참 | 데이터)
95% CI                   방법의 장기 95% 적중률              '모수가 여기 있을 확률 95%'
'0.05 에서 유의'          거짓 알람 관용 = 5%               대립이 참이라는 증거
Type I 오류율 (a)         P(H0 기각 | H0 참)                 기각이 주어졌을 때 P(H0 참)
Power (1 - b)            P(H0 기각 | H1 참)                 '효과가 실재일 가능성'
""")

# 이 cheat-sheet 출력하고 *숫자에서 통계 주장을 만들 때마다 재읽기*.
# *'NOT' 열이 시민이 조용히 invoke 하는 것*이고, *다음 두 트랙 (06, 08) 이 분해할 것*.
""""""

Exercise

*다음 24시간 동안 만나는 모든 통계적 주장* 리스트 만들기 (뉴스, 팟캐스트, 논문, 광고, 대화). *각각에 대해 묻기*: *이게 p-value, CI, 효과 크기, 또는 모호한 '유의' 주장?* *각각에 대해 cheat-sheet 의 IS 열을 써서 정밀하게 재진술*. *얼마나 많은 진술이 일상 언어로 말해질 때 *IS NOT 열로 조용히 미끄러지는지* 알아채봐*.

Hint

*대부분 일상 통계 대화가 IS NOT 열에 있어*. *규율은 *pedant 되지 않으면서 미끄러짐을 인식*하는 것* — *목표는 보정이지 trivialities 가 아니야*.

마무리: 도구는 자기 전제조건에 정직해