"헤드라인이 *동시에 통계적으로 설득력 있고 통계적으로 무책임하도록 설계됨*. *두 관측을 다 들 수 있는 시민이 조작하기 더 어려움*."
헤드라인 장르
*통계 헤드라인이 *제한된 공간과 *생생할 무한 인센티브 가짐*. *결과가 *숫자를 의미 있게 만드는 수식어를 *벗겨내는 *예측 가능한 패턴 세트*. *시민-통계학자의 일은 *헤드라인이 *실제로 무엇을 주장하는지 결정 *전*에 *누락된 수식어를 정신적으로 복원하는 것*.
흔한 헤드라인 실패
- '평균 X 가 올해 5% 상승' — *가능성 있는 비대칭 분포의 평균 인용*. *시민-번역*: *중앙값이 *훨씬 덜 움직였을 수도 있고, 또는 떨어졌을 수도*. *중앙값 요청*.
- '연구가 X 의 Y 에 대한 유의 효과 발견' — *0.05 미만 p-value*. *시민-번역*: *이게 *많은 검정 중 단일 유의 결과일 수 있음*; *효과 크기가 작을 수 있음*; *재현이 실패할 수 있음*. *효과 크기, 사전-등록 상태, 다중-비교 맥락 요청*.
- 'X 가 Y 년에 한 번 일어남' — *분포 가정 (자주 정규성) 을 밀반입하는 확률 진술*. *시민-번역*: *기저 분포가 두꺼운 꼬리면, X 가 *Y 당 한 번보다 *훨씬 더 자주* 일어날 수 있음*. *분포가 검증됐는지 물음*.
- 'Y 한 사람의 X% 가 Z' — *어느 우주에 걸쳐 평균되는지 거의 명확하지 않은 *조건부 확률*. *시민-번역*: *조건부가 Y 인지 Z 인지 물음*; *둘이 같지 않음*.
- '설문이 X 발견' — *샘플링 과정이 자주 명시되지 않은 *샘플-기반 주장*. *시민-번역*: *누가 응답, 누가 안 했고, *누락된 응답자가 *어떻게 결론 바꿨을지 물음*.
- '성공한 X 가 성공하는 법 알려줌' — *조언 형태의 생존*. *시민-번역*: *같은 전략 시도한 실패자가 어디 있어*? *그들의 데이터 없이, *조언이 *전략의 실제 성공율이 아니라 *생존에 조건부*.
복원 습관
*모든 통계 헤드라인이 *적어도 한 수식어를 복원하도록 정신적으로 재작성 가능*: *평균 대신 중앙값, likelihood 옆 prior, 누락된 샘플, 분포 모양, 효과 크기, 다중-비교 맥락, 생존 필터*. *복원이 *자신의 연구 없이 *완전히 검증 가능한 경우 드뭄*, *근데 *누락된 수식어 식별 행위 자체가 *운영 중인 렌즈-기술*.
복합 렌즈
*복원 습관이 자동이 되면, *대부분 통계 헤드라인이 *첫 읽기에 무너지고 *시민이 알아*. *남은 것들 — *복원을 살아남는 것들 — 이 *engage 할 가치 있는 것*. *렌즈가 *모든 숫자 불신에 관한 게 아니야*; *질문을 살아남는 *작은 분수의 숫자에 도달하는 것에 관한 것*.