"통계적으로 문해한 시민이 *데이터가 실제로 지지하지 않는 숫자를 인용 거부할 권리와 책임 가짐*."
인용의 비대칭
*숫자 인용이 빠름*. *숫자를 의미 있게 만드는 수식어 추가가 느림*. *인용 거부에 *사회적 용기 필요*. *최소 저항의 경로가 *그래서 *수식어 없는 숫자 반복*, *그게 정확히 *물으면 반대했을 시민을 통해 *오정보가 규모로 퍼지는 방식*. *시민-통계학자의 규율은 *숫자가 렌즈 살아남지 못할 때 *최소 저항 경로에 저항하는 것*.
언제 인용
- 모양이 검증됐을 때. *기저 분포가 *대략 종 모양임을 알면 (그리고 *그것에 대한 근거 가짐), *평균이 의미 있고 σ 와 함께 인용 가능*. *인용*: *'IQ 130 이 z = +2, *인구의 대략 상위 2%'*.
- Prior 가 이름 붙었을 때. *Likelihood 옆에 base rate 진술하면, *posterior 가 정직하게 계산 가능*. *인용*: *'이 검사가 99% 정확하지만 *병이 희귀, *그래서 양성 주어졌을 때 *병의 사후확률이 *2% 정도'*.
- 샘플의 필터가 인정됐을 때. *샘플이 필터링됐다면 (대부분 그러함), *그 필터가 이름 붙어 인용하는 게 정직*. *인용*: *'설문 응답자 중 (자기-선택한), *X% 가 Y 라 함'*.
- Trade-off 가 가시화됐을 때. *Type-I-vs-Type-II 결정 인용 시, *양쪽 인용*. *인용*: *'표준 낮추기가 *더 많은 죄인을 유죄로 만들지만 *더 많은 무고도'*.
언제 거부
- 멱법칙-모양 변수의 평균 — *거부, 또는 *중앙값과 상위-백분위 분포로 대체*.
- 효과 크기, 사전-등록 상태, 다중-비교 맥락 없는 p-value — *거부, 또는 *세 수식어 모두 포함*.
- 기저 과정이 두꺼운 꼬리일 때 *얇은 꼬리 모델의 '위험' — *거부, 또는 *모델이 얇은 꼬리 가정한다는 면책 포함*.
- 아무도 이름 안 붙인 prior 를 밀반입하는 'X% 가능성' — *거부, 또는 *prior 이름 붙임*.
- 실패율 무시하는 '성공한 사람이 Z 함' 일반화 — *거부, 또는 *누락된 실패 데이터를 명시적으로 이름 붙임*.
사회적 비용과 *왜 지불할 가치 있는지*
*숫자 인용 거부가 *사회적으로 어색*. *사람들이 *깨끗한 숫자 원하지, *'음, *기저 분포가 멱법칙-모양이라 *평균이 호도...' 가 아니야*. *사회적 요구 만족 유혹이 *실제이고 지속적*. *근데 *부정확한 숫자 인용을 거부하는 시민이, *청중이 그것을 선호해도, *결국 사회 규범을 통계적 정직 쪽으로 옮기는 시민*. *비용이 *작은 사회적 불편으로 지불됨*; *이익이 *장기 정보 품질로 지불됨*.
운영 원칙
*통계적으로 문해한 시민이 *렌즈 실패한 숫자를 인용 거부할 권리와 책임 가짐*. *거부가 *현학이 아니야*; *렌즈-기술이 *사적 취미가 아니라 *사회적 실천이 되는 유일한 방법*. *모든 거부가 *시민의 서클에서 *살짝 더 나은 통계적 대화에 대한 표*. *많은 시민에 걸친 누적 효과가 *통계적 문해가 퍼지는 *유일한 메커니즘*.