*언제 숫자 인용하고 언제 거부할지* · Statistics Fundamentals Quest

"통계적으로 문해한 시민이 *데이터가 실제로 지지하지 않는 숫자를 인용 거부할 권리와 책임 가짐*."

인용의 비대칭

*숫자 인용이 빠름*. *숫자를 의미 있게 만드는 수식어 추가가 느림*. *인용 거부에 *사회적 용기 필요*. *최소 저항의 경로가 *그래서 *수식어 없는 숫자 반복*, *그게 정확히 *물으면 반대했을 시민을 통해 *오정보가 규모로 퍼지는 방식*. *시민-통계학자의 규율은 *숫자가 렌즈 살아남지 못할 때 *최소 저항 경로에 저항하는 것*.

언제 인용

모양이 검증됐을 때. *기저 분포가 *대략 종 모양임을 알면 (그리고 *그것에 대한 근거 가짐), *평균이 의미 있고 σ 와 함께 인용 가능*. *인용*: *'IQ 130 이 z = +2, *인구의 대략 상위 2%'*.
Prior 가 이름 붙었을 때. *Likelihood 옆에 base rate 진술하면, *posterior 가 정직하게 계산 가능*. *인용*: *'이 검사가 99% 정확하지만 *병이 희귀, *그래서 양성 주어졌을 때 *병의 사후확률이 *2% 정도'*.
샘플의 필터가 인정됐을 때. *샘플이 필터링됐다면 (대부분 그러함), *그 필터가 이름 붙어 인용하는 게 정직*. *인용*: *'설문 응답자 중 (자기-선택한), *X% 가 Y 라 함'*.
Trade-off 가 가시화됐을 때. *Type-I-vs-Type-II 결정 인용 시, *양쪽 인용*. *인용*: *'표준 낮추기가 *더 많은 죄인을 유죄로 만들지만 *더 많은 무고도'*.

언제 거부

멱법칙-모양 변수의 평균 — *거부, 또는 *중앙값과 상위-백분위 분포로 대체*.
효과 크기, 사전-등록 상태, 다중-비교 맥락 없는 p-value — *거부, 또는 *세 수식어 모두 포함*.
기저 과정이 두꺼운 꼬리일 때 *얇은 꼬리 모델의 '위험' — *거부, 또는 *모델이 얇은 꼬리 가정한다는 면책 포함*.
아무도 이름 안 붙인 prior 를 밀반입하는 'X% 가능성' — *거부, 또는 *prior 이름 붙임*.
실패율 무시하는 '성공한 사람이 Z 함' 일반화 — *거부, 또는 *누락된 실패 데이터를 명시적으로 이름 붙임*.

사회적 비용과 왜 지불할 가치 있는지

*숫자 인용 거부가 *사회적으로 어색*. *사람들이 *깨끗한 숫자 원하지, *'음, *기저 분포가 멱법칙-모양이라 *평균이 호도...' 가 아니야*. *사회적 요구 만족 유혹이 *실제이고 지속적*. *근데 *부정확한 숫자 인용을 거부하는 시민이, *청중이 그것을 선호해도, *결국 사회 규범을 통계적 정직 쪽으로 옮기는 시민*. *비용이 *작은 사회적 불편으로 지불됨*; *이익이 *장기 정보 품질로 지불됨*.

운영 원칙

*통계적으로 문해한 시민이 *렌즈 실패한 숫자를 인용 거부할 권리와 책임 가짐*. *거부가 *현학이 아니야*; *렌즈-기술이 *사적 취미가 아니라 *사회적 실천이 되는 유일한 방법*. *모든 거부가 *시민의 서클에서 *살짝 더 나은 통계적 대화에 대한 표*. *많은 시민에 걸친 누적 효과가 *통계적 문해가 퍼지는 *유일한 메커니즘*.

Code

*인용-또는-거부 결정 트리*·text

*인용 / 거부 결정 트리*

*통계 인용 유혹을 받을 때*:

  1. *분포 모양이 무엇? 종 vs 멱법칙*?
     - *종*: *평균 인용 OK (σ 와 함께)*.
     - *멱법칙*: *평균 거부; *중앙값이나 상위-백분위 인용*.

  2. *Prior / base rate 가 명확*?
     - *Yes*: *prior + likelihood + posterior 인용*.
     - *No*: *거부, 또는 누락된 prior 이름 붙임*.

  3. *샘플의 필터가 알려짐*?
     - *Yes*: *필터가 명시된 채 인용*.
     - *No*: *거부, 또는 모르는 것 표면화*.

  4. *Trade-off 가 청중 머릿속에서 대칭*?
     - *Type-I-vs-II*: *양쪽 인용*.
     - *확증 맥락*: *무엇이 falsify 할지 이름 붙임*.

  5. *Lesson 2 의 재작성 했어*?
     - *Yes*: *재작성된 버전이 인용할 것*.
     - *No*: *재작성 먼저; *결과만 인용*.

*다섯 질문 모두 통과하면, 인용*.
*어느 것이라도 실패하면, 거부 — 또는 인용 전에 자격*.
*거부가 *렌즈가 운영 중임을 알리는 시민의 신호*.

Exercise

*지난 달 누군가에게 인용한 *통계 하나 고르기*. *인용/거부 결정 트리에 돌리기*. *통과해*? *아니면, *자격된 버전이 어떻게 들릴까*? *원래 인용한 사람에게 (적절하면) *자격과 함께 후속 보내기*. *규율이 불편*; *서클에 대한 누적 효과가 엄청남*.

Hint

*캐주얼하게 인용된 대부분 통계가 *트리 실패*. *규율이 *다음 인용으로 시작*하지, *모든 이전 것을 사후적으로 고치려고 시도하는 게 아니야*. *Forward-only 거부가 *시민의 *더 나은 통계적 대화에 대한 기여를 옮기기에 충분*.

언제 숫자 인용하고 언제 거부할지

인용의 비대칭

언제 인용

언제 거부

사회적 비용과 왜 지불할 가치 있는지

운영 원칙

Code

External links

Exercise

Progress

댓글 0

인용의 비대칭

언제 인용

언제 거부

사회적 비용과 *왜 지불할 가치 있는지*

운영 원칙

Code

External links

Exercise

Progress

사회적 비용과 왜 지불할 가치 있는지