C.W.K.
Stream
Lesson 02 of 05 · published

시민으로서 통계 헤드라인 읽기

~10 min · headlines, media-literacy, citizen-defense, application

Level 0통계 초심자
0 XP0/55 lessons0/14 achievements
0/100 XP to next level100 XP to go0% complete
"헤드라인이 *동시에 통계적으로 설득력 있고 통계적으로 무책임하도록 설계됨*. *두 관측을 다 들 수 있는 시민이 조작하기 더 어려움*."

헤드라인 장르

*통계 헤드라인이 *제한된 공간과 *생생할 무한 인센티브 가짐*. *결과가 *숫자를 의미 있게 만드는 수식어를 *벗겨내는 *예측 가능한 패턴 세트*. *시민-통계학자의 일은 *헤드라인이 *실제로 무엇을 주장하는지 결정 *전*에 *누락된 수식어를 정신적으로 복원하는 것*.

흔한 헤드라인 실패

  • '평균 X 가 올해 5% 상승' — *가능성 있는 비대칭 분포의 평균 인용*. *시민-번역*: *중앙값이 *훨씬 덜 움직였을 수도 있고, 또는 떨어졌을 수도*. *중앙값 요청*.
  • '연구가 X 의 Y 에 대한 유의 효과 발견' — *0.05 미만 p-value*. *시민-번역*: *이게 *많은 검정 중 단일 유의 결과일 수 있음*; *효과 크기가 작을 수 있음*; *재현이 실패할 수 있음*. *효과 크기, 사전-등록 상태, 다중-비교 맥락 요청*.
  • 'X 가 Y 년에 한 번 일어남' — *분포 가정 (자주 정규성) 을 밀반입하는 확률 진술*. *시민-번역*: *기저 분포가 두꺼운 꼬리면, X 가 *Y 당 한 번보다 *훨씬 더 자주* 일어날 수 있음*. *분포가 검증됐는지 물음*.
  • 'Y 한 사람의 X% 가 Z' — *어느 우주에 걸쳐 평균되는지 거의 명확하지 않은 *조건부 확률*. *시민-번역*: *조건부가 Y 인지 Z 인지 물음*; *둘이 같지 않음*.
  • '설문이 X 발견' — *샘플링 과정이 자주 명시되지 않은 *샘플-기반 주장*. *시민-번역*: *누가 응답, 누가 안 했고, *누락된 응답자가 *어떻게 결론 바꿨을지 물음*.
  • '성공한 X 가 성공하는 법 알려줌' — *조언 형태의 생존*. *시민-번역*: *같은 전략 시도한 실패자가 어디 있어*? *그들의 데이터 없이, *조언이 *전략의 실제 성공율이 아니라 *생존에 조건부*.

복원 습관

*모든 통계 헤드라인이 *적어도 한 수식어를 복원하도록 정신적으로 재작성 가능*: *평균 대신 중앙값, likelihood 옆 prior, 누락된 샘플, 분포 모양, 효과 크기, 다중-비교 맥락, 생존 필터*. *복원이 *자신의 연구 없이 *완전히 검증 가능한 경우 드뭄*, *근데 *누락된 수식어 식별 행위 자체가 *운영 중인 렌즈-기술*.

복합 렌즈

*복원 습관이 자동이 되면, *대부분 통계 헤드라인이 *첫 읽기에 무너지고 *시민이 알아*. *남은 것들 — *복원을 살아남는 것들 — 이 *engage 할 가치 있는 것*. *렌즈가 *모든 숫자 불신에 관한 게 아니야*; *질문을 살아남는 *작은 분수의 숫자에 도달하는 것에 관한 것*.

Code

헤드라인 → 시민-번역 cheat sheet·text
헤드라인 → 시민 번역

헤드라인: '평균 가구 소득이 올해 5% 상승'.
번역: '평균이 5% 상승. *중앙값 (전형적 가구) 이 *덜 움직이거나,
      전혀 안 움직였을 수도*. *모양이 가능성 있게 right-skewed*.'

헤드라인: '새 연구가 X 와 Y 사이 *유의 link 발견*'.
번역: '*한 연구의 한 검정에서 p < 0.05*. *효과 크기 미지*.
      *다중 비교, 사전-등록, 재현 미지*.'

헤드라인: '이게 *1,000년에 1번 홍수*'.
번역: '*가정된 정규성 모델 하*. *기저 분포가 두꺼운 꼬리면
      (자연 재해에 전형적), *이게 *헤드라인이 주장하는 것보다 훨씬 더 자주 일어날 수 있음*.'

헤드라인: '*주택 소유자의 75% 가 X 라 함*'.
번역: '*응답한 주택 소유자의 75% 가 X 라 함*. *비응답자가
      *체계적으로 다를 수 있음*. *샘플이 편향됐을 수 있음*.'

헤드라인: '*성공한 CEO 가 이 다섯 특성 공유*'.
번역: '*성공한 CEO 에서 샘플링된 특성*. *실패한 CEO 가 아마
      *비슷한 비율로 같은 특성 가졌을 것*. *조언 형태의 생존*.'

습관: *무엇을 믿을지 결정 전에 *모든 통계 헤드라인을 *이 재작성 layer 로 읽기*.

External links

Exercise

*오늘 만나는 *첫 세 통계 헤드라인 (뉴스, 소셜 미디어, 광고) 가져가*. *각각을 시민-번역 형태로 재작성*: *누락된 수식어가 무엇이고, *수식어가 복원되면 헤드라인이 무엇을 말할까*? *재작성이 완료되고 *재작성된 버전이 여전히 살아남을 때까지 *셋 중 어떤 것도 앞으로 공유 안 함*.
Hint
*대부분 통계 헤드라인이 *재작성을 살아남지 못함*. *복원 습관이 *통계의 책임 있는 소비자이자 전달자 되는 것의 일부*.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.