C.W.K.
Stream
Lesson 05 of 05 · published

왜 벨이 다스리고 — 어디서 거짓말하는지

~6 min · assumption, limitations, wrap-up

Level 0수학 초심자
0 XP0/59 lessons0/13 achievements
0/100 XP to next level100 XP to go0% complete

우주가 벨 사랑

CLT 가 왜 많은 자연 현상이 벨 모양인지 설명: 작은 독립 요인이 많이 합쳐지면 벨. 세상의 대부분이 그래. 그래서 default 로 가우시안 가정 곳곳 — 센서 노이즈, 예측 오차, 모델 잔차, VAE 의 잠재 변수.

근데 숭배 X

어떤 실제 분포는 정규 X:

  • 소득, 부, 도시 인구 — 멱법칙 / 로그정규. 긴 무거운 꼬리.
  • 단어 빈도 — Zipf 법칙, 역시 멱법칙.
  • 주식 시장 수익률 — fat tail. 블랙 스완은 정규분포 안 따름; 따른다고 가정한 게 1998 LTCM 폭발 원인.
  • 혼합 모델의 클러스터 중심 — 이중 또는 다중 모드.

늘 물어: 내 데이터가 진짜 벨처럼 보이나, 아니면 수학이 더 쉬워서 그렇다고 가정?

리스크 모델링 역사. 많은 유명 금융 폭발 (1998, 2008) 이 fat tail 있는 거에 가우시안 가정. "천 년에 한 번" 3-시그마 사건이 매년. 가정 주어졌을 때 수학은 맞음; 가정이 틀림.

트랙 보상

벨 = 우주의 default 모양 — 좋은 이유로. 68-95-99.7, 사과-오렌지 비교용 z-score, 평균이 늘 벨로 가는 이유의 CLT. 근데 늘 체크: 실제 데이터가 수학 wish 보다 무거운 꼬리 있을 수.

External links

Exercise

아무 데이터셋 (CSV, NumPy random, 뭐든). 히스토그램 plot. 벨 모양? Yes 면 정규 fit + 잔차 검사. No 면 물어: 어떤 분포 같아?
Hint
많은 실세계 분포가 right-skewed (소득, 응답시간). 히스토그램이 말함. 정규-fit 잔차가 가정 얼마나 실패하는지 말함.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.