우주가 벨 사랑
CLT 가 왜 많은 자연 현상이 벨 모양인지 설명: 작은 독립 요인이 많이 합쳐지면 벨. 세상의 대부분이 그래. 그래서 default 로 가우시안 가정 곳곳 — 센서 노이즈, 예측 오차, 모델 잔차, VAE 의 잠재 변수.
근데 숭배 X
어떤 실제 분포는 정규 X:
- 소득, 부, 도시 인구 — 멱법칙 / 로그정규. 긴 무거운 꼬리.
- 단어 빈도 — Zipf 법칙, 역시 멱법칙.
- 주식 시장 수익률 — fat tail. 블랙 스완은 정규분포 안 따름; 따른다고 가정한 게 1998 LTCM 폭발 원인.
- 혼합 모델의 클러스터 중심 — 이중 또는 다중 모드.
늘 물어: 내 데이터가 진짜 벨처럼 보이나, 아니면 수학이 더 쉬워서 그렇다고 가정?
리스크 모델링 역사. 많은 유명 금융 폭발 (1998, 2008) 이 fat tail 있는 거에 가우시안 가정. "천 년에 한 번" 3-시그마 사건이 매년. 가정 주어졌을 때 수학은 맞음; 가정이 틀림.
트랙 보상
벨 = 우주의 default 모양 — 좋은 이유로. 68-95-99.7, 사과-오렌지 비교용 z-score, 평균이 늘 벨로 가는 이유의 CLT. 근데 늘 체크: 실제 데이터가 수학 wish 보다 무거운 꼬리 있을 수.