"CLT 는 *전제조건이 성립할 때만* 신뢰할 만해. *대부분 실제 데이터에서 전제조건이 조용히 실패*하고, *종은 청중이 기대해서 여전히 등장*해."
두 전제조건, 복습
표준 CLT 요구:
- 합해지는 X 들 사이의 독립성.
- 각 X 의 유한 분산.
둘 다 성립하면 N 이 커질수록 표준화된 합이 정규로 수렴. *어느 한쪽이 실패하면 결론이 더는 따라오지 않아*. *종은 여전히 등장할 수도 있지만 잘못된 이유로*, 또는 *전혀 등장 안 할 수도 있어* — 그리고 *어느 쪽이든, 정규를 가정한 하류 도구들은 이제 틀린 거*.
실패 모드 1: 숨겨진 의존
가장 깨끗한 실패는 *X 들이 상관*될 때. CLT 증명은 *합의 분산이 분산의 합*이라는 항등식에 결정적으로 의존 — *오직 독립성 아래서만 성립*. *양의 상관이 있으면* 합의 분산이 *독립 가정 분산보다 크고*; *표준화 단계가 참 퍼짐을 과소평가*; *결과 꼬리 확률이 엄청나게 저평가*.
이게 정확히 *위기 중 금융 수익률에 일어나는 일*. 정상 거래일에는 자산 수익률이 *약하게 상관*돼서 CLT 유도 위험 모델이 *그럭저럭 작동*. 위기일에는 *상관이 1 쪽으로 튀어* — *모두 한꺼번에 매도* — *종이 예측한 '희귀한' 큰 변동이 화요일 오후가 됨*. *CLT 가 거짓말 안 했어; 사용자가 독립 전제조건을 잊은 거*.
실패 모드 2: 무한 분산
표준 CLT 는 *각 X 가 유한 분산을 가져야 함*. 꼬리 지수 α ≤ 2 인 멱법칙-꼬리 변수는 *무한 분산*이고, *표준 CLT 가 적용되지 않음*. 대신, 그런 변수의 합은 *안정 분포 (stable distributions)* 로 수렴, *두꺼운 꼬리이고 비대칭일 수 있음*. *종은 절대 등장 안 함*; *평균을 마치 종 모양인 것처럼 다루는 건 수학적으로 무의미*.
이게 *진짜 멱법칙 구조를 가진 자연 현상*에 중요: 지진 규모, 웹 파일 크기, 소셜 미디어 바이럴리티, 일부 자산 수익률. *누가 이 양에 대해 '평균' 을 계산했다는 사실이 평균을 의미 있게 만들지 않음* — *기저 수학이 협력을 거부*.
실패 모드 3: 느린 수렴
독립성과 유한 분산이 *기술적으로 다 성립*해도, 개별 X 가 *매우 비대칭이거나 두꺼운 꼬리* (기술적으로 유한 분산, lognormal 같은) 일 때 CLT 가 *느리게 수렴*. *'N 이 충분히 크다' 가 X 가 얼마나 비정규인지의 함수*가 됨. *고도로 비대칭인 X 에서는 N=30 이 *엄청나게 부족*; N=10,000 이어도 *꼬리에서는 여전히 틀릴 수 있어*. *CLT 는 점근적* — *유한 샘플은 늘 근사*.