C.W.K.
Stream
Lesson 06 of 06 · published

두꺼운 꼬리: 블랙 스완 예고

~11 min · fat-tail, black-swan, kurtosis, tail-risk

Level 0통계 초심자
0 XP0/55 lessons0/14 achievements
0/100 XP to next level100 XP to go0% complete
"희귀 사건은 종 모양이 말하는 만큼 희귀하지 *않아*. 그 한 문장이 *지금까지 들어본 모든 금융 위기*의 씨앗이야."

꼬리 두께가 숨겨진 차원

지금까지 분포를 *모양 (대칭 vs 비대칭)* 과 *꼬리 감소 (지수 vs 멱)* 로 소개했어. 세 번째 렌즈 — *무시하면 시민에게 가장 큰 피해를 주는* 것 — 이 *꼬리 두께*야.

'두꺼운 꼬리 (fat-tailed)' 분포는 *극값이 같은 평균과 분산의 정규가 예측하는 것보다 훨씬 더 가능성이 있는 분포*야. 수학적으로 *kurtosis 가 3 (정규의 kurtosis) 보다 높음*. 시각적으로는 *중심은 정규 같아 보이지만 평균에서 먼 영역에 더 무거운 질량*.

정규 꼬리가 *왜 얇은지*

정규 PDF 는 e^(-x²/2) 처럼 감소. 음의 제곱의 지수는 *매우, 매우 빨리 0 으로 감*. 5σ 값은 약 1천만에 6. 6σ 값은 약 10억에 2. *정규 세계에서 희귀는 진짜로 *소멸할 정도로* 희귀하고, 무시해도 안전*.

두꺼운 꼬리 분포는 *훨씬 느리게 감소*. 자유도 낮은 Student t-분포, Cauchy, 또는 *어떤 멱법칙 꼬리*에서든 5σ 사건이 *충분히 자주 일어나 장기 평균을 지배*. *'희귀' 가 희귀하지 않아; 그저 전형적인 것보다 덜 빈번할 뿐*.

2008 의 교훈, 압축

2000년대 금융 위험 모델은 *자산 수익률이 대략 정규* 라고 가정. *아니었어*. 실제 수익률 분포는 *두꺼운 꼬리*; *큰 일일 변동이 정규가 예측한 것보다 훨씬 더 자주* 일어났음. *희귀하지만 사실 희귀하지 않은 사건*이 현실화됐을 때, *산업 전체가 얇은 꼬리 세계에 calibrated 된 위험 추정치를 들고 잡혔어*. *산수는 맞았고; 분포가 틀렸고; 비용은 조 단위로 측정*.

이건 *고대 역사가 아니야*. 같은 실수가 *대중이 가깝게 안 보는 도메인에서 매년 반복*: 보험 모델, 기후 예측, 사이버보안, 공급망 위험. *모델이 얇은 꼬리를 가정하고 현실이 두꺼운 꼬리* 인 어디에든 *기다리는 2008* 이 있어.

운영 규칙

*정규의 디폴트 가정이 시민의 가장 비싼 습관*이야. 트랙 07 (정규 오용) 이 이 가정을 *자세히 분해*하는 데 통째로 바쳐졌어; 이 lesson 은 *거기 도달하기 전에 경고를 시끄럽게 박아*. 'X-sigma 사건' 을 읽을 때, 물어: *기저 분포가 *실제로* 정규인가, 아니면 *데이터에 안 맞는 정규 모양의 상상에서 sigma 를 빌려온 건가*?

Code

정규 vs Student-t 꼬리: 같은 sigma, 다른 현실·python
import numpy as np
rng = np.random.default_rng(20)
N = 200_000

# 정규와 자유도 낮은 Student t (두꺼운 꼬리) 비교.
normal = rng.normal(size=N)
student_t = rng.standard_t(df=3, size=N)

# 공정한 꼬리 비교 위해 둘 다 표준화 (std=1).
for name, x in [("정규", normal), ("t (df=3)", student_t)]:
    x = (x - x.mean()) / x.std()
    p4 = (np.abs(x) > 4).mean()
    p5 = (np.abs(x) > 5).mean()
    p6 = (np.abs(x) > 6).mean()
    print(f"{name:>10s}: P(|x|>4) = {p4:.5f}   P(|x|>5) = {p5:.6f}   P(|x|>6) = {p6:.6f}")

# 정규에서 |x|>5 는 약 천만에 6번.
# t(df=3) 에서 |x|>5 는 *대략 1000배 더 자주* 일어남.
# *같은 축, 같은 표준편차, 다른 현실*.
# 이게 종이 위에서의 '두꺼운 꼬리' 모습.

External links

Exercise

*두꺼운 꼬리일 가능성이 높은* 일이나 인생의 양 하나 골라 (일일 포트폴리오 손익, 고객 지원 티켓 도착률, 바이럴 콘텐츠 reach, 파일 다운로드 크기, 에러 로그 빈도). *지금까지 본 가장 큰 사건의 크기를 중앙값 대비* 추정해봐. 비율이 *10배 이상*이면 거의 확실히 *두꺼운 꼬리 영역*이고 *'sigma-기반' 추론은 잘못된 거*.
Hint
*얇은 꼬리 세계의 100배 사건은 사실상 절대 안 일어나야 함*. 봤다면, 세계는 얇은 꼬리가 *아니야*.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고
💛 by 똘이warm

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.