C.W.K.
Stream
Lesson 01 of 06 · published

블랙 스완은 *통계 실수*지 *자연 현상*이 아니야

~13 min · black-swan, taleb, fat-tails, modeler-error

Level 0통계 초심자
0 XP0/55 lessons0/14 achievements
0/100 XP to next level100 XP to go0% complete
"블랙 스완은 *현실이 두꺼운 꼬리고 모델이 얇은 꼬리일 때 일어나는 일*. *현실이 잘못이 아니야*."

Taleb 의 블랙 스완이 *실제로 의미*하는 것

*Nassim Nicholas Taleb 의 용어 블랙 스완이 *세 속성을 가진 사건을 묘사*: *(1) 정상 기대 범위 밖에 있음, (2) 극단 영향 가짐, (3) 인간 본성이 *돌이켜보면 *예측 가능해 보이게 설명을 사후적으로 조작*. *9/11 공격, 2008 금융 위기, COVID-19, 개인 컴퓨팅의 부상이 *그의 프레이밍에서 모두 자격*.

*용어의 깊은 통계적 내용, *대중 사용에서 자주 사라지는 것*은: *블랙 스완이 *두꺼운 꼬리 분포가 얇은 꼬리로 모델링되는 것의 현시*. *'희귀' 사건이 *오직 잘못된 모델 하에서 희귀*. *실제 (두꺼운 꼬리) 분포 하에서는, *사건이 *모델이 주장한 만큼 희귀하지 않았어*. *실수가 자연에 있지 않았어*; *모델러의 분포 선택에 있었어*.

재프레이밍

*블랙 스완의 대중 프레이밍이 *그것을 *준-신비적 놀라움 — '아무도 올 걸 보지 못한' 사건* 으로 다룸*. *그 프레이밍이 *정밀한 방식으로 틀림*. *모델이 정규분포를 가정했고 6σ 사건이 일어나면 (정규 하 10억 분의 1 확률), *둘 중 하나가 참*: *(a) 진짜로 비범한 것 (10억에 1) 을 목격했거나, (b) 모델이 잘못된 분포를 썼고 *두꺼운 꼬리 세계의 6σ 가 *결국 일어날 만큼 충분히 흔했음*. *두 번째 옵션이 압도적으로 더 가능성 있음*.

*이게 중요한 이유는 *대중 프레이밍이 *모델러에게 면죄*. *'블랙 스완이었어, 아무도 예측 못 했어' 가 *'수학이 맞았어; 현실이 불공정했어'* 라고 말하는 방식*. *재프레이밍이 책임을 되돌림*: *모델러가 *기저 과정에 맞지 않는 분포를 선택*, *그리고 사건이 *그 불일치의 예측 가능한 결과*. *수학이 틀렸어*; *현실은 그저 *현실인 거*.

이게 무는 세 도메인

*대부분 블랙 스완이 *두꺼운 꼬리 분포의 세 가족에 살아*:

  • 금융 시장: *상관된 투자자 행동, 레버리지, 피드백 루프 때문에 자산 수익률이 두꺼운 꼬리*. *1998 LTCM 과 2008 이 정전 예시*; *다음 두 lesson 에서 자세히 다룸*.
  • 네트워크 시스템: *소셜 미디어 도달, 웹 트래픽, 연쇄 실패, 정보 전파가 *선호적 부착 때문에 두꺼운 꼬리*. *소셜 미디어의 '바이럴' 사건이 *거의 항상 *평균-기반 직관이 예측할 수 없는 멱법칙 극단**.
  • 피드백이 있는 복잡 적응 시스템: *팬데믹, 금융 전염, 전쟁, 기술 혁명*. *역학이 *강화를 통해 개별 결정을 결합*하고, *결과 결과 분포가 *구성상 무거운 꼬리**.

모델러의 규율

*어떤 '희귀 사건' 주장에든 *첫 질문*: *'어느 모델 하 희귀?'*. *모델이 정규성을 가정했고 사건이 일어났다면, *모델이 거의 확실히 *틀렸지 운이 나쁜 게 아니었어**. *두꺼운 꼬리 사고의 규율이 *두 번째 sigma-트릭* — *σ 렌즈가 *적용 안 되는 곳을 알고 *대신 뭘 쓸지 아는 것*. *멱법칙-인식 도구 (Pareto fit, 극값 이론, 견고 추정기) 가 존재*; *시민의 일은 *'블랙 스완' 이 *돌이켜보면 명백하게 만들기 전에* *그것들이 필요함을 아는 것**.

Code

정규 vs 두꺼운 꼬리 우주의 꼬리 희귀성·python
import numpy as np
rng = np.random.default_rng(180)

# *두 평행 우주에서 '희귀 사건' 빈도 비교*:
# *우주 A: 정규분포 (얇은 꼬리)*.
# *우주 B: 두꺼운 꼬리 분포 (Student t, df=3)*.
# *둘 다 같은 표본 표준편차*.
N = 1_000_000
universe_a = rng.normal(size=N)
universe_b = rng.standard_t(df=3, size=N)

for name, x in [("우주 A (정규)", universe_a), ("우주 B (두꺼운 꼬리)", universe_b)]:
    z = (x - x.mean()) / x.std()
    for k in (4, 5, 6, 8):
        rate = (np.abs(z) > k).mean()
        # *'X 분의 1' 표현으로 변환*.
        if rate > 0:
            one_in = 1 / rate
            print(f"{name:>26s}: |z|>{k}  =  {one_in:>15,.0f} 분의 1")
        else:
            print(f"{name:>26s}: |z|>{k}  =  샘플에서 관측 안 됨")
    print()

# *우주 A: |z|>6 이 100만 샘플에서 본질적으로 안 관측*.
# *우주 B: |z|>6 이 *수천 배 더 자주* 일어남*.
# *같은 축, 같은 시그마, 엄청나게 다른 희귀성*.
# *우주 A 의 6-sigma 사건이 블랙 스완*. *우주 B 에서는 화요일*.
# *우주 B 를 우주 A 처럼 다루는 모델러가 *주문 시 블랙 스완을 생산*.

External links

Exercise

*'블랙 스완' 이라 불리는 걸 들은 사건 하나 회상*. *각각에 대해, *사건 전에 세상을 예측하는 데 쓰인 모델을 식별*, 그리고 *그 모델이 *현실이 실제로 두꺼운 꼬리일 때 얇은 꼬리를 가정했는지* 물어*. *Yes 면, 사건이 *모델러에게 블랙 스완이었지 *세상에는 아니었어*. *다음 두 lesson 이 *가장 비싼 두 사례를 통과할 거*.
Hint
*COVID-19, 9/11, 2008 위기, 암호화폐 부상, 닷컴 버스트, GFC 서브프라임 위기* — *이 모두가 흔히 블랙 스완으로 라벨링됨*, 그리고 *이 모두에서 *기저 시스템이 두꺼운 꼬리였어* (전염병, 지정학, 금융 레버리지). *'예측 불가능성' 이 *모델에 있었지 *세상에 있지 않았어*.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고
💛 by 똘이warm

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.