"실제 세상의 대부분은 독립이 아니야. 독립을 디폴트로 두는 건 *수학은 맞고 세상은 틀리는* 교과서식 함정이야."
실제로는 하나인 두 정의
두 사건 A 와 B 가 *독립* 이란 건 *한쪽 결과를 알아도 다른 쪽 확률에 대해 아무것도 알려주지 않는다* 는 뜻이야. 공식으로:
P(A | B) = P(A) (조건부가 무조건부로 *접혀들어가*)
동치: P(A 그리고 B) = P(A) × P(B). Joint = marginal 의 곱. 두 공식이 다른 각도에서 같은 말을 해 — 하나는 조건부 얘기, 다른 하나는 곱셈 얘기.
시민을 산 채로 잡아먹는 혼동
사람들이 *독립* 과 *상호 배타적 (mutually exclusive)* 을 헷갈리는데, 사실은 *반대편 극단*이야.
상호 배타적: A 와 B 가 동시에 *못* 일어남. P(A 그리고 B) = 0. 예시: 동전 던지기는 앞면 OR 뒷면 — 둘 다일 수 없어.
독립: A 와 B 가 *동시에* 일어날 수는 있지만, 한쪽을 안다고 다른 쪽 확률이 안 바뀌어. P(A 그리고 B) = P(A) × P(B). 예시: 동전 던지기와 카드 뽑기 — 카드가 뭐든 동전은 50% 앞면.
상호 배타적 사건은 *가능한 가장 강한 의존*이야 — 한쪽을 보면 다른 쪽이 *완전히 배제*돼. 독립은 반대편: 한쪽을 봐도 다른 쪽이 *전혀 안 움직임*.
야생에서 독립은 드물어
하루를 따라가며 *진짜로 독립인 사건 쌍* 을 찾아봐. 날씨와 알람. 친구 기분과 코드 syntax 에러. S&P 500 과 채권 시장. 거의 모든 쌍에 *어떤 결합*이 있어, 종종 *제3의 변수*를 통해 숨겨진 형태로.
그 제3 변수 결합이 *spurious correlation (가짜 상관)* 이라는 항상-함정을 만들어. Tyler Vigen 의 고전 데이터셋은 1인당 치즈 소비량이 침대 시트에 얽혀 사망한 사람 수와 함께 움직이는 걸 보여줘 — 완벽해 보이는 상관, 인과 가능성 0, 거의 확실히 *인구 증가* 같은 공유된 lurker 가 만든 거. 같은 모양, *스토리 없음*. *독립-디폴트* 가정이 이런 헛소리 헤드라인을 만들어내.
살아남는 규칙
이게 quest 뒤에서 어디를 무는가
트랙 03 (왜 정규?) 의 중심극한정리는 평균 내는 값들이 *독립* 이라고 가정해. 그 가정이 깨질 때 — 위기 중의 금융 수익률, 발작 중의 뉴런, 바이럴 캠페인 중의 표 — 종 모양이 함께 깨지고, 트랙 07 (정규 오용): 블랙 스완, 두꺼운 꼬리, 동시 실패가 등장해. 독립성 가정은 *뒤에 오는 모든 것을 떠받치는 기둥*이야.