"큰 수의 법칙은 마법이 아니야. *'충분히 많이 하면 노이즈가 평균돼서 사라진다'* 라는 문장의 *엄밀한 버전*이야."
진술, 평이하게
큰 수의 법칙 (LLN) 이 말해: *유한한 참 평균 μ 를 가진 분포에서 독립 샘플을 뽑으면, 표본 평균이 표본 수가 커질수록 μ 로 수렴*. 기호로:
(X₁ + X₂ + ... + Xₙ) / n → μ n → ∞ 일 때
이게 *통계를 경험적으로 만드는 것*. 이게 *'P(앞면) = 0.5 왜냐하면 백만 번 던지면 절반이 앞면이라서'* 라는 문장을 *수학적으로 옹호 가능한 주장*으로 만드는 거지 *단순 vibe* 가 아니라.
LLN 이 *말하지 않는* 것
LLN 은 *보장하는 바에 대해 정밀*하고, 시민들은 *습관적으로 과대 주장*해.
- *시행이 많아질수록 개별 결과가 덜 무작위*가 된다고 말 안 함.
- *희귀 사건이 안 일어난다*고 말 안 함.
- *분산이 0 으로 줄어든다*고 말 안 함 (줄어들긴 함, 근데 *표본 평균* 분산이지 *개별 draw* 분산이 아님).
- *분포 모양이 바뀐다*고 말 안 함.
가장 흔한 오독은 *도박사의 오류 (gambler's fallacy)*: '빨강이 다섯 번 연속 나왔어, 검정 차례야'. *LLN 은 이걸 뒷받침 안 해*. *각 회전은 독립*; *과거 결과는 미래 확률에 영향 없음*. *장기 평균은 수렴*하지만 *개별 시행은 여전히 자기만의 독립 사건*.
카지노가 LLN 을 *눈에 보이게* 만든 것
모든 카지노 게임은 *하우스의 판당 기댓값이 살짝 양수* (하우스 edge) 가 되도록 설계됐어. 룰렛은 유럽 규칙에서 약 2.7%, 블랙잭은 최적 플레이에서 약 0.5%, 슬롯은 훨씬 높음. *개별 결과는 완전히 무작위이고 예측 불가*. 근데 *카지노는 개별 결과에 베팅 안 해* — 월 *수천 고객이 수백만 판 플레이*하게 두고, *LLN 이 실현된 판당 평균을 그 양의 하우스 edge 로 수렴*시킴.
*카지노는 도박 안 해*. *고객들이 도박*. *카지노는 큰 수의 법칙이 일하게 두면서*, 각 베팅의 *작은 양의 기댓값을 모아*. 백만 베팅 뒤에는 *누적 실현 결과가 본질적으로 누적 기댓값과 구분 안 됨*. *분산 줄어들고; 확실성 커지고; 카지노 이익*.