C.W.K.
Stream
Lesson 01 of 06 · published

큰 수의 법칙: 카지노가 이기는 이유

~12 min · lln, convergence, casino, expected-value

Level 0통계 초심자
0 XP0/55 lessons0/14 achievements
0/100 XP to next level100 XP to go0% complete
"큰 수의 법칙은 마법이 아니야. *'충분히 많이 하면 노이즈가 평균돼서 사라진다'* 라는 문장의 *엄밀한 버전*이야."

진술, 평이하게

큰 수의 법칙 (LLN) 이 말해: *유한한 참 평균 μ 를 가진 분포에서 독립 샘플을 뽑으면, 표본 평균이 표본 수가 커질수록 μ 로 수렴*. 기호로:

(X₁ + X₂ + ... + Xₙ) / n → μ    n → ∞ 일 때

이게 *통계를 경험적으로 만드는 것*. 이게 *'P(앞면) = 0.5 왜냐하면 백만 번 던지면 절반이 앞면이라서'* 라는 문장을 *수학적으로 옹호 가능한 주장*으로 만드는 거지 *단순 vibe* 가 아니라.

LLN 이 *말하지 않는* 것

LLN 은 *보장하는 바에 대해 정밀*하고, 시민들은 *습관적으로 과대 주장*해.

  • *시행이 많아질수록 개별 결과가 덜 무작위*가 된다고 말 안 함.
  • *희귀 사건이 안 일어난다*고 말 안 함.
  • *분산이 0 으로 줄어든다*고 말 안 함 (줄어들긴 함, 근데 *표본 평균* 분산이지 *개별 draw* 분산이 아님).
  • *분포 모양이 바뀐다*고 말 안 함.

가장 흔한 오독은 *도박사의 오류 (gambler's fallacy)*: '빨강이 다섯 번 연속 나왔어, 검정 차례야'. *LLN 은 이걸 뒷받침 안 해*. *각 회전은 독립*; *과거 결과는 미래 확률에 영향 없음*. *장기 평균은 수렴*하지만 *개별 시행은 여전히 자기만의 독립 사건*.

카지노가 LLN 을 *눈에 보이게* 만든 것

모든 카지노 게임은 *하우스의 판당 기댓값이 살짝 양수* (하우스 edge) 가 되도록 설계됐어. 룰렛은 유럽 규칙에서 약 2.7%, 블랙잭은 최적 플레이에서 약 0.5%, 슬롯은 훨씬 높음. *개별 결과는 완전히 무작위이고 예측 불가*. 근데 *카지노는 개별 결과에 베팅 안 해* — 월 *수천 고객이 수백만 판 플레이*하게 두고, *LLN 이 실현된 판당 평균을 그 양의 하우스 edge 로 수렴*시킴.

*카지노는 도박 안 해*. *고객들이 도박*. *카지노는 큰 수의 법칙이 일하게 두면서*, 각 베팅의 *작은 양의 기댓값을 모아*. 백만 베팅 뒤에는 *누적 실현 결과가 본질적으로 누적 기댓값과 구분 안 됨*. *분산 줄어들고; 확실성 커지고; 카지노 이익*.

시민의 교훈

독립성 아래 충분히 많이 플레이된 양의 기댓값 전략은 *거의 확실한 이익*으로 수렴. *충분히 많이 플레이된 음의 기댓값 전략은 거의 확실한 손실*로 수렴. 이게 로또가 *개별 잭팟 꿈에도 불구하고 장기 비용이 명확*한 이유, 그리고 *얇은 마진의 양의 EV 트레이딩 전략이 충분한 거래로 여전히 이기는* 이유. *LLN 은 기댓값 옳은 쪽에 서면 친구, 잘못된 쪽에 서면 적*.

Code

음의 EV 베팅의 누적 결과·python
import numpy as np
rng = np.random.default_rng(33)

# 2.7% 하우스 edge 로 룰렛 플레이하는 단일 '도박사' 시뮬.
# 베팅당 순 결과: +1 (확률 18/37), -1 (확률 19/37).
# 베팅당 기댓값 ≈ -0.027.
def play(n_bets):
    spins = rng.random(n_bets) < 18/37   # 이김 또는 짐
    return np.where(spins, 1, -1).cumsum()

for n in (100, 10_000, 1_000_000):
    final_position = play(n)[-1]
    expected = -0.027 * n
    print(f"{n:>9,} 베팅 후: 실현 = {final_position:>+9}   "
          f"기댓값 ≈ {expected:>+9.0f}")

# 작은 N: 도박사가 이기거나 지는 중 — *순 노이즈*.
# 큰 N: 실현 결과가 기댓값으로 수렴: *거의 확실한 손실*.
# *카지노는 모든 베팅의 반대편*에서 *역방향을 누적*.
# 이게 LLN: *장기 평균이 단기 노이즈를 지배*.

External links

Exercise

*명확한 기댓값*이 있는 일상의 반복 결정 하나 골라 (급할 때 지하철 vs 걷기, 같은 요리 시키기 vs 새 거 시도, 아침 거르기 vs 먹기). 발생당 EV 추정 후, *이미 누적한 발생 수*를 추정. *LLN 이 실현 결과가 지금쯤 EV 로 수렴했다*고 시사? Yes 면 *EV 에 따라 행동해야 함*. No 면 *아직 노이즈 영역*.
Hint
대략 말해, LLN 수렴이 *의미 있는 건* N 이 *신경 쓰는 효과 크기보다 무작위 변동이 작아질 정도로 충분히 클 때*. 동전 던지기는 EV 확신에 ~100 시행 필요; 작은 EV 차이는 *훨씬 더 많이* 필요.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.