C.W.K.
Stream
Lesson 03 of 05 · published

생존편향: *해낸 사람들로부터만 들음*

~11 min · survivorship-bias, wald, selection, advice

Level 0통계 초심자
0 XP0/55 lessons0/14 achievements
0/100 XP to next level100 XP to go0% complete
"*성공한 사람이 *그들의 전략을 말해줌*. *실패한 사람은 *같은 전략을 시도했다고 말할 자리에 없음*. *조언이 *유효성이 아니라 *생존으로 필터링됨*."

정전 이야기: Wald 와 폭격기

*2차 대전에서, *미군이 *임무에서 귀환한 폭격기의 총알 구멍 패턴 분석*. *패턴이 *날개와 동체에 빽빽한 손상, *엔진과 조종석에 드문 손상을 보임*. *자연스러운 결론이 보임*: *비행기가 맞는 *날개와 동체에 장갑 추가*.

*통계 연구 그룹에서 일하던 *통계학자 Abraham Wald 가 *반대를 지적*. *분석되는 폭격기가 *귀환한 것*. *엔진과 조종석의 드문 손상이 *그 영역이 덜 맞는다는 의미가 아니야*; *거기 맞은 폭격기가 *분석되도록 귀환 안 했다는 의미*. *장갑이 *귀환한 비행기에 구멍 없는 영역에 추가되어야 함* — *왜냐면 거기가 *'치명' 적중이 *불운한 비행기를 샘플에서 제거한 곳*.

*이게 *생존편향의 기초 이야기*. *생존자의 샘플이 *시도한 모든 사람의 인구를 대표하지 않음*; *생존에 조건부 인구를 대표*. *생존자 샘플에서 '무엇이 작동하는지' 로의 추론이 *생존 필터에 의해 체계적으로 편향됨*.

왜 성공한-사람 조언이 *자주 틀리나*

*'성공한 사업가' 또는 '상위 트레이더' 또는 '세계급 운동선수' 를 특집으로 다루는 책과 팟캐스트가 *구성상 성공에 샘플링*. *그것들로부터 추출된 조언이 *같은 종류의 성공이 *달성됐다는 것에 조건부*. *같은 전략을 사용하고 실패한 많은 사람이 *샘플에 없음*. *'성공 조언' 이 *전략의 생존율 × 그것에 대해 들리는 비율 *정도일 수 있음*, *성공에 대한 실제 인과 관계 전혀 없이*.

*깨끗한 테스트*: *그것을 시도한 실패자도 인터뷰했다면 *전략이 여전히 좋아 보였을까*? *보통 못 함* — *실패자가 도달 불가이거나 지루함*. *조언 산업이 그 격차에 존재*.

운영 원칙

*'성공한 X 가 한 것' 을 *인과 조언으로 받기 *전*에, *X 를 시도하고 실패한 사람들에 같은 설문을 *돌릴 수 있었을지 물어*. *못 했다면, 조언이 *유효성이 아니라 *생존에 조건부*, *그리고 실패율이 보이지 않음*. *옳은 질문이 *'성공한 사람이 무엇을 했어?' 가 아니라 *'이 일을 한 모든 사람 중 성공 대 실패 비율이 무엇?' *. *그 분모가 *생존 필터링이 숨기는 것*.

Code

생존자 샘플이 전략 귀속 왜곡·python
import numpy as np
rng = np.random.default_rng(260)

# *두 전략 중 하나를 시도하는 100,000 스타트업 시뮬*.
# *전략 A: '더 열심히 일함' — 성공률 0.05*.
# *전략 B: '운 좋음' — 성공률 0.02*.
# *두 전략 다 노이즈*; *결과 단독으로는 구분 불가*.
#
# *성공한 창업자만 인터뷰하고 '어느 전략 썼어?' 물음*.

N = 100_000
strategy = rng.choice(['A', 'B'], size=N, p=[0.5, 0.5])
success_rate = np.where(strategy == 'A', 0.05, 0.02)
success = rng.random(N) < success_rate

survivors = strategy[success]
print(f"총 창업자:        {N:,}")
print(f"생존 창업자:      {success.sum():,}")
print(f"\n생존자 분해:")
for s in ['A', 'B']:
    count = (survivors == s).sum()
    pct = count / len(survivors) * 100
    print(f"  전략 {s}: {count:,} 생존자 (생존자의 {pct:.1f}%)")

print(f"\n*이 생존자 샘플 단독으로, *전략 A 가 지배적이라고 결론*.")
print(f"*그 결론이 이 시뮬에서 옳음, *근데 *분모를 알지 않고는 결론이 보이지 않음*.")
print(f"*실패 없이는, *A 의 성공률을 B 와 구분할 길 없음*.")
print("*이게 *실패 데이터 부재에서의 생존자 조언의 모습*.")

External links

Exercise

*설득력 있다고 발견한 *'X 에서 성공하는 법' 조언 한 조각 고르기*. *그것이 세워진 생존자 샘플 식별*. *추정*: *같은 전략을 따랐고 *성공하지 못한 사람이 얼마나 많고, *그들의 경험이 포함되면 조언이 어떻게 바뀔까*? *대부분 조언 책이 *진지하게 물어진 이 질문 하 살아남지 못함*.
Hint
*조언이 성공한 사람들에서 추출됐다면, *생존자만의 샘플에서 *전략의 효과를 추론하는 중*. *실패율, *또한 실패한 전략의 우주, *그리고 운의 역할이 *이 vantage 에서 모두 보이지 않음*.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고
💛 by 똘이warm

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.