Base Rate Neglect: 시민의 내장된 편향

"Daniel Kahneman 이 *'base rate neglect' 라고 불렀어*: *인간이 *신뢰할 만하게 사전확률을 무시하고 *생생한 사례-특정 정보에 과중치 부여*. *베이즈 정리가 수학*; *base-rate neglect 가 *수학을 직관에 반하게 느끼게 만드는 인지 실패*."

패턴, 이름 붙임

*Base-rate neglect 가 *생생한, 개별 사례에 대한 특정 정보를 선호해서 *사전확률 (base rate) 을 무시하는 체계적 인간 경향*. *문헌의 *가장 신뢰할 만한 인지 편향 중 하나*; *Kahneman 과 Tversky 가 *수십 실험에서 문서화*, *Thinking, Fast and Slow의 중심 기둥 형성*.

고전 예시

*'Linda 는 31세, 미혼, 거침없고, 매우 똑똑*. *철학 전공*. *학생일 때 *차별과 사회 정의 문제에 깊이 관심*. *어느 게 더 가능*: *(a) Linda 가 은행원, 또는 (b) Linda 가 은행원 AND 페미니스트 운동에 활동적*'. *대부분 응답자가 (b) 선택*. *근데 (b) 가 (a) 의 부분집합* — *둘 다인 모든 Linda 가 *그저 은행원인 Linda 중 하나이기도*. *(b) 가 (a) 보다 더 가능할 수 없음*. *생생한 묘사가 base-rate 논리를 압도*. *이게 '결합 오류 (conjunction fallacy)', *base-rate neglect 의 가까운 사촌*.

*직전 lesson 의 의료 false positive 가 같은 모양*: *생생한 '99% 정확 검사' 가 *병이 희귀하다는 지루한 사실을 압도*. *검사의 오류가 같은 모양*: *생생한 '백만 분의 1 DNA 일치' 가 *유죄의 base rate 라는 지루한 질문을 압도*. *시민이 *신뢰할 만하게 *생생한 것을 *지루한 base rate 보다 *차수가 더 많이 가중치*. *베이즈 프레임워크가 *형식적 교정*.

왜 편향이 존재하나

*진화적 추측은 차치하고, *편향이 *불확실성 하 인간 추론이 실제로 작동하는 방식과 일관*: *우리가 *어려운 질문을 *쉬운 것으로 대체*. *어려운 질문은 *'증거와 base rate 주어졌을 때, posterior 확률이 무엇'*. *쉬운 질문은 *'증거가 가설을 얼마나 강하게 상기시키나'*. *어려운 질문을 *쉬운 것으로 대체 (Kahneman 의 '속성 대체') 가 *신뢰할 만한 답을 매우 빨리 줘*, *일상에 대해 종종 충분히 옳음*, *근데 *base rate 가 중요할 때 체계적으로 편향됨*.

교정

*Base-rate neglect 의 교정은 *prior, likelihood, posterior 가 이름 붙어 쓰여진 *명시적 베이즈 계산*. *생생한 사례-특정 증거 기반 *posterior 결론에 손을 뻗는 자신을 발견할 때, *prior 를 명시적으로 적어*. *Gut posterior 와 *베이즈 posterior 비교*. *둘이 자주 *차수 이상 차이*. *Prior 적어두는 규율이 *base-rate neglect 를 *신뢰할 만한 편향에서 알아챈 것으로 바꾸는 것*.

Code

택시 문제: gut vs 베이즈·python

# *택시 문제로 base-rate neglect 시연*.
#
# *도시에서, 택시의 85% 가 녹색, 15% 가 파랑. 밤에 사고 발생*.
# *증인이 택시를 파랑으로 식별*. *비슷한 조건에서 검사된 증인은
# *80% 옳고 20% 틀림*.
# *질문*: *택시가 실제로 파랑일 확률은*?
#
# *Gut 답*: 80% (증인 정확도).
# *베이즈 답*: ~41%.

def bayes(prior, P_E_given_H, P_E_given_not_H):
    num = P_E_given_H * prior
    den = num + P_E_given_not_H * (1 - prior)
    return num / den

prior_blue = 0.15           # base rate
P_says_blue_given_blue = 0.80
P_says_blue_given_green = 0.20
posterior = bayes(prior_blue, P_says_blue_given_blue, P_says_blue_given_green)

print(f"Base rate P(파랑): {prior_blue:.2f}")
print(f"증인 정확도: 80% 옳은 식별")
print(f"Posterior P(파랑 | '증인이 파랑이라 말함'): {posterior:.4f}")
print()
print("Gut 직관이 ~80% 라 말함. *베이즈 수학이 ~41% 라 말함*.")
print("Base rate (택시의 15% 만 파랑) 가 *posterior 를 50% 아래로 끌어내림*")
print("*증인이 80% 정확함에도 불구하고*.")
print("*그 격차가 *수치화된 base-rate neglect*.")

Exercise

*최근 뉴스나 소셜 미디어에서 읽은 *믿음 업데이트 촉발한 생생한 이야기 하나 고르기*. *식별*: *(1) 일을 한 생생한 사례 디테일; *(2) 이야기가 언급 안 한 *암묵적 base rate; *(3) base rate 를 진지하게 받아들이면 계산할 posterior*. *초기 반응이 비교에서 살아남나*? *대부분 안 살아남음*.

Hint

*'친구의 사촌이 Y 백신에서 X 부작용 얻음' 이 *생생한 사례 디테일*; *관련 base rate 는 *백신을 받은 인구의 전체 부작용 율*. *생생한 이야기는 극적*; *base rate 가 *정책을 주도해야 하는 것*.

패턴, 이름 붙임

고전 예시

왜 편향이 존재하나

교정

Code

External links

Exercise

Progress

댓글 0