*두 번째 앨범의 저주와 스포츠 슬럼프*

"*두 번째 앨범이 실망시키는 이유는 *첫 앨범이 부분적으로 운 좋아서*. *슬럼프가 도착하는 이유는 *지난 시즌이 부분적으로 운 좋아서*. *어느 것도 *성격이나 자만에 대한 이야기를 요구하지 않아*."

평이한 언어로의 패턴

*예술가, 운동선수, 또는 분석가가 *기념비적 첫 수행 가짐*. *비평가와 팬이 주목*. *기대 폭증*. *후속 수행이 견고하지만 *첫보다 덜 비범*. *언론이 '저주', '슬럼프', '소포모어 슬럼프', '두 번째-앨범 실망' 에 대해 말함*. *자만, 명성, 산만, 창의적 고갈에 대한 이야기 구축*. *때때로 그 이야기들이 *부분적으로 참이기도 함*. *근데 *지배적 힘이 *통계적, 서술적이 아니야*: *첫 수행이 부분적으로 운 때문에 극단이었고, *두 번째 수행이 *평균적으로 덜 극단인 새 운을 가짐*.

왜 narrative 가 지속되나

*Narrative 가 지속되는 이유는 *인과적이고 만족스러워서*; *평균 회귀가 비-인과적이고 불만족*. *'그가 신인상 받고, 그러고 나서 광고에 산만해짐' 이 *캐릭터와 동기 있는 이야기*. *'신인의 수행이 *반복 안 한 노이즈였던 그의 신인 시즌의 일부 때문에 *실제 기술 수준으로 회귀' 가 *노이즈에 대한 이야기*. *인간이 *첫 종류 이야기 선호*. *첫 종류가 또한 *대부분 시간 틀림*.

운영 예측

*극단 첫 뒤 두 번째 수행을 예측해야 한다면, *최선 규칙*: *노이즈 내용에 비례하는 양만큼 *첫 수행을 인구 평균 쪽으로 할인*. *첫 시즌 95 백분위의 운동선수에 대해, *그들의 두 번째 시즌에서 *70-80 백분위 어딘가 기대* — *그들의 실제 기술에 더 가까움, *근데 여전히 좋음*. *첫 앨범이 현상이었던 밴드에 대해, *밴드의 실제 재능 (진짜이고 좋음) + 새 운 (그만큼 친절하지 않을 것) 이 *생산할 두 번째 앨범 기대* — *거의 확실히 덜 현상적*.

*이게 비관주의가 아니야*; *보정*. *두 번째 수행이 *첫과 일치하기 기대하는 게 시민 실수*. *끔찍하기 기대하는 게 *과잉 교정*. *옳은 기대는 *첫 수행과 인구 평균 사이 어딘가, *얼마의 첫 수행이 신호 vs 노이즈였는지로 가중치*.

반대 응용

*평균 회귀가 *반대 방향에서도 작동*: *재앙적 첫 시즌을 가진 선수가 *다음 시즌 개선할 가능성 높음*, *그들이 무엇을 교정해서가 아니라 *재앙의 일부가 반복 안 할 노이즈여서*. *끔찍한 신인 시즌의 선수를 '전환' 한 코치가 *부분적으로 회귀에 대한 공을 차지*. *끔찍한 시험 점수에서 '개선' 하는 학교가 *부분적으로 회귀 타고 감*. *회귀에 대한 주목의 비대칭 (우리가 쇠퇴 서술, 우리가 개선 무시) 이 *편향이 지속되는 이유의 일부*.

Code

시즌-1 상위 수행자가 시즌 2 에서 회귀·python

import numpy as np
rng = np.random.default_rng(250)

# *1,000 운동선수 시뮬*. *각자 참 기술 가짐 (인구에서 draw)*.
# *각자 두 번 수행; 각 수행 = 참 기술 + 새 노이즈*.
# *시즌 1 상위-50 수행자 식별; 시즌 2 에서 어떻게 하는지 봄*.
N_athletes = 1_000
true_skill = rng.normal(loc=50, scale=10, size=N_athletes)   # 기술 분포
season1_noise = rng.normal(loc=0, scale=8, size=N_athletes)
season2_noise = rng.normal(loc=0, scale=8, size=N_athletes)
season1 = true_skill + season1_noise
season2 = true_skill + season2_noise

# *시즌 1 의 상위 50*.
top_50_indices = np.argsort(season1)[-50:]
top_50_s1 = season1[top_50_indices].mean()
top_50_s2 = season2[top_50_indices].mean()
top_50_skill = true_skill[top_50_indices].mean()

print(f"시즌 1 상위-50 운동선수:")
print(f"  시즌 1 평균 수행: {top_50_s1:.2f}")
print(f"  시즌 2 평균 수행: {top_50_s2:.2f}")
print(f"  이 그룹의 참 기술: {top_50_skill:.2f}")
print(f"\n시즌 1 상위-50 이 *그들의 참 기술 위 {top_50_s1 - top_50_skill:.2f} 평균* (운 기여)*.")
print(f"시즌 2 에서, 운이 reset; 그들이 기술 근처에서 수행*.")
print(f"*이 하락이 *평균 회귀*, *'슬럼프' 가 아니야*.")

Exercise

*최근 '소포모어 슬럼프' 이야기 찾기* (운동선수, 예술가, 스타트업, 펀드). *기사의 설명 읽기*. *설명을 *평균-회귀 디폴트와 비교*. *얼마의 '슬럼프' 가 *회귀 단독일 수 있나*? *자주: 대부분*. *서술 설명이 *여전히 부분적으로 참일 수 있음*, *근데 *보통 *통계적 베이스라인에 비해 과중치*.

Hint

*첫 질문이 늘*: *'첫이 얼마나 극단이었어?'*. *매우 라면, 회귀 단독이 *실질적 하락 예측*. *인과 이야기는 *오직 회귀가 뺀 후 잔여를 설명하기 위해서만 invoke 되어야 함*.

두 번째 앨범의 저주와 스포츠 슬럼프