C.W.K.
Stream
Lesson 05 of 06 · published

멱법칙: 불평등의 진짜 모양

~13 min · power-law, pareto, scale-free, inequality

Level 0통계 초심자
0 XP0/55 lessons0/14 achievements
0/100 XP to next level100 XP to go0% complete
"세상에서 가장 결과를 좌우하는 분포들은 종 모양이 *아니야*. 멱법칙이야. 그리고 *아무도 알아보도록 안 배웠어*."

이 모양 안에서 이미 살고 있어

누구나 *평생 멱법칙 분포 안에 살아왔어*:

  • 자산: 상위 0.1% 가 *자산의 0.1% 보다 훨씬 더 많이* 보유.
  • 책 판매: 베스트셀러 손가락에 꼽을 정도가 *나머지 카탈로그 전체보다 더 많이* 팔림.
  • 도시 인구: 도쿄와 뉴욕이 *중앙값 도시를 왜소하게 만듦*.
  • 소셜 미디어 팔로워: 몇 계정이 *수백만*; 대부분은 *백 명 이하*.
  • 네트워크 트래픽: 몇 패킷이 *바이트 대부분을 운반*.
  • 지진 규모: 대부분 *아주 작음*; 몇 개가 *재앙적*.

각각이 *같은 동물*이야: 값의 확률이 *값의 *멱*으로 감소* (P(x) ~ x⁻ᵃ, 어떤 상수 a) 하는 분포지 *지수* 로 감소하는 게 아니야. *멱법칙 꼬리는 느리게 감소*. *극단 사건이 희귀하지 않아*.

80/20 헤드라인, 수학적으로

한 번쯤 들어봤을 *'파레토 80/20 규칙'* ('자산의 80% 를 인구의 20% 가 보유') 는 *한 특정 멱법칙의 시민용 라벨*이야: 파레토 분포. 규칙은 근사; 실제 비율은 *꼬리의 특정 α 에 의존*. 근데 구조는 보편: 인구의 얇은 슬라이스가 *총량의 두꺼운 슬라이스*를 차지.

더 깊은 버전: *진짜 멱법칙 분포에서는 규칙이 재귀*. 상위 20% 안에서, *또 다른 80/20 분할*이 적용; 상위 4% 안에서, *또*. *모든 척도에서 자기 닮음*. 이게 통계에서 *scale-free (척도 없음)* 가 의미하는 것 — *종 모양처럼 특징적 '전형적' 값이 존재하지 않아*.

평균과 분산이 *미끄러워져*

α ≤ 2 인 멱법칙에서 *분산은 이론적으로 무한*. α ≤ 1 이면 *평균조차 무한*. 이 맥락의 '무한' 은 *샘플을 더 모을수록 평균 추정치가 안정되지 않고 계속 자라난다*는 뜻. 직전 lesson 의 시민 관련 버전: *right-skewed 분포의 평균은 호도하고*; *진짜 멱법칙의 평균은 *때때로 *무의미*하기까지 해*.

이게 중요한 이유는 *시민이 행동하는 많은 양*이 (자산, 네트워크 영향력, 약물 반응, 자산 수익률) *멱법칙*이라서. *평균 보고하는 게 통계적 의료과실*; *중앙값과 꼬리 백분위 보고가 정직한 동작*.

내면화할 프레임

멱법칙은 *불평등을 그림으로 그렸을 때의 모양*이야. 종 모양은 *'전형적' 값이 존재한다고 가정*; 멱법칙은 *그걸 부정*. 모양에 이름 붙일 수 있으면 *상위 일부가 시스템 대부분을 가지는 것에 더는 안 놀라* — 그건 *버그도 도덕적 실패도 아니고, 멱법칙 수학이 만들어내는 것*. *볼 수 있게 된 다음에 뭘 하느냐는 선택*.

Code

파레토 (멱법칙) 분포의 상위 X% 점유율·python
import numpy as np
rng = np.random.default_rng(15)

# 모양 매개변수 alpha=1.5 인 파레토 샘플.
N = 100_000
alpha = 1.5
x = (rng.pareto(alpha, size=N) + 1)   # 파레토 + 1 (xmin = 1)

# 상위 1%, 10%, 20%, 50% 가 보유하는 총량 점유율 계산.
x_sorted = np.sort(x)[::-1]
total = x.sum()
for pct in (0.01, 0.10, 0.20, 0.50):
    k = int(N * pct)
    share = x_sorted[:k].sum() / total
    print(f"상위 {pct*100:>4.1f}%  보유  {share*100:>5.1f}% 의 총량")

# alpha=1.5 파레토에서: 상위 1% 가 ~25%, 상위 20% 가 ~75% 보유.
# 정확한 숫자는 alpha 에 의존. *모양은 보편: 소수가 대부분을 가짐*.
# *종 모양은 어떤 평균과 std 를 골라도 이 모양을 못 만들어*.

External links

Exercise

본인 인생이나 일에서 *멱법칙 모양을 의심하는* 양 셋 나열 (소셜 미디어 engagement, 프로젝트 노력 분포, 고객 지출, deep-work 세션 길이, 사이트 웹 트래픽). 각각에 대해 물어: *상위 1% 값을 안다면 평균보다 더 배울까*? Yes 면 *종 모양이 아니라 멱법칙 모양의 현실*을 보는 거.
Hint
멱법칙 사고: *'꼬리가 어디 있고, 총량의 얼마가 거기 있는가?'*. 종 모양 사고: *'중심이 어디 있고, 퍼짐이 얼마나 넓은가?'*. 다른 멘탈 모형이고, 대부분 시민이 *틀린 쪽으로 디폴트*.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고
💛 by 똘이warm

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.