"세상에서 가장 결과를 좌우하는 분포들은 종 모양이 *아니야*. 멱법칙이야. 그리고 *아무도 알아보도록 안 배웠어*."
이 모양 안에서 이미 살고 있어
누구나 *평생 멱법칙 분포 안에 살아왔어*:
- 자산: 상위 0.1% 가 *자산의 0.1% 보다 훨씬 더 많이* 보유.
- 책 판매: 베스트셀러 손가락에 꼽을 정도가 *나머지 카탈로그 전체보다 더 많이* 팔림.
- 도시 인구: 도쿄와 뉴욕이 *중앙값 도시를 왜소하게 만듦*.
- 소셜 미디어 팔로워: 몇 계정이 *수백만*; 대부분은 *백 명 이하*.
- 네트워크 트래픽: 몇 패킷이 *바이트 대부분을 운반*.
- 지진 규모: 대부분 *아주 작음*; 몇 개가 *재앙적*.
각각이 *같은 동물*이야: 값의 확률이 *값의 *멱*으로 감소* (P(x) ~ x⁻ᵃ, 어떤 상수 a) 하는 분포지 *지수* 로 감소하는 게 아니야. *멱법칙 꼬리는 느리게 감소*. *극단 사건이 희귀하지 않아*.
80/20 헤드라인, 수학적으로
한 번쯤 들어봤을 *'파레토 80/20 규칙'* ('자산의 80% 를 인구의 20% 가 보유') 는 *한 특정 멱법칙의 시민용 라벨*이야: 파레토 분포. 규칙은 근사; 실제 비율은 *꼬리의 특정 α 에 의존*. 근데 구조는 보편: 인구의 얇은 슬라이스가 *총량의 두꺼운 슬라이스*를 차지.
더 깊은 버전: *진짜 멱법칙 분포에서는 규칙이 재귀*. 상위 20% 안에서, *또 다른 80/20 분할*이 적용; 상위 4% 안에서, *또*. *모든 척도에서 자기 닮음*. 이게 통계에서 *scale-free (척도 없음)* 가 의미하는 것 — *종 모양처럼 특징적 '전형적' 값이 존재하지 않아*.
평균과 분산이 *미끄러워져*
α ≤ 2 인 멱법칙에서 *분산은 이론적으로 무한*. α ≤ 1 이면 *평균조차 무한*. 이 맥락의 '무한' 은 *샘플을 더 모을수록 평균 추정치가 안정되지 않고 계속 자라난다*는 뜻. 직전 lesson 의 시민 관련 버전: *right-skewed 분포의 평균은 호도하고*; *진짜 멱법칙의 평균은 *때때로 *무의미*하기까지 해*.
이게 중요한 이유는 *시민이 행동하는 많은 양*이 (자산, 네트워크 영향력, 약물 반응, 자산 수익률) *멱법칙*이라서. *평균 보고하는 게 통계적 의료과실*; *중앙값과 꼬리 백분위 보고가 정직한 동작*.