평균의 표집 분포

"CLT 가 주는 *가장 유용한 것*이 *평균의 표집 분포*야. 그 단일 객체가 *존재하는 모든 신뢰구간과 모든 t-검정을 떠받쳐*."

한 평균, 많은 가능성

모집단에서 *크기 N 의 샘플 하나* 뽑아. *표본 평균 계산*. 이제 *다시 한다고 상상* — *다른 무작위 N 샘플, 다른 평균*. *수천 번 반복*. *그 표본 평균들의 모음이 자기 분포*를 가져, 평균의 표집 분포라 불러.

이게 *CLT 가 진짜 말하는 객체*. 통계학자가 '*평균의 표집 분포가 큰 N 에 대해 대략 정규*' 라고 말할 때 의미: *크기 N 의 모든 가능한 샘플에서 얻을 모든 평균을 상상하면, 그 상상된 모음의 모양이 종 같다*, *기저 데이터가 그렇지 않을 때도*.

표준 오차

*표집 분포의 표준편차에 자기 이름*이 있어: *표준 오차 (standard error, SE)*. 표본 평균에서 *SE = σ / √N* — *모집단 표준편차를 표본 크기의 제곱근으로 나눈 것*. *SE 는 N 이 커질수록 줄어들지만 *제곱근만큼만**: *평균의 불확실성을 절반으로 줄이려면 표본 크기가 *4배* 필요*, *2배가 아니라*.

이 *'제곱근 법칙' 이 CLT 의 가장 중요한 실용적 결과 중 하나*. *평균 추정을 두 배 정밀하게 만들려면 데이터가 얼마나 더 필요한지* 정확히 알려줘. 그리고 *큰 설문이 놀라울 정도로 정확하게 느껴지고* (수백만 유권자 조사 = 작은 SE) *작은 연구가 놀라울 정도로 흔들리게* 느껴지는 이유.

왜 신경 써야 하는지

*과학 논문이나 뉴스 기사에 보고된 모든 신뢰구간* — '40% 지지, ±3%' — *평균 (또는 비율) 의 표집 분포를 쓰는 것*. *±3% 는 표준 오차에서 유도*되고, *표준 오차는 CLT 에서 유도*. *CLT 전제조건이 성립할 때 이 구간이 의미 있어*: *연구를 여러 번 반복하면 그런 구간의 약 95% 가 참 모집단 값을 포함*.

*CLT 전제조건이 성립 안 하면* — *상관 샘플, 두꺼운 꼬리, 의존 관측* — *보고된 구간은 fiction*. *숫자는 맞는 산수; 해석은 fantasy*. *이게 출판된 연구의 주요 침묵 실패 중 하나*.

운영 규칙

*평균의 표집 분포가 CLT 의 가장 실용적인 선물*이야. *그게 '샘플에서 모집단으로의 추론' 을 *애초에 가능하게* 만드는 것*. 트랙 05 가 이 객체를 *신뢰구간과 가설 검정으로* 바꿀 거. *전체 frequentist 사업이 그 위에 서*. *써; 전제조건 알아둬; 성립 안 할 때 믿지 마*.

Code

비정규 모집단에서 평균의 표집 분포·python

import numpy as np
rng = np.random.default_rng(70)

# 모집단: 고도로 비대칭 (lognormal).
population = rng.lognormal(mean=0, sigma=1, size=1_000_000)
pop_mean = population.mean()

# M 개 독립 샘플 (크기 N), 각 평균 계산.
N = 100
M = 10_000
sample_means = np.array([
    rng.choice(population, size=N, replace=False).mean()
    for _ in range(M)
])

# 원 모집단은 *정규에서 멀어* — 심하게 right-skewed.
print(f"모집단:        평균={pop_mean:.3f}  skew=심한 오른쪽 (lognormal)")
print(f"표본 평균들:    평균={sample_means.mean():.3f}  std={sample_means.std():.3f}")
print(f"이론적 SE = sigma/sqrt(N) = {population.std() / np.sqrt(N):.3f}")

# *평균의 표집 분포가 훨씬 좁아* (~ sigma/sqrt(N))
# *그리고 모집단보다 정규에 훨씬 가까워* — *모집단 자체가 정규에서 멀어도*.
# *그게 CLT 가 평균의 상상된 분포에 일하는 것*.

Exercise

*N=1,000 응답자로 50% 지지 ±3%* 라고 주장하는 설문. *암시된 표준 오차* 추정. 그러고 나서 물어: *독립성 아래* (각 응답자가 편향 없는 무작위 샘플 제공) *±3% 가 신뢰 가능한가*? *상관 샘플 아래* (같은 지역이나 사회 네트워크의 응답자) *참 불확실성이 더 클까 작을까*? *거의 항상 더 큼* — *정치 여론조사가 상관을 정기적으로 고려 안 함*.

Hint

비율 p 에 대해 SE ≈ sqrt(p(1-p)/N). p=0.5, N=1000 에서 SE ≈ 1.6%. 95% 구간 = ~1.96 × SE ≈ ±3%. *±3% 는 산수*; *신뢰성은 전제조건에 대한 별개 질문*.

한 평균, 많은 가능성

표준 오차

왜 신경 써야 하는지

운영 규칙

Code

External links

Exercise

Progress

댓글 0