측정 오차와 보정

"측정하는 *모든 숫자에 노이즈가 있어*. σ 는 *그 노이즈의 단위*야. *측정 σ 를 모르는 시민은 거짓 정밀도로 작동하는 것*."

측정의 현실

*같은 물리량* — 테이블 길이, 사람 몸무게, 방 온도 — *같은 기기로 열 번 측정*. *열 번 같은 숫자 안 나옴*. *값들이 참 양 가까운 무언가 주변에 모여*, *기기 노이즈를 반영하는 퍼짐과 함께*. *그 퍼짐, 표준편차로 표현된 것*이 측정 불확실성.

*제대로 보정된 기기는 이 불확실성을 인용*: '100.0 ± 0.5 cm' 는 *'표준화된 측정 노이즈 σ ≈ 0.5 cm' 의 축약*. *± 기호는 변장한 시그마*. *중앙 숫자를 진실로 다루고 ± 를 무시하는 게 *시민의 가장 비싼 측정 실수*.

독립 오차가 의존 오차를 이기는 이유

*노이즈가 측정 간 독립인 기기로 같은 양을 N 번 측정*하면, *평균의 표준 오차가 √N 으로 줄어* (트랙 03, lesson 5). *각 σ = 0.5cm 의 10번 독립 측정은 *불확실성 σ/√10 ≈ 0.16cm 의 평균*을 줘* — *어떤 단일 측정보다 3배 더 정밀*.

*결정적으로 이건 오차가 독립일 때만 작동*. *체계적 편향* — *기기가 항상 0.3cm 높게 읽음* — *평균으로 안 줄어듦*; *전체 크기로 지속*. *보정 (calibration) 이 그런 체계적 편향을 검출하고 제거하는 실천*. *보정 없이는 더 많은 측정이 생각보다 적게 사줘*; *보정과 함께라면 √N 법칙이 작동*.

보고된 측정을 읽기

'1234 ± 5' 보통: *참 값이 1234 의 ±5 안일 가능성이 가장 높음, ±5 가 표준편차에 해당* (분야 관례에 따라 *1σ 또는 2σ*; *물리학은 보통 1σ*).
불확실성 없이 보고된 측정은 *암묵적으로 정밀도가 무한이라고 가정해달라는 요청*. *거의 절대 그렇지 않음*. *정확하다고 다루는 건 과신*.
'95% 신뢰구간 [1224, 1244]' 은 *다른 어휘의 같은 아이디어*: *구간이 측정 노이즈의 ±~2σ 를 커버*.

렌즈 통찰

*모든 보고된 숫자에 *암묵적 σ* 가 있어. *σ 를 안 읽고 숫자를 읽는 건 문장의 반만 읽는 것*. *σ 가 신경 쓰는 차이에 비해 작으면, 측정이 결정적*. *σ 가 크면, 측정이 시사적이지만 결론적이지 않음*. *습관적으로 '*σ 가 뭐야?' 라고 묻는 시민이 *허위 정밀도에 속지 않는 시민*.

Code

노이즈 AND 체계적 편향이 있는 반복 측정·python

import numpy as np
rng = np.random.default_rng(90)

# 고정 양 (참 길이 = 100.0 cm) 의 반복 측정 시뮬.
# 기기 노이즈 sigma = 0.5 cm, 체계적 편향 +0.3 cm.
true_length = 100.0
bias = 0.3
noise_sigma = 0.5

# N 번 측정.
N = 10
measurements = rng.normal(loc=true_length + bias, scale=noise_sigma, size=N)

print("개별 측정:")
for m in measurements:
    print(f"  {m:.3f}")

estimated = measurements.mean()
se_of_mean = noise_sigma / np.sqrt(N)
print(f"\n측정 평균: {estimated:.3f}")
print(f"평균의 표준 오차: {se_of_mean:.3f}")
print(f"참 길이: {true_length:.3f}  (편향: {bias})")

# *평균이 (참 + 편향) 에 가까움*. *평균이 노이즈를 줄였어*
# (SE/sqrt(N)), *근데 체계적 편향은 전체 +0.3 으로 지속*.
# *편향을 제거하는 보정 없이, 더 많은 측정이 *더 정밀한 잘못된 양의 추정*을 줘*.
# *보정이 평균이 실제로 도움이 되는 전제조건*.

Exercise

*정기적으로 하는 측정* 하나 골라 (체중, 목적지까지의 시간, 반복 지출). *반복 값에 대한 경험으로부터 측정 σ 추정*. 그러고 나서 물어: *누군가와 이 숫자에 대해 말할 때, σ 가 허용하는 것보다 더 빡빡한 정밀도를 암묵적으로 주장하고 있어*? Yes 면 *그게 렌즈-기술 실패* — *'정확히 X' 가 아니라 '약 X' 로 인용하기 시작*해.

Hint

*체중*: σ ≈ 0.5–1.5 kg 음식/물에서 오는 일일 변동. *'70.0 kg 이야' 라고 맥락 없이 말하는 건 과정밀*; *'대략 70 kg, 68 과 72 사이에서 변동' 이 정직*.

측정의 현실

독립 오차가 의존 오차를 이기는 이유

보고된 측정을 읽기

렌즈 통찰

Code

External links

Exercise

Progress

댓글 0