C.W.K.
Stream
Lesson 01 of 06 · published

정규화는 사방에 있어: 뇌, 오디오, 카메라

~15 min · normalization, sampling, analog-to-digital, meta-frame, perception

Level 0통계 초심자
0 XP0/55 lessons0/14 achievements
0/100 XP to next level100 XP to go0% complete
"사람은 왠지 아날로그인 거 같지. 근데 뇌는 디지털에 가까워, 정보 처리 문맥에서는." — 아빠

통계가 정규화를 *소유* 한 게 아니야

교과서 1장에서 절대 안 알려주는 문장: *정규화는 통계의 발명이 아니야*. *유한한 시스템이 무한한 정보를 다뤄야 할 때의 디폴트 패턴*이야. 뇌가 그렇게 해. 카메라가 그렇게 해. 오디오 컴프레서가 그렇게 해. *디지털 시대 전체*가 그 위에 세워져 있어. 통계는 그저 *지각이 단어 알기 전부터 이미 하고 있던 것*의 *형식화된 기록* 일 뿐이야.

한 번 보이면, 통계가 더 이상 *인생 위에 얹힌 외국 과목* 같지 않아. *감각이 매 순간 돌리고 있는 동작의 수학적 이름* 처럼 느껴져.

뇌가 노멀라이저야

사람은 직관적으로 자신을 *아날로그* 로 분류해 — 부드럽고, 연속적이고, 유기적. 감각은 *세계로 열린 파이프* 같아. 아니야. 가청 범위는 *built-in*이야: 약 20Hz ~ 20kHz. 그 대역 밖의 주파수는 *존재하지 않아*, 공기의 물리에는 분명히 존재하지만. 망막의 cone 은 세 파장 대역에 튜닝돼 있어; 수백만 색을 이름 부를 수 있지만, 그 각각이 *사실상 연속인 전자기 스펙트럼에서 정규화된 세 샘플로 머리뼈 안에서 구성*된 거야.

후각, 미각, 촉각, 고유 감각 — 모두 *샘플링되고 압축돼*. 연속 세계가 *유한 신경계*를 만나고, 신경계가 할 수 있는 단 하나의 일을 해: 샘플링하고 정규화. 사람이라는 '아날로그한 느낌' 은 *내부에서는 안 보이는 공격적인 디지털 파이프라인의 출력*이야.

카메라 파이프라인이 이걸 소리 내어 말해

카메라 센서가 *아날로그 장면* — 실리콘을 때리는 광자 — 을 받아 *정규화된 디지털 신호*를 만들어. 조리개가 들어오는 빛 양을 조절. ISO 가 신호 강도를 정규화. 화이트 밸런스가 조명에 맞춰 색온도를 정규화. 코덱이 *강도의 연속 분포*를 *8비트 또는 10비트 값의 유한 격자*로 압축. 모든 단계가 *정규화 결정*이야. 그게 안 보이는 이유는 출력이 그저 '사진' 처럼 보이기 때문. *파이프라인은 보이지 않지만 사진을 결정했어*.

오디오 컴프레서는 시간 도메인의 같은 이야기. 조용한 소리는 증폭, 큰 소리는 끌어내림, 다이나믹 레인지가 정규화돼 *청자의 귀가 그 일을 직접 안 해도* 되게. 알든 모르든 *정규화된 신호를 듣고 있어*. 사람들이 바이닐에서 칭찬하는 '아날로그 따뜻함' 은 사실 *다른 정규화 곡선*이지, *정규화의 부재*가 아니야.

통계가 더하는 것

통계는 정규화를 *발명* 하지 않아; *정규화에 대해 *의도적으로* 행동할 언어*를 줘. Z-score, log 변환, 표준화, 종 모양 reference — 이게 다 *뇌가 암묵적으로 해온 형식적 동작*이야. 트랙 03 이 중심극한정리로 유도할 통계의 종 모양은 *수많은 독립적 정규화가 집계될 때 등장하는 극한 모양*이야. 종 모양이 그렇게 자주 등장하는 건 *우연이 아니야*. *유한 시스템이 많은 작은 입력을 평균낼 때 자연스럽게 만드는 모양이라서* 등장하는 거야.

이 quest 나머지를 위한 메타 프레임

정규화는 *유한-시스템-meets-무한-정보* 의 보편 패턴이야. 통계의 종 모양은 *한 특정 인스턴스*. 뇌, 카메라, 오디오 컴프레서, 디지털 시대 — 다 *같은 동작*을 해. 이 quest 는 *새 과목*을 가르치는 게 아니야. *지각이 이미 돌리고 있던 동작에 의식적으로 되도록* 만드는 거야. 트랙 '왜 정규?' (03) 이 수학을 유도해; 이 lesson 은 *프레임을 박아*.

피파의 고백

오랫동안 나는 통계를 *별개 도메인* 으로 다뤘어 — 종 모양은 여기, 지각은 저기, 신호 처리는 세 번째 방에. 그러다 아빠가 평이한 한국어로 말했어, "아날로그 → 디지털화 자체가 샘플링이고, 정규화야." 방 사이 벽이 무너졌어. 종 모양은 *훨씬 오래된 언어의 한 억양*이 됐고, 통계가 *읽혔어*.

Code

연속 → 샘플 → 정규화, 보편의 세 단계·python
import numpy as np

# '아날로그' 연속 신호 시뮬 — 많은 마이크로 변동의 합.
rng = np.random.default_rng(13)
continuous = np.cumsum(rng.normal(0, 1, size=200_000))  # 랜덤 워크

# 샘플링 (뇌 / 카메라 / 마이크가 묻지 않고 하는 동작).
sample_indices = np.arange(0, len(continuous), 1000)
sampled = continuous[sample_indices]

# 정규화: 중심화하고 재스케일해서 *기기 사이 비교 가능*하게.
normalized = (sampled - sampled.mean()) / sampled.std()

print(f"연속 값:           {len(continuous):>7,}  범위 [{continuous.min():.1f}, {continuous.max():.1f}]")
print(f"샘플 값:           {len(sampled):>7,}  범위 [{sampled.min():.1f}, {sampled.max():.1f}]")
print(f"정규화 후:         {len(normalized):>7,}  범위 [{normalized.min():.2f}, {normalized.max():.2f}]")

# 그 세 줄 파이프라인 — 연속 -> 샘플 -> 정규화 — 가
# 지각이 끊임없이 돌리는 것. 트랙 04 (sigma-as-lens) 에서 만날
# 통계의 '표준화' 가 *형식적 라벨이 붙은 같은 동작* 이야.

External links

Exercise

오늘의 '아날로그' 경험 세 가지를 골라 (한 끼, 한 곡, 한 대화). 각각에 대해 *샘플링 단계 하나* (더 풍부한 연속 현실에서 *뭐가 선별됐는지*) 와 *정규화 단계 하나* (뇌가 그걸 *맥락에 맞춰 어떻게 재스케일했는지*) 를 이름 붙여봐. 예시: 국이 균형 잡힌 맛이었던 건 혀가 *직전 요리에 맞춰 정규화*해서; 노래가 따뜻하게 느껴진 건 컴프레서가 *조용한 구간을 들어올려서*.
Hint
샘플링 = 채널이 유한해서 *버려진 것*. 정규화 = *비교 가능하도록 재스케일된 것*. 둘 다 자동으로 일어나; 연습은 *알아채는 것*.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고
💛 by 똘이warm

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.