다른 단위, 같은 자
학생의 수학 점수 (100 만점) 와 물리 점수 (50 만점) 어떻게 비교? 또는 달러 소득 vs 센티미터 키? 각각 z-score 로 변환:
z-score = "이 값이 평균에서 표준편차 몇 개?" 원래 단위 cancel. 수학에서 z=+1.5 = 물리에서 z=+1.5 와 같은 의미: 평균 위 1.5 표준편차.
표준 정규분포
어떤 정규분포든 z-score 변환하면 의 표준 정규. canonical 벨 커브, 옛 통계 교과서 lookup 표 토대.
왜 ML 이 표준화 사랑
Z-score 표준화 (Numbers 트랙) = feature 를 비교 가능 스케일로. 대부분 신경망이 입력 z-score 됐을 때 학습 잘 됨. 대부분 회귀 계수가 feature z-score 됐을 때 해석 가능. 대부분 이상치 탐지기가 |z| > 3 = 의심.
Z-score 가 단위 지움. 표준화 후 모든 feature 가 같은 언어 사용: "평균에서 표준편차 몇 개?"