기하
Linear regression이 점들의 cloud를 통과하는 hyperplane을 fit. 계수는 다른 feature 고정 시 한 unit 변화당 target 변화. intercept는 모든 feature가 0일 때 predicted target. centered feature면 intercept가 target의 평균.
왜 여전히 중요한가
Linear regression이 ship 가능한 가장 빠른 baseline, 비기술 stakeholder에게 설명하기 가장 쉬운, feature drift 아래에서 가장 안정적. performance의 floor로 다뤄: 더 화려한 모델은 신경 쓰는 metric에서 유지 비용을 정당화하는 마진으로 이 floor를 이겨야 해.
계수를 정직하게 읽기
계수는 correlational, not causal. "days_since_signup"의 양 계수가 "고객 나이 늘리면 churn한다"는 뜻이 아냐. 다른 feature 비슷한 고객 중 더 오래된 사람이 더 churn 한다는 뜻. multicollinearity가 prediction 좋게 유지하면서도 개별 계수를 헝클어.