C.W.K.
Stream
Lesson 06 of 06 · published

선형 회귀에서 딥러닝까지

~6 min · deep-learning, neural-networks, wrap-up

Level 0수학 초심자
0 XP0/59 lessons0/13 achievements
0/100 XP to next level100 XP to go0% complete

같은 루프, 여러 번

루프 봤어:

  1. 파라메트릭 모델 정의 (선형 회귀: ).
  2. 손실 함수 픽 (회귀엔 MSE).
  3. Gradient descent 로 파라미터 최적화.
  4. 검증/테스트 데이터 hold out 해 overfitting 감지.

이제 stack 해. 신경망 = 그저 비선형 활성 사이에 끼우고 함께 합성된 많은 선형 회귀. 각 layer = 그 다음 ReLU 나 sigmoid. 마지막 layer = 회귀 (또는 분류) head. 모든 W 와 b 를 backprop 으로 한 번에 최적화 (다음 트랙).

개념적 연속성

선형 회귀딥러닝
2 파라미터 (w, b)수백만 또는 수십억 파라미터
Closed-form 해Gradient descent (closed form X)
1 라인Stack 된 변환
MSE lossMSE / cross-entropy / 등
데이터 + 단순 모델로 overfitting 통제데이터 + dropout + weight decay + early stopping 으로 overfitting 통제

같은 chassis, 더 많은 마력.

트랙 보상

유니버설 학습 루프 배움: 파라메트릭 모델 + loss + 옵티마이저 + held-out 평가. 선형 회귀 = seed. 모든 신경망 = 같은 아이디어 강화 버전. 다음 두 트랙 (Calculus, Backprop) 가 거대 모델에서 이 루프 작동시키는 메커닉 줘.

Code

신경망 = stack 된 회귀·python
import torch
import torch.nn as nn

# 2-layer 신경망 — stack 된 선형 회귀
class TinyNet(nn.Module):
    def __init__(self):
        super().__init__()
        self.fc1 = nn.Linear(10, 32)        # 선형 회귀 #1
        self.fc2 = nn.Linear(32, 1)         # 선형 회귀 #2

    def forward(self, x):
        x = torch.relu(self.fc1(x))         # 사이의 비선형
        return self.fc2(x)

# 두 선형 회귀 + 한 ReLU = 신경망.

External links

Exercise

(a) 10 feature 선형 회귀 vs (b) 2-layer 망 (10 → 32 → 1) 의 파라미터 수 비교. 각각 몇 개? 왜 더 깊은 게 더 많아?
Hint
(a) 10 weight + 1 bias = 11. (b) (10×32 + 32) + (32×1 + 1) = 352 + 33 = 385. 비선형이 추가 파라미터 벌어 — 모델이 곡선 그리게.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.