feedback이 어디서 오나
고전적 분류는 supervised vs unsupervised. supervised는 feature/label 쌍을 먹고 loss가 label fit을 측정. unsupervised는 label 없이 구조(cluster, component, neighborhood)를 찾아. 새로운 갈래들은 feedback의 출처를 바꾸지만 엔지니어링 질문은 그대로야 — 무슨 신호가 "개선됐다"고 시스템에 알려주냐?
새로 등장한 친척들
- Semi-supervised — 작은 labeled set + 큰 unlabeled set 혼합.
- Self-supervised — input의 일부에서 자기가 label 생성 (next-token, masked patch).
- Reinforcement — 환경의 reward에서 feedback, 종종 지연.
- Active learning — 다음에 어떤 예제를 label 할지 모델이 골라서 정보량 최대화.
unsupervised의 정직한 질문
"unsupervised"라고 말하면서 매 run 후 사람이 cluster를 review 하면, 그 사람도 시스템의 일부야. cluster가 쓸모 있는지는 silhouette score만이 아니라 downstream task가 좋아지는지로 판단해.