C.W.K.
Stream
Lesson 09 of 10 · published

고전 ML, Deep Learning, LLM, 그리고 RAG

~30 min · framing, deep-learning, llm

Level 0Scout
0 XP0/48 lessons0/11 achievements
0/120 XP to next level120 XP to go0% complete

접근법 지도

고전 ML(linear, tree, gradient boosting)은 tabular와 production scoring 시스템 대부분을 지배. Deep learning은 perception(vision, audio, text) — feature를 hand-craft 하기 어려운 곳을 지배. LLM은 unstructured text 위 instruction-following에 탁월. RAG는 LLM에 search index를 접목해서 답이 LLM의 frozen weight가 아니라 너의 데이터에서 나오게 해.

tabular는 여전히 누가 이기나

대부분 enterprise scoring / ranking / risk 문제는 gradient boosted tree(xgboost, lightgbm, catboost)가 신경망보다 적은 컴퓨트와 훨씬 적은 plumbing으로 이겨. deep learning은 input이 자연스럽게 tensor(image, waveform, sequence)일 때나 downstream 고전 모델에 먹일 embedding이 필요할 때 reach.

LLM을 쓸 때

LLM은 labeled data 없는 task, 코드 짜는 것보다 instruction 쓰는 게 쉬운 task, 0 training cost로 95% 정확도가 몇 달 labeling 후 98% 정확도를 이기는 task에서 빛나. structured data 위 high-precision scoring에는 잘못된 도구이고, hallucinated 답의 비용이 큰 어떤 문제에도 잘못된 도구.

Code

데이터 row의 모양에 맞춰 도구 고르기·python
def pick_approach(row):
    if row.input_kind == "tabular" and row.label_count > 1000:
        return "gradient_boosted_trees"
    if row.input_kind in {"image", "audio", "raw_text"}:
        return "deep_learning"
    if row.input_kind == "unstructured_text" and row.labels_scarce:
        return "llm_few_shot"
    if row.needs_facts_from_corpus:
        return "rag"
    return "clarify_problem"
LLM 가기 전 고전 baseline·python
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline

tfidf_lr = Pipeline([
    ("tfidf", TfidfVectorizer(min_df=5, ngram_range=(1, 2))),
    ("clf", LogisticRegression(max_iter=1000)),
]).fit(X_text_train, y_train)

External links

Exercise

팀이 지금 LLM으로 풀고 있는 문제 3개를 골라. 각각에 대해 고전 baseline(tfidf + linear, gradient boosted tree, 또는 rule)을 설계해. baseline과 현재 솔루션 사이 gap을 추정해. LLM이 실제로 비용을 정당화하는지 결정해.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.