한 패키지, 모든 주요 Transformer architecture
transformers 라이브러리 (Hugging Face) 가 모든 주요 NLP, vision, audio, multimodal Transformer 의 uniform interface. 위에서 아래로 세 abstraction 층:
- Pipeline — 한 줄 task-shaped API (
pipeline("sentiment-analysis"),pipeline("summarization")). prototype 과 일회성 script 에 best. - Auto* class —
AutoTokenizer,AutoModel,AutoModelForSequenceClassification등. checkpoint 이름에서 architecture 감지하고 옳은 클래스 instantiate. 'model 과 loop 통제 원함' 의 옳은 level. - Specific model class —
BertModel,GPT2LMHeadModel등. Auto layer 가 숨기는 architecture-specific feature 필요할 때만.
Tokenizer + Model — 표준 쌍
모든 Transformers model 이 일치 tokenizer 와 함께. model 이 token ID (와 attention mask) 기대. tokenizer 가 text 를 ID 로. 일치해야 — 같은 checkpoint 이름에서 둘 다 로드.
'head' pattern
각 base model architecture 위 다른 task 위 여러 'head' variant:
AutoModel— base model, hidden state 반환.AutoModelForSequenceClassification— classification head (logit 와).AutoModelForTokenClassification— per-token label (NER).AutoModelForCausalLM— language modeling (GPT-style).AutoModelForSeq2SeqLM— encoder-decoder (T5-style).AutoModelForQuestionAnswering— extractive QA (start/end position).
너 task 에 맞는 거 pick; 라이브러리가 옳은 output head 자동 hook.