번역, 요약, 코드 생성 뒤의 패턴
어떤 task는 한 sequence를 다른 길이의 sequence로 매핑: 번역 (영어 → 한국어), 요약 (기사 → 초록), 코드 생성 (설명 → 코드). 이건 encoder-decoder 패턴 따라.
Encoder는 전체 입력 sequence 읽고 context representation 만들어 (보통 hidden state sequence). Decoder는 encoder context (cross-attention 통해)와 이미 생성한 토큰 (self-attention 통해) 둘 다에 조건화돼서 토큰별로 출력 생성.
2026년 production: research 아니면 seq2seq를 처음부터 짜지 마. KerasHub가 T5, BART, Whisper pretrained 한 줄 로드 제공. Task에 fine-tune; architecture 세부는 처리됨.