Decoder LLM (Gemma, Llama) 의 native task. model = GemmaCausalLM.from_preset('gemma_2b_en'); output = model.generate('Once upon a time', max_length=100). 한 줄로 텍스트 생성.
sampling 파라미터: temperature (0 = greedy, 1+ = creative), top_k (n 후보만 고려), top_p (cumulative 확률 cutoff). production 에선 보통 temperature=0.7, top_p=0.9. 0 으로 하면 deterministic 하지만 dull.