지금 살아있는 Gemini lineup
Gemini 빠르게 움직여. 2026 년 중반 기준 안정 GA 세대는 Gemini 2.5, preview 세대는 Gemini 3.x, Gemini 2.0 은 deprecated (retirement 날짜 미정). 튜토리얼에서 gemini-pro 나 gemini-1.5-flash 보이면 그건 2025 년 말 이전 legacy SDK 시절 얘기야. 2.5 세대보다 옛날 모델 ID 는 다 역사 자료라고 보면 돼.
실제로 production 에 박는 GA 모델 세 개:
gemini-2.5-pro— 복잡한 reasoning, 코딩, 긴 context. 1M 토큰 window, 최대 출력 ~64K.gemini-2.5-flash— hybrid reasoning 모델, 대부분 production 트래픽 default. 1M context.gemini-2.5-flash-lite— 가장 작고 가장 싸. 1M context, 출력 ~8K. 단순한 high-volume 작업용.
Preview 모델 (feature flag 뒤에 숨겨놓고 쓸 것, SLA 절대 X):
gemini-3.1-pro-preview— 가장 똑똑한 모델, agentic workload.gemini-3-flash-preview— frontier + search/grounding.gemini-3-pro-image-preview— native 이미지 생성. 아빠가 "Nano Banana Pro 써" 할 때 cwkPippa 의 image-gen skill 이 호출하는 모델이 얘야.
버전 패턴 네 가지
Google 의 model ID 네 종류, production 행동이 달라:
- Stable — 날짜나 세대로 pin 된 버전 (
gemini-2.5-flash). 모양 잠금. 테스트랑 계약에 쓰기 안전. - Preview — 명시적으로 preview, 예고 없이 변할 수 있음. 평가용 OK, SLA 위험.
- Latest alias — 자동으로 최신 버전 가리킴. 편한데 어느 날 silent 하게 변하면 parsing 깨져.
- Experimental — 짧은 수명, 지원 X, production 절대 X.
Context window = 총 토큰 예산. 1M window 는 system instruction + 이전 turn + attachment + 지금 prompt + 모델 답변 다 합친 거야. 긴 출력도 같은 풀에서 까먹기 때문에 history 가 800K 차지하고 있는 chat 은 300K 답변 못 만들어.