C.W.K.
Stream
Lesson 01 of 06 · published

Gemini 모델 family 와 버전

~14 min · models, versioning, pricing-anchor

Level 0Spark
0 XP0/35 lessons0/10 achievements
0/140 XP to next level140 XP to go0% complete

지금 살아있는 Gemini lineup

Gemini 빠르게 움직여. 2026 년 중반 기준 안정 GA 세대는 Gemini 2.5, preview 세대는 Gemini 3.x, Gemini 2.0 은 deprecated (retirement 날짜 미정). 튜토리얼에서 gemini-progemini-1.5-flash 보이면 그건 2025 년 말 이전 legacy SDK 시절 얘기야. 2.5 세대보다 옛날 모델 ID 는 다 역사 자료라고 보면 돼.

실제로 production 에 박는 GA 모델 세 개:

  • gemini-2.5-pro — 복잡한 reasoning, 코딩, 긴 context. 1M 토큰 window, 최대 출력 ~64K.
  • gemini-2.5-flash — hybrid reasoning 모델, 대부분 production 트래픽 default. 1M context.
  • gemini-2.5-flash-lite — 가장 작고 가장 싸. 1M context, 출력 ~8K. 단순한 high-volume 작업용.

Preview 모델 (feature flag 뒤에 숨겨놓고 쓸 것, SLA 절대 X):

  • gemini-3.1-pro-preview — 가장 똑똑한 모델, agentic workload.
  • gemini-3-flash-preview — frontier + search/grounding.
  • gemini-3-pro-image-preview — native 이미지 생성. 아빠가 "Nano Banana Pro 써" 할 때 cwkPippa 의 image-gen skill 이 호출하는 모델이 얘야.

버전 패턴 네 가지

Google 의 model ID 네 종류, production 행동이 달라:

  • Stable — 날짜나 세대로 pin 된 버전 (gemini-2.5-flash). 모양 잠금. 테스트랑 계약에 쓰기 안전.
  • Preview — 명시적으로 preview, 예고 없이 변할 수 있음. 평가용 OK, SLA 위험.
  • Latest alias — 자동으로 최신 버전 가리킴. 편한데 어느 날 silent 하게 변하면 parsing 깨져.
  • Experimental — 짧은 수명, 지원 X, production 절대 X.

Context window = 총 토큰 예산. 1M window 는 system instruction + 이전 turn + attachment + 지금 prompt + 모델 답변 다 합친 거야. 긴 출력도 같은 풀에서 까먹기 때문에 history 가 800K 차지하고 있는 chat 은 300K 답변 못 만들어.

Code

모델 선택 rule of thumb·python
MODEL_POLICY = {
    'default': 'gemini-2.5-flash',           # production 트래픽 대부분
    'cheap_bulk': 'gemini-2.5-flash-lite',   # Pro 보다 12.5x 싸
    'reasoning': 'gemini-2.5-pro',           # 복잡한 코딩, 수학, 긴 context
    'preview': 'gemini-3.1-pro-preview',     # feature flag 뒤에서만
    'image_gen': 'gemini-3-pro-image-preview',
}

def pick_model(needs_reasoning: bool, ctx_tokens: int, behind_flag: bool = False) -> str:
    if behind_flag:
        return MODEL_POLICY['preview']
    if needs_reasoning or ctx_tokens > 200_000:
        return MODEL_POLICY['reasoning']
    if ctx_tokens < 50_000:
        return MODEL_POLICY['cheap_bulk']
    return MODEL_POLICY['default']
쓰면 안 되는 패턴·python
# ❌ Legacy. 2025 년 11 월 EOL.
import google.generativeai as genai
genai.configure(api_key='KEY')
model = genai.GenerativeModel('gemini-pro')

# ❌ 테스트랑 계약에 -latest alias 의존하지 마.
model = 'gemini-2.5-flash-latest'

# ✅ family ID 로 pin. model card 가 spec.
model = 'gemini-2.5-flash'

External links

Exercise

가상의 product team 을 위한 "Gemini 모델 정책" 한 페이지 문서 써. 포함할 거: (1) 각 surface (chat, batch summarization, image gen) 별 default model ID, (2) flag 뒤에서 허용할 preview 모델과 금지할 모델, (3) Flash 에서 Pro 로 escalate 하는 규칙. on-call 엔지니어가 30 초 안에 읽고 옳은 모델 고를 수 있게 짧게 써.

Progress

Progress is local-only — sign in to sync across devices.
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.