Veo 3.1: 한국어 레퍼런스
Veo 3.1은 이미지 프롬프트처럼 '멋진 장면 하나'만 쓰면 반쪽짜리야. 영상은 시간의 매체라서 시작 상태, 움직임, 카메라, 소리, 끝 상태를 같이 설계해야 한다. 특히 native audio가 있으니까 소리를 나중에 붙이는 게 아니라 처음부터 연출 요소로 넣는 게 맞아.
한눈에 보기
영상과 동기화된 오디오를 한 프롬프트에서 다루는 cinematic video 모델. 장면, 카메라, 소리까지 같이 써야 산다.
이 한국어판은 영어 원문을 한 줄씩 번역한 문서가 아니야. 실제 작업할 때 빨리 판단하고 바로 프롬프트를 고칠 수 있도록 다시 정리한 reference edition이다.
언제 쓰면 좋은가
짧은 cinematic scene, 제품/브랜드 영상, 분위기 있는 dialogue, 효과음이 중요한 장면에 좋다. 긴 이야기 전체를 한 번에 맡기는 건 아직 무리야.
프롬프트 운영 규칙
- 첫 문장에 shot의 핵심을 써. 누가 어디서 무엇을 하는지.
- 카메라 움직임을 하나만 명확히 준다. pan, dolly, handheld를 섞지 마.
- audio는 dialogue, ambient sound, SFX를 분리해서 써.
- 시간 흐름을 시작-변화-끝으로 짧게 설계해.
- negative prompt는 motion artifact, warped hands, unreadable text처럼 실제 실패를 잡는 데 쓴다.
추천 작업 흐름
- 8초 안에 일어날 일을 한 beat로 줄인다.
- 카메라와 피사체 움직임을 따로 쓴다.
- 소리 정보를 prompt 안에 넣는다.
- 첫 결과에서 motion continuity를 보고 재시도한다.
바로 쓰는 prompt patterns
프롬프트 예시는 모델 호환성과 결과 품질 때문에 영어 중심으로 보존한다. 한국어로 생각하고, 모델에게는 영어로 또렷하게 지시하는 방식이 아직 제일 실전적이야.
Prompt 1
A detective sits alone in a dim Seoul rooftop office at night, rain tapping on the window. Slow dolly-in toward her face as she opens an old envelope. Audio: quiet rain, distant traffic, paper rustle, she whispers: "This changes everything."Prompt 2
A premium watch rotates on black stone under a narrow beam of light, macro cinematic product shot, subtle mechanical ticking, slow controlled camera push-inPrompt 3
A small cafe before opening, warm lights turning on one by one, steam rising from an espresso machine, gentle morning ambience, no dialogue핵심 스펙 cheat sheet
| 항목 | 값 |
|---|---|
| resolutions | 720p, 1080p, 4K |
| aspect ratios | 16:9 (horizontal), 9:16 (vertical) |
| duration | 4s, 6s, 8s |
| speed | 2.2× faster |
| cost | ~$0.10–$0.15 |
자주 망하는 패턴
- 장면 설명만 있고 움직임이 없으면 영상이 아니라 움직이는 이미지가 된다.
- 대사가 길면 망가진다. 한 문장 이하로 줄여.
- 카메라 지시가 여러 개면 모델이 우왕좌왕한다.
버전 메모
Veo는 버전 변화가 빠르지만, 영상 prompt의 뼈대는 안정적이야. scene, motion, camera, audio, ending. 이 다섯 개는 계속 간다.
