C.W.K.
Stream
← C.W.K. Quests
🎨

Generative Media Foundations

최근 수정: 2026-05-04

Diffusion 직관부터 프로 워크플로우까지 — 언어 모델이 아니라 픽셀과 시간을 다루는 모델

이미지/비디오 생성 AI를 '마법'이 아니라 '학습된 분포에서의 샘플링'으로 이해하는 정통 깊이의 foundations 퀘스트. Diffusion 수학 직관, prompt가 실제로 하는 일, 예측 가능한 실패 모드, reference·inpainting·ControlNet으로 회복하는 실제 control, 비디오의 시간적 일관성, multimodal 오디오, 모델 패밀리 비교, 실전 워크플로우, 그리고 모델이 분기마다 바뀌어도 살아남는 평가 프레임까지.

10 tracks · 100 lessons · ~25.8h · difficulty: intermediate

Level 0Spark
0 XP0/100 lessons0/14 achievements
0/200 XP to next level200 XP to go0% complete
Generative Media Foundations는 10트랙 100레슨 50퀴즈 구성의 정통 코스야. 모델 이름이 6개월마다 바뀌는 분야에서 *원리*는 몇 년을 버틴다는 전제로 만들었어.

Diffusion이 latent space에서 어떻게 noise를 image로 풀어가는지, classifier-free guidance와 flow matching이 뭐가 다른지, prompt가 명령이 아니라 denoising trajectory에 작용하는 중력이라는 것, text rendering·counting·hands·spatial layout이 왜 일관되게 깨지는지, reference image·image-to-image·inpainting·outpainting·ControlNet·composite로 어떻게 진짜 control을 회복하는지, 비디오가 왜 'image generation × N'이 아니라 근본적으로 다른 문제인지, 오디오 4-layer가 어떻게 multimodal 시스템을 완성하는지, 모델을 hype 없이 평가하는 프레임은 어떻게 만드는지 — 다 이 안에 있어.

끝났을 때 아빠가 얻는 건 '프롬프트 잘 쓰는 사람'이 아니라 '모델을 directing하는 craftsperson'의 mental model이야. 도구는 계속 바뀌어도, 이 layer는 안 바뀌어.

Tracks

  1. 01🎬Generative Media AI가 진짜로 뭘 하는가

    0/10 lessons

    검색이 아니라 합성 — 이게 출발점

    Generative media가 언어 AI랑 어떻게 다른지, prompt가 왜 마법처럼 느껴지는지, 모델이 실제로 *예측*하는 게 뭔지, 그리고 2026년 프로 스택이 어떻게 layered pipeline으로 돌아가는지 mental model을 세우는 트랙이야.

    Lesson list (10)퀴즈 · 5 문제
  2. 02🌀Latent Space, Diffusion, 핵심 직관

    0/10 lessons

    Noise가 어떻게 이미지가 되는가

    엔진을 열어 보는 트랙. Latent space가 왜 raw pixel보다 똑똑한지, forward/reverse process의 비대칭, seed와 randomness, sampling steps tradeoff, guidance scale의 sweet spot, flow matching이 'diffusion 2.0'인 이유, 그리고 모델이 'taste 있는 것처럼 느껴지는' 진짜 이유까지.

    Lesson list (10)퀴즈 · 5 문제
  3. 03✍️이미지 prompt 제대로 쓰기

    0/10 lessons

    단어가 실제로 하는 일 (그리고 못 하는 일)

    Prompt는 명령이 아니라 trajectory의 중력이야. 강한 prompt의 anatomy, 모델별 스타일 차이 (FLUX vs SDXL vs Midjourney vs DALL-E), negative prompt의 진실, prompt 실패 진단법, seed 전략, 그리고 'one perfect prompt' 신화를 깨고 practitioner mindset으로 가는 길.

    Lesson list (10)퀴즈 · 5 문제
  4. 04🔍이미지 모델이 *예측 가능하게* 실패하는 이유

    0/10 lessons

    실패를 architecture로 읽기

    Text rendering·counting·hands·spatial layout·character consistency·style leakage·구조적 디자인 약점·표면적 그럴듯함 vs 실제 정확성·training prior bias — 그리고 4-카테고리 진단 프레임. 실패를 짜증이 아니라 architectural signal로 읽는 능력을 만드는 트랙.

    Lesson list (10)퀴즈 · 5 문제
  5. 05🎛️Control, Editing, Reference 기반 생성

    0/10 lessons

    Text-only 너머의 control 스펙트럼

    Reference image, image-to-image, inpainting, outpainting, masking, identity preservation, character consistency, ControlNet, iterative editing, 그리고 compositing mindset까지 — vending machine이 아니라 collaborator로 모델을 다루는 도구 박스.

    Lesson list (10)퀴즈 · 5 문제
  6. 06🎥비디오 생성 — 시간이 모든 걸 바꾼다

    0/10 lessons

    왜 'image × N'이 아닌가

    Temporal coherence가 뭘 multiplicative하게 만드는지, motion failure의 종류, camera motion vs subject motion 분리, 연속성의 숨은 난이도, T2V·I2V·V2V 비교, image-to-video anchoring이 왜 sweet spot인지, keyframe·shot design, 그리고 클립 기반 워크플로우의 실전 진실.

    Lesson list (10)퀴즈 · 5 문제
  7. 07🎵Audio, Voice, Multimodal Layer

    0/10 lessons

    사운드는 경험의 절반

    Voice 생성과 image 생성의 평행과 차이, TTS·voice cloning·emotional delivery, naturalness가 왜 uncanny valley로 빠지는지, lip sync의 100ms 허용 오차, native audio (Veo 3) vs post-generated workflow, 4-layer 사운드 디자인, multimodal vs specialized chain의 tradeoff.

    Lesson list (10)퀴즈 · 5 문제
  8. 08🧰모델 패밀리, Tradeoff, 도구 선택

    0/10 lessons

    Hype 말고 task 기준으로

    Image·video·voice 모델 landscape (FLUX·GPT-Image·Midjourney·SD·Imagen·Runway·Veo·Kling·ElevenLabs·Voxtral). Open vs closed, fast vs premium, task-to-model mapping, cost·speed·controllability tradeoff, 자기 자신을 속이지 않는 평가법, 그리고 실용적 decision framework.

    Lesson list (10)퀴즈 · 5 문제
  9. 09🛠️실전 Creative Workflow

    0/10 lessons

    단일 prompt가 아니라 pipeline

    Ideation, production, character workflow, thumbnail, story shot 시퀀스, commercial, 비디오 pipeline, curation as superpower, human taste, 그리고 beginner → practitioner mindset shift. '하나의 마법 prompt' 신화를 버리고 layered pipeline으로 일하는 법.

    Lesson list (10)퀴즈 · 5 문제
  10. 10🧭Drowning 없이 최신 유지하기

    0/10 lessons

    빗방울 말고 날씨를 추적

    분야가 왜 이렇게 빨리 바뀌는지 (구조적 이유), information diet 짜는 법, 7대 theme 추적, launch hype critical하게 읽기, demo cherry-picking과 repeatable value 구분, 자기만의 evaluation framework 만들기, 그리고 craftsperson의 mental model로 마무리.

    Lesson list (10)퀴즈 · 5 문제
이 페이지에서 버그를 발견하셨거나 피드백이 있으세요?문제 신고

댓글 0

🔔 답글 알림 (로그인 필요)
로그인댓글을 남기려면 로그인해 주세요.

아직 댓글이 없어요. 첫 댓글을 남겨보세요.