목표
네 브랜드의 특정 보이스 — 톤, 어휘, 구조 매칭 — 으로 마케팅 카피 쓰는 모델 학습. 콘텐츠 팀의 정석 distillation use case.
데이터 수집
- 승인된 브랜드 카피 200~500 예제 수집(블로그, 소셜, 이메일).
- 각각을 "브리프"(이걸 만든 요청)랑 페어링.
- 좋은 예제뿐 아니라 off-brand → on-brand 재작성도 포함. 대비가 모델한테 뭘 만들지만큼 뭘 피할지 가르쳐.
평가가 어려워
스타일 트랜스퍼는 평가 문제 중 더 어려운 거. 세 접근법 —
- A/B blind 테스트: 마케팅 팀이 어느 쪽인지 모르고 base vs 파인튜닝 출력 평가.
- 브랜드 보이스 rubric: 특정 차원에서 점수(톤 정확도, 어휘 매칭, 구조 준수).
- 브랜드 가이드라인을 시스템 프롬프트로 한 LLM-as-judge: GPT-4o가 작성된 가이드라인 준수 평가.