[캐릭터] + [행동] + [카메라] + [환경] + [대사 내용] + [목소리 톤] + [배경음/음악]"")를 쓰지 않고 평서문으로 대사를 적는다. 따옴표를 쓰면 영상에 자막이 나타날 수 있다.
- 대사는 1~2문장으로 짧게 구성할 때 립싱크가 가장 정확하다.
- 대화 장면은 텍스트 프롬프트 생성 시에만 지원하며, 참조 이미지 사용 시 제한될 수 있다.
자신감 있고 낮은 40대 영국 남성 목소리로 말한다.excited, weary, commanding, whispering, nervousspeaking rapidly, slowly and deliberately
- 영어 대사가 한국어보다 발음과 립싱크가 더 안정적이다.
- 목소리 설명은 프롬프트의 대사 내용 바로 앞이나 뒤에 배치한다.
[Audio: gentle rain on a rooftop, crackling campfire][Audio: slow sad piano melody], [Audio: epic orchestral music]No subtitles. No text overlays.
- 소리가 너무 많으면 대사가 묻히므로 환경음은 2개 이내로 제한한다.
- 음악이 필요 없는 ASMR이나 공포 장면은
No music을 명시한다.
A large furry Bigfoot holding a selfie stick in a snowy forest during a blizzard. Selfie camera angle, shaky handheld style. Bigfoot speaks in a deep, rugged Scottish male voice: Hello everyone it is so cold today and my legs are freezing honestly. [Audio: howling wind, snapping branches] No subtitles.
Selfie camera angle과Handheld style은 브이로그의 현장감을 살리는 필수 키워드다.
- 립싱크가 어색하면 대사를 더 짧은 단어 위주로 수정한다.
빅풋 예시를 버리고 내가 만들 캐릭터의 대사 장면을 같은 공식으로 다시 적용한다.
A {character} in {environment}. {camera angle}. {character} speaks in a {voice tone} voice: {line in plain English without quotes}. [Audio: {ambient sound 1}, {ambient sound 2}] No subtitles.
{character} — 말하는 주체의 외형, 예: a young female barista with curly hair.{environment} — 장소와 분위기, 예: a cozy cafe at sunrise.{camera angle} — 앵글과 스타일, 예: Eye level medium shot, slight handheld.{voice tone} — 나이·성별·억양·감정, 예: warm and cheerful young American female.{line in plain English without quotes} — 따옴표 없는 1~2문장 대사, 예: Good morning, your usual flat white is almost ready.{ambient sound 1}, {ambient sound 2} — 환경음 2개 이내, 예: espresso machine hissing, soft jazz.A young female barista with curly hair in a cozy cafe at sunrise. Eye level medium shot, slight handheld. The barista speaks in a warm and cheerful young American female voice: Good morning, your usual flat white is almost ready. [Audio: espresso machine hissing, soft jazz] No subtitles.
{voice tone}만 바꿔 같은 장면을 다른 캐릭터 버전으로 재사용한다.
- 대사에 따옴표를 넣으면 화면에 자막이 박히므로 평서문으로만 적는다.