기간 한정 혜택- 연간 50% 할인사용하기
2026년 6월 13일가이드

AI 보이스 디자인: 단 한 줄의 텍스트 프롬프트로 맞춤형 목소리 만들기

AI 보이스 디자인: 단 한 줄의 텍스트 프롬프트로 맞춤형 목소리 만들기

평범한 단어로 목소리를 묘사하면 Fish Audio의 보이스 디자인(Voice Design)이 약 15초 만에 이를 생성합니다. 커스텀 AI 캐릭터 목소리를 만들어 보세요 — 출시 기념 기간 동안 무료입니다.

아직 존재하지 않는 목소리가 필요하신가요? 게임 속 냉소적인 로봇 조수, 다큐멘터리의 따뜻한 내레이터, 혹은 팟캐스트 인트로의 심야 라디오 호스트 같은 목소리 말이죠. 기존의 보이스 라이브러리를 뒤져봐도 다른 사람들이 이미 다 쓰고 있는 수백 개의 흔한 목소리뿐이고, 보이스 클로닝(Voice Cloning)은 실제 인물의 녹음 샘플이 먼저 필요합니다.

**보이스 디자인(Voice Design)**은 이 문제를 다르게 해결합니다. 이제 Fish Audio에서 만나보실 수 있는 이 기능은 나이, 성별, 억양, 톤, 속도, 분위기를 텍스트로 설명하기만 하면 완전히 독창적인 커스텀 AI 보이스를 만들어 줍니다. 약 15초 만에 설명 내용을 사용할 수 있는 보이스 모델로 변환합니다. 녹음도, 성우도, 라이브러리 탐색도 필요 없습니다.

출시 기간 동안 보이스 디자인을 통한 보이스 생성은 완전히 무료입니다 (평상시 생성당 2,000 크레딧).

지금 보이스 디자인 체험하기 →


AI 보이스 디자인이란 무엇인가요?

AI 보이스 디자인은 오디오 샘플 대신 작성된 설명을 바탕으로 맞춤형 오리지널 합성 음성을 생성하는 과정입니다. 목소리가 어떻게 들려야 하는지 설명하는 프롬프트(예: "부드러운 미국 억양을 가진 따뜻하고 약간 허스키한 중년 내레이터")를 입력하면, AI가 그 설명에 맞는 완전히 새로운 목소리를 생성하며, 이는 즉시 텍스트 투 스피치(TTS)에 사용할 수 있습니다.

이는 기존 인물의 목소리를 녹음본에서 복제하는 보이스 클로닝과는 근본적으로 다릅니다. 보이스 디자인으로 만든 목소리는 세상에 없던 목소리입니다. 그 어디에서도 다른 누구도 사용하고 있지 않은 목소리죠.


보이스 디자인으로 나만의 AI 보이스를 만드는 방법 (단계별 안내)

설명만으로 AI 보이스를 만드는 방법이 궁금하신가요? 처음부터 끝까지의 전체 워크플로우를 소개합니다. 보이스 생성 페이지로 이동하여 **보이스 디자인(Voice Design)**을 선택하세요.

인스턴트 보이스 클론, 보이스 디자인, 프로페셔널 보이스 클론 옵션을 보여주는 Fish Audio 보이스 생성 페이지

1단계: 원하는 목소리 묘사하기

Fish Audio 보이스 디자인 인터페이스 — 원하는 AI 보이스를 텍스트로 설명

설명 상자에 상상하고 있는 목소리를 구체적으로 작성합니다. 더 구체적일수록 좋습니다. 다음 요소들을 포함해 보세요:

  • 나이 및 성별 — "30대 후반 여성"
  • 억양 — "부드러운 미국 억양", "가벼운 영국풍 리듬"
  • 톤 및 질감 — "허스키한", "맑은", "약간 걸걸한"
  • 속도 — "느긋하고 여유 있는", "빠르고 활기찬"
  • 분위기 및 맥락 — "조용한 방에서 단 한 명의 청자에게 이야기하는 것처럼"

어디서부터 시작해야 할지 모르겠나요? 따뜻한 심야 라디오 호스트, 다큐멘터리 내레이터, 어린이 동화 구연가와 같은 내장 스타터 프롬프트를 사용하고 이를 수정해 보세요.

선택 사항으로 미리보기 텍스트(샘플이 읽을 대본)를 추가하거나, 비워두어 시스템이 문맥에 맞는 샘플을 작성하게 할 수도 있습니다. 준비가 되면 샘플 생성을 누릅니다. 생성에는 보통 2,000 크레딧이 소요되지만, 출시 기간 동안은 무료입니다.

2단계: 생성된 두 가지 보이스 샘플을 비교하고 선택하기

Fish Audio 보이스 디자인에서 생성된 두 가지 AI 보이스 샘플 중 하나 선택하기

보이스 디자인은 프롬프트를 바탕으로 두 가지 서로 다른 보이스 샘플을 생성합니다. 둘 다 들어보고 비교한 뒤, 가장 적합한 것을 선택하세요. 마음에 쏙 들지 않나요? 설명을 조금 수정하고 샘플 재생성을 누르세요. 출시 기간 동안은 반복 작업에 비용이 들지 않으므로 머릿속의 목소리와 똑같아질 때까지 다듬어 보세요.

3단계: 나만의 보이스 모델로 저장하기

Fish Audio에서 보이스 상세 정보와 함께 맞춤형 AI 보이스 모델 저장하기

'계속하기'를 눌러 선택한 샘플을 재사용 가능한 보이스 모델로 변환합니다:

  • 이름 및 커버 — 보이스에 정체성 부여
  • 태그 — 성별, 나이, 보이스 스타일(따뜻함, 부드러움, 깊음, 숨소리가 섞인...)
  • 사용 사례 — 대화형, 내레이션, 캐릭터 보이스, 소셜 미디어, 교육, 광고 또는 엔터테인먼트

Fish Audio에서 AI 보이스 공개 범위를 공개, 일부 공개 또는 비공개로 설정

그런 다음 사용 가능 범위를 선택하세요:

  • 공개 — 검색 페이지에 노출되어 누구나 찾고 사용 가능
  • 일부 공개 — 검색 결과에서 숨겨지며, 직접 링크를 통해서만 공유 가능
  • 비공개 — 본인에게만 보임

해당 목소리가 식별 가능한 실제 인물을 사칭하지 않음을 확인하고 보이스 생성을 클릭하면 완료됩니다. 이제 커스텀 AI 보이스가 라이브러리에 저장되어 모든 TTS 프로젝트에 사용할 준비가 되었습니다. S2의 단어 수준 인라인 태그를 사용하면 모든 대사의 전달 방식을 정밀하게 지시할 수 있습니다.

스타터 프롬프트로 시작하기 → — 출시 기간 동안 생성이 무료입니다.


더 나은 보이스 디자인 프롬프트를 작성하는 방법

보이스의 퀄리티는 설명의 퀄리티에 좌우됩니다. 평범한 결과물과 완벽한 결과물을 가르는 차이점은 다음과 같습니다.

이 스타터 프롬프트를 예로 들어보겠습니다:

"30대 후반의 부드럽고 허스키한 목소리를 가진 따뜻하고 친밀한 심야 라디오 호스트. 조용한 방에서 한 명의 청취자에게 말하는 것처럼 느긋하고 여유 있는 속도에 가끔 부드러운 웃음소리가 섞임."

이 프롬프트의 특징을 살펴보세요:

  1. 페르소나 설정 ("심야 라디오 호스트") — 모델이 즉시 특성화할 수 있는 역할로, 단순히 10개의 형용사를 나열하는 것보다 강력합니다.

  2. 구체적인 음성 특성 중첩 ("부드럽고 허스키한") — "좋은"이나 "괜찮은" 같은 모호한 단어보다 질감을 나타내는 단어가 효과적입니다.

  3. 전달 방식 지정 ("느긋하고 여유 있는 속도에 가끔 부드러운 웃음소리가 섞임") — 속도와 고유한 습관이 목소리에 생명력을 불어넣습니다.

  4. 장면 설정 ("조용한 방에서 한 명의 청취자에게 말하는 것처럼") — 맥락은 어떤 형용사보다 친밀감과 에너지를 더 잘 형성합니다.

나쁜 예: "상냥하고 맑은 여성의 목소리."

좋은 예: "밝은 호주 억양을 가진 20대 발랄한 관광 가이드. 빠르고 장난기 넘치는 속도로, 항상 미소를 머금고 말하는 듯한 느낌."

하나의 페르소나, 서너 개의 감각적 디테일, 하나의 장면. 이것이 성공 공식입니다.


오리지널 캐릭터를 위해 구축된 캐릭터 보이스 생성기

게임, 애니메이션, 오디오북, 오디오 드라마 또는 버추얼 컴패니언을 위한 캐릭터를 만드신다면, 보이스 디자인은 모든 목소리가 독창적이라는 결정적인 장점을 가진 캐릭터 보이스 생성기 역할을 합니다.

라이브러리의 목소리는 수천 명의 사용자가 공유합니다. 여러분의 악당이 다른 사람의 명상 앱 목소리와 같아서는 안 됩니다. 가상 캐릭터를 위해 실제 인물의 목소리를 클로닝하는 것은 동의 및 라이선스 문제를 일으킬 수 있습니다. 디자인된 보이스는 이 두 가지 문제를 모두 피할 수 있습니다. 실제 인물의 유사성 없이 오직 여러분의 캐릭터만을 위해 구축된 목소리이기 때문입니다.

아이디어를 얻기 위한 몇 가지 프롬프트 방향입니다 (현실적인 것부터 환상적인 것까지):

  • "느릿하고 웅얼거리는 듯한 말투와 연극적인 위협감을 가진 고대의 걸걸한 용"
  • "말이 빠르고 흥분하면 목소리가 약간 갈라지는 하이퍼액티브한 10대 소년 발명가"
  • "속삭이는 듯한 부드러운 톤과 신중한 멈춤이 있는 평온한 노인 사서"
  • "50대 남성 하드보일드 형사. 낮고 걸걸한 단조로운 톤, 세상사에 지친 건조한 말투"
  • "걸걸한 이탈리아 억양을 가진 쾌활한 요리 프로그램 진행자. 크고 표현력이 풍부하며 항상 웃기 직전의 상태"
  • "오류가 있는 함선 AI: 단조롭고 정확하며, 약간 지나치게 침착하고 끊어지는 듯한 로봇 같은 리듬"

생성하고, 두 샘플을 비교하고, 다듬고, 저장하세요 — 단 하루 오후 만에 오리지널 캐스팅 전체를 완료할 수 있습니다. 그런 다음 멀티스피커 텍스트 투 스피치(multispeaker text to speech)를 사용하여 한 장면에 배치하거나, 다른 사람들이 만든 AI 캐릭터 보이스 둘러보기를 통해 영감을 얻어보세요.


보이스 디자인 vs. 보이스 클로닝: 어떤 것을 사용해야 할까요?

Fish Audio는 이제 보이스를 만드는 세 가지 방법을 제공하며, 각각 용도가 다릅니다.

보이스 디자인인스턴트 보이스 클론프로페셔널 보이스 클론
입력값텍스트 설명약 10초 분량의 오디오스튜디오급 녹음본
소요 시간약 15초약 1분1~2시간
적합한 용도오리지널 캐릭터 및 완전히 새로운 목소리기존 녹음본의 빠른 복제검증된 실제 인물의 스튜디오급 클론
기존 존재 여부아니요 — 처음부터 생성됨예 — 소유권 확인 포함

간단한 규칙: 목소리가 아직 존재하지 않는다면 디자인하세요. 이미 존재한다면 클론하세요.

디자인을 통한 독창성

디자인된 보이스에는 언급할 만한 또 다른 장점이 있습니다. 바로 누구의 것도 빌려오지 않는다는 점입니다. 모든 보이스 디자인 출력물은 개인의 녹음본이 아닌 설명을 바탕으로 생성됩니다. 또한 Fish Audio에서 생성된 모든 보이스는 식별 가능한 실제 인물을 사칭하지 않는다는 확인 절차를 거쳐야 합니다. 이는 여러분의 프로젝트가 동의 및 초상권 문제로부터 자유로울 수 있도록 설계된 워크플로우입니다.

필요한 목소리가 실제 인물(본인 또는 성우)의 것일 때, 저희는 그 경계를 흐리는 것이 아니라 소유권을 명확히 하는 것이 정답이라고 믿습니다. 전 세계의 성우들이 바로 이 점을 요구하고 있습니다. AI 시대에 자신의 목소리가 어떻게 사용되는지에 대한 동의와 정당한 보상을 원하는 것이죠. 이것이 바로 새로운 **프로페셔널 보이스 클론(Professional Voice Clone)**의 취지입니다. 실시간 소유권 확인을 바탕으로 구축된 실제 인물의 검증된 스튜디오급 클론으로, 보이스 소유자를 위한 선택적 상업적 출시 및 수익 공유 모델을 제공합니다. 이는 보이스 소유자와 이를 사용하려는 사람들 사이의 더 투명한 거래의 시작입니다. 이에 대한 자세한 내용은 곧 공개될 심층 분석에서 다루겠습니다.


15초 만에 첫 번째 보이스 디자인하기

예전에는 딱 맞는 목소리를 찾으려면 성우 오디션을 보거나, 라이브러리를 뒤지거나, "그나마 비슷한" 목소리로 타협해야 했습니다. 이제는 잘 쓴 문장 하나면 충분합니다.

무료로 첫 보이스 디자인하기 → — 출시 기간 동안 무료입니다.

Sabrina Shu

Sabrina Shu

Sabrina is part of Fish Audio's support and marketing team, helping users get the most out of AI voice products while turning launches, updates, and customer insights into clear, practical content.

Sabrina Shu의 더 많은 글 보기

실감 나는 목소리를 만들어보세요

오늘부터 최고 품질의 오디오를 생성하세요.

이미 계정이 있으신가요? 로그인