AI Voice Design: Crie uma Voz Personalizada a partir de um Único Comando de Texto
Descreva uma voz com palavras simples e o Voice Design da Fish Audio a gera em cerca de 15 segundos. Crie vozes personalizadas para personagens de IA — gratuito durante o lançamento.
Você precisa de uma voz que ainda não existe. Talvez seja um robô sarcástico para o seu jogo, um narrador acolhedor para o seu documentário ou um locutor de rádio noturno para a introdução do seu podcast. Navegar por bibliotecas de voz faz você encontrar as mesmas centenas de vozes que todo mundo está usando, e a clonagem de voz exige que uma pessoa real grave amostras primeiro.
Voice Design resolve isso de forma diferente. Já disponível na Fish Audio, ele permite criar uma voz de IA totalmente original e personalizada descrevendo-a em texto simples — idade, gênero, sotaque, tom, ritmo, humor — e transforma essa descrição em um modelo de voz utilizável em cerca de 15 segundos. Sem gravações, sem dubladores, sem buscas exaustivas em bibliotecas.
Durante o lançamento, a geração de voz com o Voice Design é totalmente gratuita (normalmente 2.000 créditos por geração).
O que é AI Voice Design?
O design de voz por IA é o processo de criação de uma voz sintética original e personalizada a partir de uma descrição escrita, em vez de uma amostra de áudio. Você digita um comando (prompt) descrevendo como a voz deve soar — por exemplo, "um narrador de meia-idade, acolhedor, com voz levemente áspera e um sotaque americano suave" — e a IA gera uma voz totalmente nova que corresponde a essa descrição, pronta para uso em conversão de texto em fala.
Isso torna o design de voz fundamentalmente diferente da clonagem de voz, que replica a voz de uma pessoa existente a partir de gravações. Com o design de voz, a voz que você cria nunca existiu antes — ninguém mais a está usando, em lugar nenhum.
Como criar sua própria voz de IA com Voice Design (Passo a passo)
Quer saber como criar uma voz de IA apenas com uma descrição? Aqui está o fluxo de trabalho completo, do início ao fim. Vá para a página Criar Voz e selecione Voice Design.
Passo 1: Descreva a voz que você deseja
Na caixa de descrição, escreva a voz que você está imaginando. Quanto mais específico, melhor. Cubra estas dimensões:
- Idade e gênero — "uma mulher no final dos 30 anos"
- Sotaque — "sotaque americano suave", "leve cadência britânica"
- Tom e textura — "rouco", "brilhante", "levemente áspero"
- Ritmo — "relaxado e sem pressa", "rápido e enérgico"
- Humor e contexto — "como se estivesse falando com um único ouvinte em uma sala silenciosa"
Não sabe por onde começar? Use um dos prompts iniciais integrados, como um locutor de rádio noturno acolhedor, um narrador de documentário ou um contador de histórias para crianças — e edite a partir daí.
Você também pode adicionar um texto de visualização opcional (o roteiro que suas amostras falarão) ou deixá-lo em branco e deixar o sistema escrever uma amostra contextual para você. Quando estiver pronto, clique em Gerar Amostras. A geração normalmente custa 2.000 créditos, mas é gratuita durante o lançamento.
Passo 2: Compare duas amostras de voz geradas e escolha uma
O Voice Design gera duas amostras de voz distintas a partir do seu comando. Ouça ambas, compare e selecione a que melhor se adapta. Não ficou perfeito? Ajuste sua descrição e clique em Regerar Amostras — iterar não custa nada durante o período de lançamento, então refine até soar exatamente como a voz na sua cabeça.
Passo 3: Salve como seu próprio modelo de voz
Clique em Continuar e transforme a amostra escolhida em um modelo de voz reutilizável:
- Nome e capa — dê uma identidade à sua voz
- Tags — gênero, idade, estilo de voz (acolhedor, suave, profundo, sussurrado...)
- Casos de uso — conversação, narração, voz de personagem, redes sociais, educacional, propaganda ou entretenimento
Em seguida, escolha quem pode usá-la:
- Público — listada na página de descoberta para que todos possam encontrar e usar
- Não listado — oculta da descoberta, compartilhável via link direto
- Privado — visível apenas para você
Confirme que a voz não personifica uma pessoa real e identificável, clique em Criar Voz e pronto. Sua voz de IA personalizada agora vive em sua biblioteca, pronta para qualquer projeto de conversão de texto em fala — e com as tags in-line ao nível da palavra do S2, você pode dirigir exatamente como ela entrega cada frase.
Comece com um prompt inicial → — a geração é gratuita durante o lançamento.
Como escrever melhores prompts para o Voice Design
A qualidade da sua voz depende da qualidade da sua descrição. Aqui está o que separa um resultado genérico de um perfeito.
Veja este prompt inicial:
"Um locutor de rádio noturno caloroso e íntimo, na casa dos 30 anos, com uma voz suave e rouca. Ritmo relaxado e sem pressa, com risadinhas suaves ocasionais, como se estivesse falando com um único ouvinte em uma sala silenciosa."
Observe o que ele faz:
-
Ancoragem de uma persona ("locutor de rádio noturno") — um papel que o modelo pode caracterizar instantaneamente, mais poderoso do que listar dez adjetivos.
-
Sobrepõe qualidades vocais concretas ("suave e rouca") — palavras de textura superam termos vagos como "agradável" ou "boa".
-
Especifica a entrega ("ritmo relaxado e sem pressa, com risadinhas suaves ocasionais") — o ritmo e as peculiaridades dão vida a uma voz.
-
Define o cenário ("falando com um único ouvinte em uma sala silenciosa") — o contexto molda a intimidade e a energia melhor do que qualquer adjetivo isolado.
Prompt fraco: "Uma voz feminina, agradável e clara."
Prompt forte: "Uma guia de turismo alegre na casa dos 20 anos com um sotaque australiano vibrante, ritmo rápido e brincalhão, sempre parecendo estar sorrindo."
Uma persona, três ou quatro detalhes sensoriais, uma cena. Essa é a fórmula.
Um gerador de voz de personagem feito para personagens originais
Se você cria personagens — para jogos, animações, audiolivros, dramas de áudio ou companheiros virtuais — o Voice Design funciona como um gerador de voz de personagens com uma vantagem decisiva: cada voz é original.
As vozes de biblioteca são compartilhadas por milhares de usuários; seu vilão não deve soar como o de um aplicativo de meditação de outra pessoa. Clonar a voz de uma pessoa real para um personagem fictício levanta questões de consentimento e licenciamento. Uma voz projetada evita ambos — uma voz construída para o seu personagem, sem a imagem de uma pessoa real por trás dela.
Aqui estão algumas direções de prompt para despertar ideias — do realista ao totalmente fantástico:
- "Um dragão antigo e rouco com uma entrega lenta e estrondosa e uma ameaça teatral"
- "Um inventor adolescente hiperativo, que fala rápido, com a voz falhando ligeiramente quando está animado"
- "Uma bibliotecária idosa serena com um tom suave como um sussurro e pausas deliberadas"
- "Um detetive durão de 50 anos, tom monótono baixo e rouco, cansado do mundo, entrega seca"
- "Uma apresentadora de programa de culinária animada com um sotaque italiano carregado, alta, expressiva, sempre prestes a rir"
- "Uma IA de nave espacial com falhas: plana, precisa, um pouco calma demais, com cadência robótica cortada"
Gere, compare duas amostras, refine, salve — um elenco original completo em uma tarde. Em seguida, coloque-os em uma cena juntos com a conversão de texto em fala multilocutor, ou navegue pelas vozes de personagens de IA que outros criaram para se inspirar.
Voice Design vs. Voice Cloning: Qual você deve usar?
A Fish Audio oferece agora três maneiras de criar uma voz, e elas servem para propósitos diferentes:
| Voice Design | Instant Voice Clone | Professional Voice Clone | |
|---|---|---|---|
| Entrada | Uma descrição de texto | ~10s de áudio | Gravações de qualidade de estúdio |
| Tempo | ~15 segundos | ~1 minuto | 1–2 horas |
| Ideal para | Personagens originais e vozes inéditas | Replicar rapidamente uma gravação existente | Clone verificado de nível de estúdio de uma pessoa real |
| A voz já existe? | Não — criada do zero | Sim | Sim — com verificação de propriedade |
A regra de ouro: se a voz ainda não existe, faça o design dela. Se ela existe, clone-a.
Original por design
Há um benefício mais silencioso nas vozes projetadas que vale a pena mencionar: elas não pegam nada emprestado de ninguém. Cada saída do Voice Design é gerada a partir de uma descrição, não de gravações de uma pessoa — e cada voz criada na Fish Audio deve passar por uma confirmação de que não personifica uma pessoa real e identificável. É um fluxo de trabalho projetado para manter seu projeto livre de preocupações com consentimento e uso de imagem.
E quando a voz de que você precisa pertence a uma pessoa real — a sua ou a de um dublador — acreditamos que a resposta não é confundir essa linha, mas tornar a propriedade explícita. Dubladores de todo o mundo estão lutando exatamente por isso: consentimento e remuneração justa pela forma como suas vozes são usadas na era da IA. Essa é a ideia por trás do nosso novo Professional Voice Clone: um clone verificado, com qualidade de estúdio, da voz de uma pessoa real, construído com verificação de propriedade em tempo real, com lançamento comercial opcional e compartilhamento de receita para o proprietário da voz. É o início de um acordo mais limpo entre os proprietários de voz e as pessoas que desejam usar suas vozes — falaremos mais sobre isso em nossa próxima análise detalhada.
Projete sua primeira voz em 15 segundos
A voz certa costumava significar fazer testes com atores, vasculhar bibliotecas ou se contentar com algo "próximo o suficiente". Agora, significa escrever uma boa frase.
Projete sua primeira voz gratuitamente → — grátis durante o lançamento.
Sabrina is part of Fish Audio's support and marketing team, helping users get the most out of AI voice products while turning launches, updates, and customer insights into clear, practical content.
Leia mais de Sabrina Shu
