Oferta por tiempo limitado- 50% DE DESCUENTO ANUALCanjear
13 jun 2026GUÍA

Diseño de voces por IA: Crea una voz personalizada a partir de una descripción de texto

Diseño de voces por IA: Crea una voz personalizada a partir de una descripción de texto

Describe una voz con palabras sencillas y Voice Design de Fish Audio la generará en unos 15 segundos. Crea voces de personajes personalizadas con IA; gratis durante el lanzamiento.

Necesitas una voz que aún no existe. Tal vez sea un compañero robot sarcástico para tu juego, un narrador cálido para tu documental o un locutor de radio nocturno para la introducción de tu podcast. Explorar bibliotecas de voces te ofrece las mismas cien voces que todo el mundo utiliza, y la clonación de voz requiere que una persona real grabe muestras primero.

Voice Design resuelve esto de forma diferente. Ya disponible en Fish Audio, te permite crear una voz de IA personalizada y completamente original describiéndola con texto sencillo —edad, género, acento, tono, ritmo, estado de ánimo— y convierte esa descripción en un modelo de voz utilizable en unos 15 segundos. Sin grabaciones, sin actores de voz, sin buscar en bibliotecas.

Durante el lanzamiento, la generación de voces con Voice Design es completamente gratuita (normalmente cuesta 2.000 créditos por generación).

Prueba Voice Design ahora →


¿Qué es el diseño de voces por IA?

El diseño de voces por IA es el proceso de crear una voz sintética personalizada y original a partir de una descripción escrita en lugar de una muestra de audio. Escribes un prompt que describe cómo debe sonar la voz —por ejemplo, "un narrador de mediana edad, de voz cálida y ligeramente ronca con un suave acento estadounidense"— y la IA genera una voz totalmente nueva que coincide con esa descripción, lista para usarse en texto a voz.

Esto hace que el diseño de voces sea fundamentalmente diferente de la clonación de voz, que replica la voz de una persona existente a partir de grabaciones. Con el diseño de voces, la voz que creas nunca ha existido antes: nadie más la está usando en ningún lugar.


Cómo crear tu propia voz de IA con Voice Design (Paso a paso)

¿Te preguntas cómo crear una voz de IA a partir de nada más que una descripción? Aquí tienes el flujo de trabajo completo, de principio a fin. Dirígete a la página de creación de voz y selecciona Voice Design.

Página de creación de voz de Fish Audio que muestra las opciones Instant Voice Clone, Voice Design y Professional Voice Clone

Paso 1: Describe la voz que quieres

Interfaz de Voice Design de Fish Audio: describe la voz de IA que quieres en texto sencillo

En el cuadro de descripción, escribe la voz que estás imaginando. Cuanto más específico seas, mejor. Cubre estas dimensiones:

  • Edad y género — "una mujer de unos 30 años"
  • Acento — "suave acento estadounidense", "ligero acento británico"
  • Tono y textura — "ronco", "brillante", "ligeramente áspero"
  • Ritmo — "relajado y sin prisas", "rápido y enérgico"
  • Estado de ánimo y contexto — "como si estuviera hablando a un solo oyente en una habitación tranquila"

¿No sabes por dónde empezar? Utiliza uno de los prompts de inicio integrados, como un cálido locutor de radio nocturno, un narrador de documentales o un cuentacuentos infantil, y edítalo desde ahí.

También puedes añadir un texto de vista previa opcional (el guion que locutarán tus muestras) o dejarlo en blanco para que el sistema escriba una muestra contextual por ti. Cuando estés listo, pulsa Generar muestras. La generación cuesta normalmente 2.000 créditos, pero es gratuita durante el lanzamiento.

Paso 2: Compara dos muestras de voz generadas y elige una

Selección entre dos muestras de voz de IA generadas en Voice Design de Fish Audio

Voice Design genera dos muestras de voz distintas a partir de tu prompt. Reproduce ambas, compáralas y selecciona la que mejor encaje. ¿No es del todo correcta? Ajusta tu descripción y pulsa Regenerar muestras; iterar no cuesta nada durante el periodo de lanzamiento, así que refínala hasta que suene exactamente como la voz que tienes en mente.

Paso 3: Guárdala como tu propio modelo de voz

Guardando un modelo de voz de IA personalizado con detalles de la voz en Fish Audio

Pulsa Continuar y convierte la muestra elegida en un modelo de voz reutilizable:

  • Nombre y portada — dale una identidad a tu voz
  • Etiquetas — género, edad, estilo de voz (cálida, suave, profunda, jadeante...)
  • Casos de uso — conversacional, narración, voz de personaje, redes sociales, educativo, publicidad o entretenimiento

Configuración de la visibilidad de la voz de IA como pública, no listada o privada en Fish Audio

Luego elige quién puede usarla:

  • Pública — aparecerá en la página de descubrimiento para que todos puedan encontrarla y usarla
  • No listada — oculta del descubrimiento, compartible mediante enlace directo
  • Privada — visible solo para ti

Confirma que la voz no suplanta a una persona real e identificable, haz clic en Crear voz y habrás terminado. Tu voz de IA personalizada ahora reside en tu biblioteca, lista para cualquier proyecto de texto a voz y, con las etiquetas en línea a nivel de palabra de S2, puedes dirigir exactamente cómo entrega cada frase.

Comienza con un prompt de inicio → — la generación es gratuita durante el lanzamiento.


Cómo escribir mejores prompts para Voice Design

La calidad de tu voz depende de la calidad de tu descripción. Esto es lo que separa un resultado genérico de uno perfecto.

Toma este prompt de inicio:

"Un locutor de radio nocturno cálido e íntimo de unos 30 años con una voz suave y ronca. Ritmo relajado y sin prisas, con risas suaves ocasionales, como si estuviera hablando a un solo oyente en una habitación tranquila".

Observa lo que hace:

  1. Ancla una personalidad ("locutor de radio nocturno"): un papel que el modelo puede caracterizar instantáneamente, más potente que enumerar diez adjetivos.

  2. Acumula cualidades vocales concretas ("suave, ronca"): las palabras de textura superan a las vagas como "agradable" o "buena".

  3. Especifica la entrega ("ritmo relajado y sin prisas, con risas suaves ocasionales"): el ritmo y las peculiaridades dan vida a una voz.

  4. Establece la escena ("hablando a un solo oyente en una habitación tranquila"): el contexto moldea la intimidad y la energía mejor que cualquier adjetivo individual.

Prompt débil: "Una voz femenina, agradable y clara."

Prompt fuerte: "Una guía turística alegre de unos 20 años con un acento australiano marcado, ritmo rápido y juguetón, que suena como si siempre estuviera sonriendo."

Una personalidad, tres o cuatro detalles sensoriales, una escena. Esa es la fórmula.


Un generador de voces de personajes creado para personajes originales

Si creas personajes —para juegos, animaciones, audiolibros, dramas de audio o compañeros virtuales— Voice Design funciona como un generador de voces de personajes con una ventaja decisiva: cada voz es original.

Las voces de biblioteca son compartidas por miles de usuarios; tu villano no debería sonar como la aplicación de meditación de otra persona. Clonar la voz de una persona real para un personaje de ficción plantea dudas sobre el consentimiento y las licencias. Una voz diseñada evita ambos problemas: una voz construida para tu personaje, sin la imagen de una persona real detrás.

A continuación, algunas direcciones de prompts para despertar ideas, desde lo realista hasta lo totalmente fantástico:

  • "Un dragón antiguo y cavernoso con una entrega lenta y retumbante y una amenaza teatral"
  • "Un inventor adolescente hiperactivo, que habla rápido, la voz se quiebra ligeramente cuando se emociona"
  • "Una bibliotecaria anciana y serena con un tono suave como un susurro y pausas deliberadas"
  • "Un detective curtido de unos 50 años, monótono bajo y rasposo, cansado del mundo, entrega seca"
  • "Una animada presentadora de un programa de cocina con un marcado acento italiano, ruidosa, expresiva, siempre a punto de reír"
  • "Una IA de nave con fallos: plana, precisa, un poco demasiado tranquila, con una cadencia robótica entrecortada"

Genera, compara dos muestras, refina, guarda: un elenco original completo en una tarde. Luego ponlos juntos en una escena con el texto a voz multivoz, o explora voces de personajes de IA que otros han creado para inspirarte.


Voice Design frente a la clonación de voz: ¿Cuál deberías usar?

Fish Audio ofrece ahora tres formas de crear una voz, y cada una sirve para trabajos diferentes:

Voice DesignInstant Voice CloneProfessional Voice Clone
EntradaUna descripción de texto~10s de audioGrabaciones de calidad de estudio
Tiempo~15 segundos~1 minuto1–2 horas
Ideal paraPersonajes originales y voces nuevasReplicar rápidamente una grabación existenteClon verificado de calidad de estudio de una persona real
¿Ya existe la voz?No — creada desde ceroSí — con verificación de propiedad

La regla general es: si la voz aún no existe, diséñala. Si ya existe, clónala.

Original por diseño

Hay un beneficio más sutil en las voces diseñadas que vale la pena mencionar: no toman prestado de nadie. Cada salida de Voice Design se genera a partir de una descripción, no de las grabaciones de una persona, y cada voz creada en Fish Audio debe pasar una confirmación de que no suplanta a una persona real e identificable. Es un flujo de trabajo diseñado para mantener tu proyecto libre de problemas de consentimiento e imagen.

Y cuando la voz que necesitas pertenece a una persona real —la tuya o la de un actor de voz— creemos que la respuesta no es desdibujar esa línea, sino hacer explícita la propiedad. Los actores de voz de todo el mundo están presionando precisamente por esto: consentimiento y compensación justa por cómo se usan sus voces en la era de la IA. Esa es la idea detrás de nuestro nuevo Professional Voice Clone: un clon verificado y de calidad de estudio de la voz de una persona real, basado en la verificación de propiedad en tiempo real, con lanzamiento comercial opcional y reparto de ingresos para el propietario de la voz. Es el comienzo de un trato más limpio entre los propietarios de voces y las personas que quieren usarlas; daremos más detalles en nuestro próximo análisis profundo.


Diseña tu primera voz en 15 segundos

Conseguir la voz adecuada solía significar audicionar actores, buscar en bibliotecas o conformarse con algo "suficientemente parecido". Ahora significa escribir una buena frase.

Diseña tu primera voz gratis → — gratis durante el lanzamiento.

Sabrina Shu

Sabrina Shu

Sabrina is part of Fish Audio's support and marketing team, helping users get the most out of AI voice products while turning launches, updates, and customer insights into clear, practical content.

Leer más de Sabrina Shu

Crea voces que se sienten reales

Comienza a generar audio de la más alta calidad hoy mismo.

¿Ya tienes una cuenta? Iniciar sesión