13 jun 2026Guía

Diseño de Voz con IA: crea una voz personalizada a partir de una sola instrucción de texto

Sabrina Shu, Support & Marketing Specialist

Diseño de Voz con IA: crea una voz personalizada a partir de una sola instrucción de texto

Describe una voz con palabras sencillas y Voice Design de Fish Audio la genera en unos 15 segundos. Crea voces de personajes con IA personalizadas; gratis durante el lanzamiento.

Necesitas una voz que aún no existe. Tal vez sea un robot sarcástico para tu juego, un narrador cálido para tu documental o un locutor de radio nocturno para la intro de tu podcast. Navegar por bibliotecas de voces te ofrece las mismas cien voces que todos los demás están usando, y la clonación de voz requiere que una persona real grabe muestras primero.

Voice Design lo resuelve de forma diferente. Ya disponible en Fish Audio, te permite crear una voz de IA completamente original y personalizada describiéndola en texto plano —edad, género, acento, tono, ritmo, estado de ánimo— y convierte esa descripción en un modelo de voz utilizable en unos 15 segundos. Sin grabaciones, sin actores de voz, sin bucear en bibliotecas.

Durante el lanzamiento, la generación de voz con Voice Design es totalmente gratuita (normalmente 2.000 créditos por generación).

Prueba Voice Design ahora →

¿Qué es el Diseño de Voz con IA?

El diseño de voz con IA es el proceso de crear una voz sintética original y personalizada a partir de una descripción escrita en lugar de una muestra de audio. Escribes un prompt que describe cómo debe sonar la voz —por ejemplo, "un narrador de mediana edad, cálido y ligeramente ronco, con un suave acento estadounidense"— y la IA genera una voz totalmente nueva que coincide con esa descripción, lista para usarse en texto a voz.

Esto hace que el diseño de voz sea fundamentalmente diferente de la clonación de voz, que replica la voz de una persona existente a partir de grabaciones. Con el diseño de voz, la voz que creas nunca ha existido antes; nadie más la está usando en ningún lugar.

Cómo crear tu propia voz de IA con Voice Design (Paso a paso)

¿Te preguntas cómo hacer una voz de IA a partir de nada más que una descripción? Aquí tienes el flujo de trabajo completo, de principio a fin. Ve a la página de creación de voz y selecciona Voice Design.

Página de creación de voz de Fish Audio mostrando las opciones Instant Voice Clone, Voice Design y Professional Voice Clone

Paso 1: Describe la voz que quieres

Interfaz de Fish Audio Voice Design — describe la voz de IA que quieres en texto plano

En el cuadro de descripción, escribe la voz que estás imaginando. Cuanto más específico, mejor. Cubre estas dimensiones:

Edad y género — "una mujer de unos 30 años"
Acento — "suave acento estadounidense", "ligero deje británico"
Tono y textura — "ronco", "brillante", "ligeramente áspero"
Ritmo — "relajado y sin prisas", "rápido y enérgico"
Estado de ánimo y contexto — "como si estuviera hablando con un solo oyente en una habitación tranquila"

¿No sabes por dónde empezar? Utiliza uno de los prompts de inicio integrados, como un cálido locutor de radio nocturno, un narrador de documentales o un cuentacuentos infantil, y edítalo desde ahí.

También puedes añadir un texto de vista previa opcional (el guion que dirán tus muestras) o dejarlo en blanco y dejar que el sistema escriba una muestra contextual por ti. Cuando estés listo, haz clic en Generate Samples. La generación normalmente cuesta 2.000 créditos, pero es gratuita durante el lanzamiento.

Paso 2: Compara dos muestras de voz generadas y elige una

Elegir entre dos muestras de voz de IA generadas en Fish Audio Voice Design

Voice Design genera dos muestras de voz distintas a partir de tu prompt. Reproduce ambas, compara y selecciona la que mejor encaje. ¿No es del todo correcta? Ajusta tu descripción y haz clic en Re-generate Samples —iterar no cuesta nada durante el periodo de lanzamiento, así que refínala hasta que suene exactamente como la voz que tienes en la cabeza.

Paso 3: Guárdala como tu propio modelo de voz

Guardar un modelo de voz de IA personalizado con detalles de voz en Fish Audio

Haz clic en Continuar y convierte tu muestra elegida en un modelo de voz reutilizable:

Nombre y portada — dale una identidad a tu voz
Etiquetas — género, edad, estilo de voz (cálida, suave, profunda, jadeante...)
Casos de uso — conversacional, narración, voz de personaje, redes sociales, educativo, publicidad o entretenimiento

Configuración de la visibilidad de la voz de IA a pública, no listada o privada en Fish Audio

Luego elige quién puede usarla:

Pública — aparece en la página de descubrimiento para que todos la encuentren y usen
No listada — oculta del descubrimiento, compartible mediante enlace directo
Privada — visible solo para ti

Confirma que la voz no suplanta a una persona real e identificable, haz clic en Create Voice y listo. Tu voz de IA personalizada ahora vive en tu biblioteca, lista para cualquier proyecto de texto a voz — y con las etiquetas en línea a nivel de palabra de S2, puedes dirigir exactamente cómo pronuncia cada frase.

Comienza con un prompt de inicio → — la generación es gratuita durante el lanzamiento.

Cómo escribir mejores prompts para Voice Design

La calidad de tu voz depende de la calidad de tu descripción. Aquí está lo que separa un resultado genérico de uno perfecto.

Toma este prompt de inicio:

"Un locutor de radio nocturno cálido e íntimo de unos 30 años con una voz suave y ronca. Ritmo relajado y sin prisas con risas suaves ocasionales, como si estuviera hablando con un solo oyente en una habitación tranquila".

Observa lo que hace:

Ancla una personalidad ("locutor de radio nocturno") — un rol que el modelo puede caracterizar al instante, más potente que enumerar diez adjetivos.
Acumula cualidades vocales concretas ("suave, ronca") — las palabras de textura vencen a las vagas como "agradable" o "buena".
Especifica la entrega ("ritmo relajado y sin prisas con risas suaves ocasionales") — el ritmo y las peculiaridades dan vida a una voz.
Establece el escenario ("hablando con un solo oyente en una habitación tranquila") — el contexto da forma a la intimidad y la energía mejor que cualquier adjetivo suelto.

Prompt débil: "Una voz femenina, agradable y clara."

Prompt fuerte: "Una guía turística alegre de unos 20 años con un marcado acento australiano, ritmo rápido y juguetón, que siempre parece estar sonriendo."

Una personalidad, tres o cuatro detalles sensoriales, una escena. Esa es la fórmula.

Un generador de voces de personajes creado para personajes originales

Si creas personajes —para juegos, animaciones, audiolibros, dramas de audio o compañeros virtuales— Voice Design funciona como un generador de voces de personajes con una ventaja decisiva: cada voz es original.

Las voces de biblioteca son compartidas por miles de usuarios; tu villano no debería sonar como la aplicación de meditación de otra persona. Clonar la voz de una persona real para un personaje de ficción plantea dudas sobre el consentimiento y las licencias. Una voz diseñada evita ambos problemas: una voz construida para tu personaje, sin la semejanza de una persona real detrás.

Algunas direcciones de prompts para despertar ideas, desde lo realista hasta lo totalmente fantástico:

"Un dragón antiguo y cavernoso con una entrega lenta y retumbante y una amenaza teatral"
"Un inventor adolescente hiperactivo, hablador rápido, la voz se le quiebra ligeramente cuando está emocionado"
"Una bibliotecaria anciana serena con un tono suave como un susurro y pausas deliberadas"
"Un detective curtido de unos 50 años, monótono bajo y grave, cansado del mundo, entrega seca"
"Una entusiasta presentadora de un programa de cocina con un marcado acento italiano, ruidosa, expresiva, siempre al borde de la risa"
"Una IA de nave con fallos: plana, precisa, un poco demasiado calmada, con una cadencia robótica entrecortada"

Genera, compara dos muestras, refina, guarda — un elenco original completo en una tarde. Luego ponlos juntos en una escena con texto a voz multipersona, o explora voces de personajes de IA que otros han creado para inspirarte.

Voice Design frente a Clonación de voz: ¿Cuál deberías usar?

Fish Audio ahora ofrece tres formas de crear una voz, y sirven para diferentes propósitos:

	Voice Design	Instant Voice Clone	Professional Voice Clone
Entrada	Una descripción de texto	~10s de audio	Grabaciones con calidad de estudio
Tiempo	~15 segundos	~1 minuto	1–2 horas
Ideal para	Personajes originales y voces nuevas	Replicar rápidamente una grabación existente	Clon verificado de calidad de estudio de una persona real
¿La voz ya existe?	No — creada desde cero	Sí	Sí — con verificación de propiedad

La regla de oro: si la voz aún no existe, diséñala. Si ya existe, clónala.

Original por diseño

Hay un beneficio más sutil en las voces diseñadas que vale la pena mencionar: no toman prestado de nadie. Cada salida de Voice Design se genera a partir de una descripción, no de las grabaciones de una persona — y cada voz creada en Fish Audio debe pasar una confirmación de que no suplanta a una persona real e identificable. Es un flujo de trabajo diseñado para mantener tu proyecto libre de preocupaciones sobre consentimiento e imagen.

Y cuando la voz que necesitas pertenece a una persona real —la tuya o la de un actor de voz— creemos que la respuesta no es difuminar esa línea, sino hacer que la propiedad sea explícita. Los actores de voz de todo el mundo están presionando precisamente por esto: consentimiento y compensación justa por cómo se usan sus voces en la era de la IA. Esa es la idea detrás de nuestro nuevo Professional Voice Clone: un clon verificado y con calidad de estudio de la voz de una persona real, basado en la verificación de propiedad en tiempo real, con lanzamiento comercial opcional y participación en los ingresos para el propietario de la voz. Es el comienzo de un trato más limpio entre los propietarios de las voces y las personas que quieren usarlas; hablaremos más de ello en nuestro próximo análisis profundo.

Diseña tu primera voz en 15 segundos

Conseguir la voz adecuada antes significaba hacer audiciones a actores, rebuscar en bibliotecas o conformarse con algo "suficientemente parecido". Ahora significa escribir una buena frase.

Diseña tu primera voz gratis → — gratis durante el lanzamiento.

Preguntas Frecuentes

¿Qué es el diseño de voz con IA?

El diseño de voz con IA es la creación de una voz sintética original a partir de una descripción de texto en lugar de una grabación de audio. Describes atributos como la edad, el acento, el tono y el ritmo, y la IA genera una nueva voz que coincide con esa descripción, utilizable para contenido de texto a voz.

¿Es gratuito Voice Design?

Sí — durante el lanzamiento, generar voces con Voice Design de Fish Audio es completamente gratuito. El precio estándar es de 2.000 créditos por generación. La creación y el guardado de tu modelo de voz están incluidos.

¿Cuál es la diferencia entre el diseño de voz y la clonación de voz?

La clonación de voz replica la voz de una persona existente a partir de muestras de audio. El diseño de voz crea una voz que nunca ha existido, basándose únicamente en una descripción escrita. La clonación es para reproducir una voz real; el diseño es para inventar una original.

¿Puedo usar una voz diseñada comercialmente?

Las voces diseñadas son creaciones originales que no se basan en grabaciones de ninguna persona real, lo que las convierte en una opción limpia para proyectos de contenido. Cada voz debe superar una confirmación de que no suplanta a una persona real e identificable, y su uso debe cumplir con la política de uso de Fish Audio.

¿Cómo escribo un buen prompt para el diseño de voz?

Ancla la voz en una personalidad (ej. "narrador de documentales"), añade tres o cuatro cualidades vocales concretas (ronca, brillante, áspera), especifica el ritmo y describe el contexto del habla. Las descripciones específicas y sensoriales superan sistemáticamente a los adjetivos vagos.

Sabrina Shu

Sabrina is part of Fish Audio's support and marketing team, helping users get the most out of AI voice products while turning launches, updates, and customer insights into clear, practical content.

Leer más de Sabrina Shu

Crea voces que se sienten reales

Comienza a generar audio de la más alta calidad hoy mismo.

Regístrate gratis

¿Ya tienes una cuenta? Iniciar sesión

Last Updates

Logotipo de Fish Audio sobre un fondo degradado de púrpura a rojo con confeti colorido, anunciando la ronda de financiación de 52 millones de dólares en fase semilla y agradeciendo a sus más de 8 millones de creadores.

27 jul 2026Empresa

5 modelos, 22 personas, 1 año

Rissa CaoCEO

Cómo hicimos que S2.1 Pro sea gratuito — Reconstruyendo el stack de inferencia desde cero

23 jul 2026Investigación

Cómo hicimos que nuestra API de texto a voz sea gratuita: la ingeniería de inferencia detrás de S2.1 Pro

Shijia LiaoChief Scientist

20 jul 2026Destacado del Creador

Alex Lee: Using AI Voice to Build More Human Characters

Fish Audio CommunityFish Audio Community Team

Diseño de Voz con IA: crea una voz personalizada a partir de una sola instrucción de texto

¿Qué es el Diseño de Voz con IA?

Cómo crear tu propia voz de IA con Voice Design (Paso a paso)

Paso 1: Describe la voz que quieres

Paso 2: Compara dos muestras de voz generadas y elige una

Paso 3: Guárdala como tu propio modelo de voz

Cómo escribir mejores prompts para Voice Design

Un generador de voces de personajes creado para personajes originales

Voice Design frente a Clonación de voz: ¿Cuál deberías usar?

Original por diseño

Diseña tu primera voz en 15 segundos

Preguntas Frecuentes

Crea voces que se sienten reales

Last Updates

5 modelos, 22 personas, 1 año

Cómo hicimos que nuestra API de texto a voz sea gratuita: la ingeniería de inferencia detrás de S2.1 Pro

Alex Lee: Using AI Voice to Build More Human Characters

Recommended

5 modelos, 22 personas, 1 año

Cómo hicimos que nuestra API de texto a voz sea gratuita: la ingeniería de inferencia detrás de S2.1 Pro

Fish Audio S2.1 Pro: API de Texto a Voz gratuita para desarrolladores

Clonación de voz profesional: un clon de tu voz verificado y con calidad de estudio

Sometimos nuestro TTS a una prueba a ciegas frente a todos los principales competidores. Aquí están los resultados.

Herramienta de transcripción de podcasts: Cómo transcribir tu podcast con Fish Audio