Conception de voix par IA : créez une voix personnalisée à partir d'une simple invite textuelle
Décrivez une voix avec des mots simples et le Voice Design de Fish Audio la génère en environ 15 secondes. Créez des voix de personnages IA personnalisées — gratuit pendant le lancement.
Vous avez besoin d'une voix qui n'existe pas encore. C'est peut-être un acolyte robotique sarcastique pour votre jeu, un narrateur chaleureux pour votre documentaire, ou un animateur radio nocturne pour l'introduction de votre podcast. Parcourir les bibliothèques de voix vous amène aux cent mêmes voix que tout le monde utilise, et le clonage de voix nécessite qu'une personne réelle enregistre d'abord des échantillons.
Le Voice Design résout ce problème différemment. Désormais disponible sur Fish Audio, il vous permet de créer une voix IA complètement originale et personnalisée en la décrivant en texte brut — âge, genre, accent, ton, rythme, humeur — et transforme cette description en un modèle de voix utilisable en environ 15 secondes. Pas d'enregistrements, pas d'acteurs vocaux, pas de recherche interminable en bibliothèque.
Pendant le lancement, la génération de voix avec Voice Design est totalement gratuite (normalement 2 000 crédits par génération).
Qu'est-ce que le Voice Design par IA ?
La conception de voix par IA est le processus de création d'une voix synthétique originale et personnalisée à partir d'une description écrite plutôt que d'un échantillon audio. Vous tapez une invite décrivant le son de la voix — par exemple, « un narrateur d'âge moyen, chaleureux, à la voix légèrement éraillée avec un doux accent américain » — et l'IA génère une toute nouvelle voix correspondant à cette description, prête à être utilisée pour la synthèse vocale.
Cela rend la conception de voix fondamentalement différente du clonage de voix, qui reproduit la voix d'une personne existante à partir d'enregistrements. Avec le Voice Design, la voix que vous créez n'a jamais existé auparavant — personne d'autre ne l'utilise, nulle part.
Comment créer votre propre voix IA avec Voice Design (étape par étape)
Vous vous demandez comment créer une voix IA à partir de rien d'autre qu'une description ? Voici le flux de travail complet, de A à Z. Rendez-vous sur la page Créer une voix et sélectionnez Voice Design.
Étape 1 : Décrivez la voix que vous voulez
Dans la zone de description, décrivez la voix que vous imaginez. Plus vous êtes spécifique, mieux c'est. Couvrez ces dimensions :
- Âge et genre — « une femme d'une trentaine d'années »
- Accent — « doux accent américain », « léger accent britannique »
- Ton et texture — « rauque », « brillant », « légèrement éraillé »
- Rythme — « détendu et sans hâte », « rapide et énergique »
- Humeur et contexte — « comme s'ils parlaient à un seul auditeur dans une pièce calme »
Vous ne savez pas par où commencer ? Utilisez l'une des invites de démarrage intégrées, comme un animateur radio de fin de soirée, un narrateur de documentaire ou un conteur pour enfants — et modifiez-la à partir de là.
Vous pouvez également ajouter un texte d'aperçu facultatif (le script que vos échantillons liront), ou laisser vide pour que le système écrive un échantillon contextuel pour vous. Lorsque vous êtes prêt, cliquez sur Générer des échantillons. La génération coûte normalement 2 000 crédits, mais elle est gratuite pendant le lancement.
Étape 2 : Comparez deux échantillons de voix générés et choisissez-en un
Voice Design génère deux échantillons de voix distincts à partir de votre invite. Écoutez les deux, comparez et sélectionnez celui qui convient le mieux. Ce n'est pas tout à fait ça ? Ajustez votre description et cliquez sur Regénérer des échantillons — l'itération ne coûte rien pendant la période de lancement, alors affinez jusqu'à ce que cela sonne exactement comme la voix dans votre tête.
Étape 3 : Enregistrez-la comme votre propre modèle de voix
Cliquez sur Continuer et transformez l'échantillon choisi en un modèle de voix réutilisable :
- Nom et couverture — donnez une identité à votre voix
- Tags — genre, âge, style de voix (chaleureux, lisse, profond, soufflé...)
- Cas d'utilisation — conversationnel, narration, voix de personnage, réseaux sociaux, éducatif, publicité ou divertissement
Choisissez ensuite qui peut l'utiliser :
- Public — répertorié sur la page de découverte pour que tout le monde puisse le trouver et l'utiliser
- Non répertorié — caché de la découverte, partageable via un lien direct
- Privé — visible uniquement par vous
Confirmez que la voix n'imite pas une personne réelle et identifiable, cliquez sur Créer une voix, et le tour est joué. Votre voix IA personnalisée réside maintenant dans votre bibliothèque, prête pour tout projet de synthèse vocale — et avec les balises inline au niveau du mot de S2, vous pouvez diriger exactement la manière dont elle délivre chaque ligne.
Commencer avec une invite de démarrage → — la génération est gratuite pendant le lancement.
Comment écrire de meilleures invites pour le Voice Design
La qualité de votre voix dépend de la qualité de votre description. Voici ce qui différencie un résultat générique d'un résultat parfait.
Prenons cette invite de démarrage :
« Un animateur de radio de nuit chaleureux et intimiste, d'une trentaine d'années, avec une voix douce et éraillée. Rythme détendu et sans hâte avec de légers rires occasionnels, comme s'il s'adressait à un seul auditeur dans une pièce calme. »
Remarquez ce qu'elle fait :
-
Ancre un personnage (« animateur de radio de nuit ») — un rôle que le modèle peut instantanément caractériser, plus puissant que de lister dix adjectifs.
-
Cumule des qualités vocales concrètes (« douce et éraillée ») — les mots de texture l'emportent sur les mots vagues comme « sympa » ou « bon ».
-
Spécifie la prestation (« rythme détendu et sans hâte avec de légers rires occasionnels ») — le rythme et les petites manies donnent vie à une voix.
-
Plante le décor (« s'adressant à un seul auditeur dans une pièce calme ») — le contexte façonne l'intimité et l'énergie mieux que n'importe quel adjectif seul.
Invite faible : « Une voix féminine, agréable et claire. »
Invite forte : « Une guide touristique joyeuse d'une vingtaine d'années avec un accent australien marqué, un rythme rapide et enjoué, sonnant toujours comme si elle souriait. »
Un personnage, trois ou quatre détails sensoriels, une scène. C'est la formule.
Un générateur de voix de personnage conçu pour des personnages originaux
Si vous créez des personnages — pour des jeux, des animations, des livres audio, des fictions audio ou des compagnons virtuels — le Voice Design fonctionne comme un générateur de voix de personnage avec un avantage décisif : chaque voix est originale.
Les voix de bibliothèque sont partagées par des milliers d'utilisateurs ; votre méchant ne devrait pas ressembler à l'application de méditation de quelqu'un d'autre. Cloner la voix d'une personne réelle pour un personnage de fiction soulève des questions de consentement et de licence. Une voix conçue évite les deux — une voix construite pour votre personnage, sans aucune ressemblance avec une personne réelle.
Quelques directions d'invites pour stimuler les idées — du plus réaliste au plus fantastique :
- « Un dragon ancien à la voix caverneuse avec une diction lente et grondante et une menace théâtrale »
- « Un inventeur adolescent hyperactif, parle très vite, la voix mue légèrement quand il est excité »
- « Une bibliothécaire âgée et sereine avec un ton doux comme un murmure et des pauses délibérées »
- « Un détective dur à cuire d'une cinquantaine d'années, voix grave et monotone, lassé du monde, diction sèche »
- « Une animatrice d'émission de cuisine pétillante avec un fort accent italien, bruyante, expressive, toujours au bord du rire »
- « Une IA de vaisseau buggée : plate, précise, un peu trop calme, avec une cadence robotique saccadée »
Générez, comparez deux échantillons, affinez, enregistrez — tout un casting original en un après-midi. Mettez-les ensuite en scène ensemble avec la synthèse vocale multi-locuteur, ou parcourez les voix de personnages IA créées par d'autres pour vous inspirer.
Voice Design vs. Voice Cloning : Lequel utiliser ?
Fish Audio propose désormais trois façons de créer une voix, et elles répondent à des besoins différents :
| Voice Design | Instant Voice Clone | Professional Voice Clone | |
|---|---|---|---|
| Entrée | Une description textuelle | ~10s d'audio | Enregistrements de qualité studio |
| Temps | ~15 secondes | ~1 minute | 1–2 heures |
| Idéal pour | Personnages originaux & nouvelles voix | Répliquer rapidement un enregistrement | Clone vérifié, de qualité studio d'un humain |
| La voix existe déjà ? | Non — créée de toutes pièces | Oui | Oui — avec vérification de propriété |
La règle de base : si la voix n'existe pas encore, concevez-la. Si elle existe, clonez-la.
Original par conception
Il existe un avantage plus discret aux voix conçues qui mérite d'être mentionné : elles n'empruntent rien à personne. Chaque sortie de Voice Design est générée à partir d'une description, et non à partir des enregistrements d'une personne — et chaque voix créée sur Fish Audio doit passer une confirmation qu'elle n'imite pas une personne réelle identifiable. C'est un flux de travail conçu pour que votre projet reste à l'abri des problèmes de consentement et de droit à l'image.
Et quand la voix dont vous avez besoin appartient à une personne réelle — la vôtre, ou celle d'un doubleur — nous pensons que la solution n'est pas de brouiller cette ligne, mais de rendre la propriété explicite. Les acteurs vocaux du monde entier réclament exactement cela : le consentement et une rémunération équitable pour la façon dont leurs voix sont utilisées à l'ère de l'IA. C'est l'idée derrière notre nouveau Professional Voice Clone : un clone vérifié de qualité studio de la voix d'une personne réelle, basé sur une vérification de propriété en temps réel, avec une option de sortie commerciale et de partage des revenus pour le propriétaire de la voix. C'est le début d'un accord plus sain entre les propriétaires de voix et les personnes qui souhaitent les utiliser — nous en reparlerons plus en détail prochainement.
Concevez votre première voix en 15 secondes
Trouver la bonne voix consistait autrefois à auditionner des acteurs, fouiller dans des bibliothèques ou se contenter d'un résultat « assez proche ». Désormais, il suffit d'écrire une bonne phrase.
Concevoir votre première voix gratuitement → — gratuit pendant le lancement.
Sabrina is part of Fish Audio's support and marketing team, helping users get the most out of AI voice products while turning launches, updates, and customer insights into clear, practical content.
Lire plus de Sabrina Shu
