AI Voice Design: Создайте кастомный голос по одному текстовому промту
Опишите голос простыми словами, и Voice Design от Fish Audio создаст его примерно за 15 секунд. Создавайте уникальные голоса ИИ-персонажей — бесплатно на этапе запуска.
Вам нужен голос, которого еще не существует. Возможно, это саркастичный робот-помощник для вашей игры, теплый голос диктора для документального фильма или ведущий ночного радио для вступления к подкасту. Просмотр библиотек голосов выдает ту же сотню вариантов, которую используют все остальные, а клонирование голоса требует, чтобы реальный человек сначала записал образцы.
Voice Design решает эту задачу иначе. Теперь на Fish Audio вы можете создать полностью оригинальный, кастомный ИИ-голос, описав его обычным текстом — возраст, пол, акцент, тон, темп, настроение — и превратить это описание в готовую голосовую модель примерно за 15 секунд. Никаких записей, никаких актеров озвучивания, никакого поиска по библиотекам.
На этапе запуска генерация голоса с помощью Voice Design абсолютно бесплатна (обычно 2 000 кредитов за генерацию).
Что такое AI Voice Design?
Проектирование ИИ-голоса (AI voice design) — это процесс создания кастомного оригинального синтетического голоса на основе текстового описания, а не аудиообразца. Вы вводите промт, описывающий, как должен звучать голос — например, «теплый, слегка хриплый голос диктора средних лет с мягким американским акцентом» — и ИИ генерирует совершенно новый голос, соответствующий этому описанию, готовый к использованию в системе текст-в-речь.
Это делает проектирование голоса принципиально отличным от клонирования голоса (voice cloning), которое копирует голос существующего человека из записей. С помощью проектирования голоса вы создаете голос, который никогда не существовал ранее — его никто и нигде больше не использует.
Как создать собственный ИИ-голос с помощью Voice Design (пошаговое руководство)
Хотите узнать, как создать ИИ-голос, имея только описание? Вот весь рабочий процесс от начала до конца. Перейдите на страницу Создать голос и выберите Voice Design.
Шаг 1: Опишите голос, который вы хотите
В поле описания опишите голос, который вы себе представляете. Чем конкретнее, тем лучше. Укажите следующие параметры:
- Возраст и пол — «женщина около 35 лет»
- Акцент — «мягкий американский акцент», «легкий британский выговор»
- Тон и текстура — «хриплый», «звонкий», «слегка сиплый»
- Темп — «расслабленный и неспешный», «быстрый и энергичный»
- Настроение и контекст — «как будто они разговаривают с одним слушателем в тихой комнате»
Не знаете, с чего начать? Используйте один из готовых стартовых промтов, например «Теплый ведущий ночного радио», «Диктор документального кино» или «Детский сказочник», и редактируйте их.
Вы также можете добавить необязательный текст для предварительного просмотра (сценарий, который будет озвучен в образцах) или оставить поле пустым, чтобы система сама написала контекстный образец. Когда будете готовы, нажмите Generate Samples. Обычно генерация стоит 2 000 кредитов, но на этапе запуска это бесплатно.
Шаг 2: Сравните два сгенерированных образца и выберите один
Voice Design генерирует два разных образца голоса на основе вашего промта. Прослушайте оба, сравните и выберите тот, который вам подходит. Не совсем то? Подправьте описание и нажмите Re-generate Samples — на этапе запуска итерации бесплатны, так что доводите голос до совершенства, пока он не зазвучит именно так, как вы задумали.
Шаг 3: Сохраните его как собственную голосовую модель
Нажмите Continue и превратите выбранный образец в многоразовую голосовую модель:
- Имя и обложка — дайте вашему голосу индивидуальность
- Теги — пол, возраст, стиль голоса (теплый, гладкий, глубокий, с придыханием...)
- Сценарии использования — разговорный, повествование, голос персонажа, соцсети, образование, реклама или развлечения
Затем выберите, кто сможет его использовать:
- Public (Публичный) — отображается на странице поиска, доступен всем
- Unlisted (По ссылке) — скрыт из поиска, доступен по прямой ссылке
- Private (Приватный) — виден только вам
Подтвердите, что голос не имитирует реального, узнаваемого человека, нажмите Create Voice, и готово. Ваш кастомный ИИ-голос теперь находится в вашей библиотеке и готов для любого проекта — а с помощью инлайновых тегов S2 на уровне слов вы можете точно управлять тем, как он произносит каждую фразу.
Начните со стартового промта → — генерация бесплатна на этапе запуска.
Как писать более эффективные промты для Voice Design
Качество вашего голоса зависит от качества вашего описания. Вот что отличает посредственный результат от идеального.
Возьмем этот стартовый промт:
«Теплый, доверительный ведущий ночного радио около 40 лет с мягким, хрипловатым голосом. Расслабленный, неспешный темп с редким легким смешком, как будто он говорит с одним слушателем в тихой комнате».
Обратите внимание, что здесь сделано:
-
Задается амплуа («ведущий ночного радио») — роль, которую модель может мгновенно охарактеризовать; это сильнее, чем просто список из десяти прилагательных.
-
Наслаиваются конкретные вокальные качества («мягкий, хрипловатый») — текстурные слова работают лучше неопределенных, таких как «хороший» или «приятный».
-
Указывается манера подачи («расслабленный, неспешный темп с редким легким смешком») — темп и характерные черты оживляют голос.
-
Описывается обстановка («говорит с одним слушателем в тихой комнате») — контекст задает уровень интимности и энергии лучше любого прилагательного.
Слабый промт: «Женский голос, приятный и четкий.»
Сильный промт: «Веселая девушка-гид лет 20 с ярким австралийским акцентом, быстрым игривым темпом, голос всегда звучит так, будто она улыбается.»
Одно амплуа, три-четыре сенсорных детали, одна сцена. Это и есть формула.
Генератор голосов персонажей, созданный для оригинальных героев
Если вы создаете персонажей для игр, анимации, аудиокниг, аудиодрам или виртуальных компаньонов, Voice Design работает как генератор голосов персонажей с одним решающим преимуществом: каждый голос оригинален.
Голоса из библиотек используют тысячи пользователей; ваш злодей не должен звучать как чье-то приложение для медитации. Клонирование голоса реального человека для вымышленного персонажа вызывает вопросы согласия и лицензирования. Спроектированный голос обходит оба этих препятствия — это голос, созданный для вашего персонажа, за которым не стоит образ реального человека.
Несколько идей для промтов — от реалистичных до фантастических:
- «Древний, скрипучий дракон с медленной, рокочущей подачей и театральной угрозой»
- «Гиперактивный подросток-изобретатель, говорит быстро, голос слегка срывается от возбуждения»
- «Спокойная пожилая библиотекарь с шепчущим тоном и выверенными паузами»
- «Суровый детектив лет 50, низкий гравийный монотон, уставший от жизни, сухая подача»
- «Энергичная ведущая кулинарного шоу с сильным итальянским акцентом, громкая, экспрессивная, всегда на грани смеха»
- «Глючный ИИ корабля: плоский, точный, слишком спокойный, с отрывистым роботизированным ритмом»
Генерируйте, сравнивайте два образца, дорабатывайте, сохраняйте — целый оригинальный актерский состав за один вечер. Затем объедините их в одной сцене с помощью многоголосого текста-в-речь или изучите голоса ИИ-персонажей, созданные другими пользователями, для вдохновения.
Voice Design против Voice Cloning: Что выбрать?
Fish Audio теперь предлагает три способа создания голоса, и они служат разным целям:
| Voice Design | Instant Voice Clone | Professional Voice Clone | |
|---|---|---|---|
| Входные данные | Текстовое описание | ~10 сек аудио | Студийные записи |
| Время | ~15 секунд | ~1 минута | 1–2 часа |
| Лучше всего для | Оригинальных персонажей и новых голосов | Быстрого копирования существующей записи | Проверенного студийного клона реального человека |
| Голос уже существует? | Нет — создан с нуля | Да | Да — с проверкой владения |
Золотое правило: если голоса еще не существует, спроектируйте его. Если существует — клонируйте.
Оригинальность по определению
Есть еще одно менее очевидное преимущество спроектированных голосов: они ни у кого не заимствуются. Каждый результат Voice Design создается на основе описания, а не записей реального человека — и каждый голос, созданный на Fish Audio, должен пройти подтверждение того, что он не имитирует реальное, узнаваемое лицо. Этот процесс разработан так, чтобы ваш проект не сталкивался с проблемами согласия и прав на использование образа.
А когда нужный вам голос принадлежит реальному человеку — вам или актеру озвучивания — мы считаем, что решение не в том, чтобы стирать эту грань, а в том, чтобы сделать право собственности явным. Актеры озвучивания по всему миру выступают именно за это: согласие и справедливое вознаграждение за то, как их голоса используются в эпоху ИИ. В этом и заключается идея нашего нового Professional Voice Clone: проверенного студийного клона голоса реального человека, основанного на проверке владения в реальном времени, с возможностью коммерческого релиза и распределения дохода для владельца голоса. Это начало более честных отношений между владельцами голосов и теми, кто хочет их использовать — подробнее об этом в нашем следующем глубоком обзоре.
Спроектируйте свой первый голос за 15 секунд
Раньше для поиска подходящего голоса требовалось прослушивать актеров, копаться в библиотеках или соглашаться на «сойдет и так». Теперь достаточно написать одно хорошее предложение.
Спроектируйте свой первый голос бесплатно → — бесплатно на этапе запуска.
Sabrina is part of Fish Audio's support and marketing team, helping users get the most out of AI voice products while turning launches, updates, and customer insights into clear, practical content.
Читать больше от Sabrina Shu
