تصميم الصوت بالذكاء الاصطناعي: أنشئ صوتاً مخصصاً من مطالبة نصية واحدة
صف صوتاً بكلمات بسيطة وسيقوم نظام تصميم الصوت (Voice Design) من Fish Audio بإنتاجه في غضون 15 ثانية تقريباً. أنشئ أصوات شخصيات مخصصة بالذكاء الاصطناعي — مجاناً خلال فترة الإطلاق.
أنت بحاجة إلى صوت غير موجود بعد. ربما يكون رفيقاً آلياً ساخراً للعبتك، أو راوياً دافئاً لفيلمك الوثائقي، أو مذيع راديو في وقت متأخر من الليل لمقدمة البودكاست الخاصة بك. تصفح مكتبات الأصوات يمنحك نفس المئات من الأصوات التي يستخدمها الجميع، بينما يتطلب استنساخ الصوت من شخص حقيقي تسجيل عينات أولاً.
يحل Voice Design هذه المشكلة بشكل مختلف. متاح الآن على Fish Audio، حيث يتيح لك إنشاء صوت أصلي ومخصص بالكامل بالذكاء الاصطناعي من خلال وصفه بنص عادي — العمر، الجنس، اللهجة، النبرة، السرعة، الحالة المزاجية — ويحول هذا الوصف إلى نموذج صوتي قابل للاستخدام في حوالي 15 ثانية. لا تسجيلات، ولا ممثلين صوتيين، ولا غوص في المكتبات.
خلال فترة الإطلاق، يكون توليد الصوت باستخدام Voice Design مجاني تماماً (عادة ما يكلف 2,000 رصيد لكل عملية توليد).
ما هو تصميم الصوت بالذكاء الاصطناعي؟
تصميم الصوت بالذكاء الاصطناعي هو عملية إنشاء صوت اصطناعي مخصص وأصلي من وصف مكتوب بدلاً من عينة صوتية. تكتب مطالبة تصف كيف يجب أن يبدو الصوت — على سبيل المثال، "راوٍ في منتصف العمر، صوته دافئ وأجش قليلاً مع لهجة أمريكية هادئة" — ويقوم الذكاء الاصطناعي بإنشاء صوت جديد تماماً يطابق هذا الوصف، جاهز للاستخدام في تحويل النص إلى كلام.
وهذا يجعل تصميم الصوت مختلفاً جوهرياً عن استنساخ الصوت، الذي يكرر صوت شخص موجود بالفعل من التسجيلات. مع تصميم الصوت، فإن الصوت الذي تنشئه لم يكن له وجود من قبل — ولا أحد غيرك يستخدمه في أي مكان.
كيفية إنشاء صوتك الخاص بالذكاء الاصطناعي باستخدام Voice Design (خطوة بخطوة)
هل تتساءل كيف تصنع صوتاً بالذكاء الاصطناعي من مجرد وصف؟ إليك سير العمل الكامل من البداية إلى النهاية. توجه إلى صفحة إنشاء الصوت وحدد Voice Design.
الخطوة 1: صف الصوت الذي تريده
في مربع الوصف، اكتب الصوت الذي تتخيله. كلما كنت أكثر تحديداً، كانت النتيجة أفضل. غطِّ هذه الأبعاد:
- العمر والجنس — "امرأة في أواخر الثلاثينيات"
- اللهجة — "لهجة أمريكية هادئة"، "لهجة بريطانية خفيفة"
- النبرة والسمات — "أجش"، "مشرق"، "خشن قليلاً"
- السرعة — "مسترخٍ وغير مستعجل"، "سريع وحيوي"
- الحالة المزاجية والسياق — "كما لو كانوا يتحدثون إلى مستمع واحد في غرفة هادئة"
لست متأكداً من أين تبدأ؟ استخدم إحدى المطالبات الجاهزة، مثل مذيع راديو دافئ في وقت متأخر من الليل، أو راوٍ لفيلم وثائقي، أو قاص قصص للأطفال — وقم بالتعديل من هناك.
يمكنك أيضاً إضافة نص معاينة اختياري (النص الذي ستنطقه العينات)، أو تركه فارغاً ليقوم النظام بكتابة عينة مناسبة للسياق نيابة عنك. عندما تكون مستعداً، اضغط على Generate Samples. يكلف التوليد عادةً 2,000 رصيد، لكنه مجاني خلال فترة الإطلاق.
الخطوة 2: قارن بين عينتين صوتيتين مولدتين واختر واحدة
يقوم Voice Design بإنشاء عينتين صوتيتين متميزتين من مطالبتك. قم بتشغيل كلتيهما، وقارن بينهما، واختر العينة المناسبة. النتيجة ليست دقيقة تماماً؟ قم بتعديل وصفك واضغط على Re-generate Samples — تكرار العملية لا يكلف شيئاً خلال فترة الإطلاق، لذا استمر في التحسين حتى يبدو الصوت تماماً كما في خيالك.
الخطوة 3: احفظه كنموذج صوتي خاص بك
اضغط على متابعة وحوّل العينة المختارة إلى نموذج صوتي قابل لإعادة الاستخدام:
- الاسم والغلاف — امنح صوتك هوية
- الوسوم — الجنس، العمر، أسلوب الصوت (دافئ، ناعم، عميق، هامس...)
- حالات الاستخدام — محادثة، سرد، صوت شخصية، وسائل التواصل الاجتماعي، تعليمي، إعلان، أو ترفيه
ثم اختر من يمكنه استخدامه:
- عام (Public) — مدرج في صفحة الاكتشاف ليجده الجميع ويستخدموه
- غير مدرج (Unlisted) — مخفي من الاكتشاف، يمكن مشاركته عبر رابط مباشر
- خاص (Private) — مرئي لك فقط
أكد أن الصوت لا ينتحل شخصية حقيقية معروفة، وانقر على Create Voice، وبذلك تكون قد انتهيت. صوتك المخصص بالذكاء الاصطناعي يعيش الآن في مكتبتك، جاهز لأي مشروع تحويل نص إلى كلام — ومع وسوم S2 المضمنة على مستوى الكلمة، يمكنك توجيه كيفية إلقاء كل سطر بدقة.
ابدأ بمطالبة جاهزة ← — التوليد مجاني خلال فترة الإطلاق.
كيف تكتب مطالبات أفضل لتصميم الصوت
تعتمد جودة صوتك على جودة وصفك. إليك ما يميز النتيجة العادية عن النتيجة المثالية.
لنأخذ هذه المطالبة الجاهزة:
"مذيع راديو دافئ وحميم في وقت متأخر من الليل في أواخر الثلاثينيات بصوت ناعم وأجش. إلقاء مسترخٍ وغير مستعجل مع ضحكات خفيفة من حين لآخر، كما لو كان يتحدث إلى مستمع واحد في غرفة هادئة."
لاحظ ما تفعله هذه المطالبة:
-
تثبيت الشخصية ("مذيع راديو في وقت متأخر من الليل") — دور يمكن للنموذج تجسيده على الفور، وهو أقوى من ذكر عشر صفات.
-
تراكم الصفات الصوتية الملموسة ("ناعم وأجش") — الكلمات التي تصف الملمس تتفوق على الكلمات الغامضة مثل "لطيف" أو "جيد".
-
تحديد طريقة الإلقاء ("إلقاء مسترخٍ وغير مستعجل مع ضحكات خفيفة") — السرعة والسمات الخاصة تمنح الصوت حياة.
-
رسم المشهد ("يتحدث إلى مستمع واحد في غرفة هادئة") — السياق يشكل الحميمية والطاقة بشكل أفضل من أي صفة منفردة.
مطالبة ضعيفة: "صوت أنثوي، ممتع وواضح."
مطالبة قوية: "مرشدة سياحية مرحة في العشرينيات من عمرها بلكنة أسترالية مشرقة، إيقاع سريع ولعوب، تبدو دائماً وكأنها تبتسم أثناء الحديث."
شخصية واحدة، ثلاث أو أربع تفاصيل حسية، مشهد واحد. هذه هي المعادلة.
مولد أصوات شخصيات مصمم للشخصيات الأصلية
إذا كنت تنشئ شخصيات — للألعاب، أو الرسوم المتحركة، أو الكتب الصوتية، أو الدراما الإذاعية، أو الرفقاء الافتراضيين — فإن Voice Design يعمل كمولد أصوات شخصيات بميزة واحدة حاسمة: كل صوت أصلي.
أصوات المكتبات يشترك فيها آلاف المستخدمين؛ لا ينبغي أن يبدو الشرير في قصتك مثل تطبيق التأمل الخاص بشخص آخر. كما أن استنساخ صوت شخص حقيقي لشخصية خيالية يثير تساؤلات حول الموافقة والترخيص. بينما يتجنب الصوت المصمم كلا الأمرين — صوت مبني لشخصيتك، دون تشابه مع شخص حقيقي.
إليك بعض اتجاهات المطالبات لإثارة الأفكار — من الواقعية إلى الخيالية تماماً:
- "تنين قديم ذو صوت خشن مع إلقاء بطيء وهادر وتهديد درامي"
- "مخترع مراهق مفرط النشاط، يتحدث بسرعة، يتكسر صوته قليلاً عندما يتحمس"
- "أمينة مكتبة مسنة هادئة بنبرة هامسة وتوقفات مدروسة"
- "محقق محنك في الخمسينيات من عمره، صوت رتيب ومنخفض وخشن، منهك من العالم، إلقاء جاف"
- "مقدمة برنامج طهي مرحة بلكنة إيطالية ثقيلة، صوت عالٍ ومعبر، ودائماً على وشك الضحك"
- "ذكاء اصطناعي لسفينة به خلل تقني: نبرة مسطحة ودقيقة وهادئة بشكل مبالغ فيه، مع إيقاع آلي مقطوع"
قم بالتوليد، قارن بين عينتين، حسن، احفظ — طاقم عمل أصلي كامل في فترة ما بعد الظهر. ثم ضعهم في مشهد واحد مع تحويل النص إلى كلام متعدد المتحدثين، أو تصفح أصوات شخصيات الذكاء الاصطناعي التي بناها الآخرون للإلهام.
تصميم الصوت مقابل استنساخ الصوت: أيهما يجب أن تستخدم؟
تقدم Fish Audio الآن ثلاث طرق لإنشاء صوت، وهي تخدم مهاماً مختلفة:
| Voice Design | Instant Voice Clone | Professional Voice Clone | |
|---|---|---|---|
| المدخلات | وصف نصي | ~10 ثوانٍ من الصوت | تسجيلات بجودة الاستوديو |
| الوقت | ~15 ثانية | ~دقيقة واحدة | 1–2 ساعة |
| الأفضل لـ | الشخصيات الأصلية والأصوات الجديدة تماماً | تكرار تسجيل موجود بسرعة | نسخة موثقة بجودة الاستوديو لشخص حقيقي |
| هل الصوت موجود بالفعل؟ | لا — تم إنشاؤه من الصفر | نعم | نعم — مع التحقق من الملكية |
القاعدة الذهبية: إذا لم يكن الصوت موجوداً بعد، فقم بتصميمه. وإذا كان موجوداً، فقم باستنساخه.
أصلي حسب التصميم
هناك فائدة هادئة للأصوات المصممة تستحق الذكر: أنها لا تقترض من أي شخص. يتم إنتاج كل مخرج من Voice Design من وصف، وليس من تسجيلات شخص — ويجب أن يجتاز كل صوت يتم إنشاؤه على Fish Audio تأكيداً بأنه لا ينتحل شخصية حقيقية معروفة. إنه سير عمل مصمم لإبقاء مشروعك بعيداً عن مخاوف الموافقة وحقوق الشبه.
وعندما ينتمي الصوت الذي تحتاجه إلى شخص حقيقي — أنت، أو ممثل صوتي — نؤمن أن الحل ليس طمس هذا الخط، بل جعل الملكية صريحة. يطالب الممثلون الصوتيون حول العالم بهذا تماماً: الموافقة والتعويض العادل عن كيفية استخدام أصواتهم في عصر الذكاء الاصطناعي. هذه هي الفكرة وراء Professional Voice Clone الجديد لدينا: نسخة موثقة بجودة الاستوديو لصوت شخص حقيقي، مبنية على التحقق من الملكية في الوقت الفعلي، مع خيار الإصدار التجاري ومشاركة الإيرادات لمالك الصوت. إنها بداية لصفقة أكثر وضوحاً بين مالكي الأصوات والأشخاص الذين يرغبون في استخدام أصواتهم — المزيد حول ذلك في مقالنا التفصيلي القادم.
صمم صوتك الأول في 15 ثانية
كان اختيار الصوت المناسب يعني اختبار أداء الممثلين، أو البحث في المكتبات، أو الرضا بنتيجة "قريبة بما يكفي". الآن يعني كتابة جملة واحدة جيدة.
صمم صوتك الأول مجاناً ← — مجاناً خلال فترة الإطلاق.
Sabrina is part of Fish Audio's support and marketing team, helping users get the most out of AI voice products while turning launches, updates, and customer insights into clear, practical content.
اقرأ المزيد من Sabrina Shu
