13 يونيو 2026دليل

تصميم الصوت بالذكاء الاصطناعي: أنشئ صوتاً مخصصاً من مطالبة نصية واحدة

Sabrina Shu, Support & Marketing Specialist

تصميم الصوت بالذكاء الاصطناعي: أنشئ صوتاً مخصصاً من مطالبة نصية واحدة

صف صوتاً بكلمات بسيطة وسيقوم Fish Audio بتوليده في حوالي 15 ثانية. أنشئ أصوات شخصيات مخصصة بالذكاء الاصطناعي — مجاناً خلال فترة الإطلاق.

أنت بحاجة إلى صوت غير موجود بعد. ربما يكون مساعداً آلياً متهكماً للعبتك، أو راوياً دافئاً لفيلمك الوثائقي، أو مضيفاً إذاعياً ليلياً لمقدمة بودكاستك. يمنحك تصفح مكتبات الأصوات نفس المائة صوت التي يستخدمها الجميع، ويتطلب استنساخ الصوت وجود شخص حقيقي لتسجيل العينات أولاً.

يقوم Voice Design بحل هذه المشكلة بشكل مختلف. متوفر الآن على Fish Audio، يتيح لك إنشاء صوت مخصص وأصلي تماماً بالذكاء الاصطناعي من خلال وصفه بنص بسيط — العمر، الجنس، اللكنة، النبرة، الوتيرة، والمزاج — ويحول هذا الوصف إلى نموذج صوتي قابل للاستخدام في حوالي 15 ثانية. لا تسجيلات، لا ممثلين صوتيين، ولا غوص في المكتبات.

خلال فترة الإطلاق، يكون توليد الصوت باستخدام Voice Design مجاني تماماً (عادةً 2,000 رصيد لكل عملية توليد).

جرب Voice Design الآن ←

ما هو تصميم الصوت بالذكاء الاصطناعي (AI Voice Design)؟

تصميم الصوت بالذكاء الاصطناعي هو عملية إنشاء صوت اصطناعي مخصص وأصلي من وصف مكتوب بدلاً من عينة صوتية. تكتب مطالبة تصف كيف يجب أن يبدو الصوت — على سبيل المثال، "راوٍ في منتصف العمر، دافئ، بصوت خشن قليلاً ولكنة أمريكية ناعمة" — ويقوم الذكاء الاصطناعي بتوليد صوت جديد تماماً يطابق هذا الوصف، ويكون جاهزاً للاستخدام في تحويل النص إلى كلام.

هذا يجعل تصميم الصوت مختلفاً جوهرياً عن استنساخ الصوت، الذي يكرر صوت شخص موجود من التسجيلات. مع تصميم الصوت، الصوت الذي تنشئه لم يكن له وجود من قبل — ولا أحد غيرك يستخدمه في أي مكان.

كيفية إنشاء صوتك الخاص بالذكاء الاصطناعي باستخدام Voice Design (خطوة بخطوة)

هل تتساءل عن كيفية صنع صوت بالذكاء الاصطناعي من مجرد وصف؟ إليك سير العمل الكامل من البداية إلى النهاية. توجه إلى صفحة إنشاء الصوت واختر Voice Design.

صفحة إنشاء صوت Fish Audio التي تظهر خيارات Instant Voice Clone و Voice Design و Professional Voice Clone

الخطوة 1: صف الصوت الذي تريده

واجهة Fish Audio Voice Design — صف الصوت الذي تريده بالذكاء الاصطناعي بنص بسيط

في مربع الوصف، اكتب الصوت الذي تتخيله. كلما كنت محدداً، كان ذلك أفضل. قم بتغطية هذه الأبعاد:

العمر والجنس — "امرأة في أواخر الثلاثينيات"
اللكنة — "لكنة أمريكية ناعمة،" "لكنة بريطانية خفيفة"
النبرة والملمس — "أجش،" "مشرق،" "خشن قليلاً"
الوتيرة — "هادئة وغير مستعجلة،" "سريعة وحيوية"
المزاج والسياق — "كأنه يتحدث إلى مستمع واحد في غرفة هادئة"

لست متأكداً من أين تبدأ؟ استخدم إحدى المطالبات الجاهزة المدمجة، مثل مضيف إذاعي ليلي دافئ، أو راوي وثائقي، أو راوي قصص للأطفال — وقم بالتعديل من هناك.

يمكنك أيضاً إضافة نص معاينة اختياري (النص الذي ستنطقه العينات)، أو تركه فارغاً ليقوم النظام بكتابة عينة مناسبة للسياق نيابة عنك. عندما تكون مستعداً، اضغط على Generate Samples. يكلف التوليد عادةً 2,000 رصيد، ولكنه مجاني خلال فترة الإطلاق.

الخطوة 2: قارن بين عينتين صوتيتين مولدتين واختر إحداهما

الاختيار بين عينتين صوتيتين مولدتين بالذكاء الاصطناعي في Fish Audio Voice Design

يقوم Voice Design بتوليد عينتين صوتيتين متمايزتين من مطالبتك. قم بتشغيل كلتيهما، وقارن، واختر العينة التي تناسبك. ليست جيدة تماماً؟ عدل وصفك واضغط على Re-generate Samples — التكرار لا يكلف شيئاً خلال فترة الإطلاق، لذا استمر في التحسين حتى يبدو الصوت تماماً كما في مخيلتك.

الخطوة 3: احفظه كنموذج صوتي خاص بك

حفظ نموذج صوتي مخصص بالذكاء الاصطناعي مع تفاصيل الصوت في Fish Audio

اضغط على Continue وحوّل العين المختارة إلى نموذج صوتي قابل لإعادة الاستخدام:

الاسم والغلاف — امنح صوتك هوية
الأوسمة (Tags) — الجنس، العمر، أسلوب الصوت (دافئ، ناعم، عميق، هامس...)
حالات الاستخدام — محادثة، سرد، صوت شخصية، وسائل التواصل الاجتماعي، تعليمي، إعلان، أو ترفيه

ضبط رؤية الصوت بالذكاء الاصطناعي إلى عام أو غير مدرج أو خاص في Fish Audio

ثم اختر من يمكنه استخدامه:

Public (عام) — مدرج في صفحة الاكتشاف ليجده الجميع ويستخدموه
Unlisted (غير مدرج) — مخفي من الاكتشاف، قابل للمشاركة عبر رابط مباشر
Private (خاص) — مرئي لك فقط

أكد أن الصوت لا ينتحل شخصية حقيقية محددة، وانقر على Create Voice، وبذلك تكون قد انتهيت. يعيش صوتك المخصص بالذكاء الاصطناعي الآن في مكتبتك، جاهزاً لأي مشروع تحويل نص إلى كلام — ومع أوسمة S2 المضمنة على مستوى الكلمة، يمكنك توجيه الطريقة التي ينطق بها كل جملة بدقة.

ابدأ بمطالبة جاهزة ← — التوليد مجاني خلال فترة الإطلاق.

كيفية كتابة مطالبات أفضل لتصميم الصوت

تعتمد جودة صوتك على جودة وصفك. إليك ما يميز النتيجة العادية عن النتيجة المثالية.

لنأخذ هذه المطالبة الجاهزة:

"مضيف إذاعي ليلي دافئ وحميم في أواخر الثلاثينيات بصوت ناعم وأجش. وتيرة هادئة وغير مستعجلة مع ضحكات خفيفة من حين لآخر، وكأنه يتحدث إلى مستمع واحد في غرفة هادئة."

لاحظ ما تفعله هذه المطالبة:

تثبيت شخصية ("مضيف إذاعي ليلي") — دور يمكن للنموذج تمثيله فوراً، وهو أقوى من إدراج عشر صفات.
تراكم صفات صوتية ملموسة ("ناعم، أجش") — الكلمات التي تصف الملمس تتفوق على الكلمات الغامضة مثل "لطيف" أو "جيد".
تحديد أسلوب الإلقاء ("وتيرة هادئة وغير مستعجلة مع ضحكات خفيفة من حين لآخر") — الوتيرة والسمات الخاصة تبعث الحياة في الصوت.
تحديد المشهد ("يتحدث إلى مستمع واحد في غرفة هادئة") — السياق يشكل الحميمية والطاقة بشكل أفضل من أي صفة منفردة.

مطالبة ضعيفة: "صوت أنثوي، ممتع وواضح."

مطالبة قوية: "مرشدة سياحية مرحة في العشرينات من عمرها بلكنة أسترالية مشرقة، وتيرة لعب سريعة، تبدو دائماً وكأنها تبتسم أثناء الحديث."

شخصية واحدة، ثلاث أو أربع تفاصيل حسية، مشهد واحد. هذه هي الصيغة.

مولد أصوات شخصيات مصمم للشخصيات الأصلية

إذا كنت تنشئ شخصيات — للألعاب، الرسوم المتحركة، الكتب الصوتية، الدراما الصوتية، أو المرافقين الافتراضيين — فإن Voice Design يعمل كمولد أصوات شخصيات بميزة واحدة حاسمة: كل صوت هو صوت أصلي.

تتم مشاركة أصوات المكتبات من قبل آلاف المستخدمين؛ ولا ينبغي لشريرك أن يبدو مثل تطبيق التأمل الخاص بشخص آخر. كما أن استنساخ صوت شخص حقيقي لشخصية خيالية يثير تساؤلات حول الموافقة والترخيص. يتجنب الصوت المصمم كلا الأمرين — صوت مصمم لشخصيتك، دون تشابه مع أي شخص حقيقي خلفه.

بعض اتجاهات المطالبات لإثارة الأفكار — من الواقعية إلى الخيالية تماماً:

"تنين قديم بصوت خشن مع إلقاء بطيء وهادر وتهديد مسرحي"
"مخترع مراهق مفرط النشاط، يتحدث بسرعة، يتكسر صوته قليلاً عندما يتحمس"
"أمينة مكتبة مسنة وهادئة بنبرة هامسة وتوقفات متعمدة"
"محقق محنك في الخمسينيات من عمره، نبرة رتيبة منخفضة وخشنة، سئم العالم، إلقاء جاف"
"مضيفة برنامج طهي مبهجة بلكنة إيطالية ثقيلة، صاخبة، معبرة، ودائماً على وشك الضحك"
"ذكاء اصطناعي لسفينة به خلل: مسطح، دقيق، هادئ بشكل مبالغ فيه، مع إيقاع آلي مقطوع"

قم بالتوليد، قارن بين عينتين، حسن، واحفظ — طاقم عمل أصلي كامل في فترة ما بعد الظهر. ثم ضعهم في مشهد واحد باستخدام تحويل النص إلى كلام المتعدد الأصوات، أو تصفح أصوات الشخصيات بالذكاء الاصطناعي التي بناها الآخرون للإلهام.

Voice Design مقابل Voice Cloning: أيهما يجب أن تستخدم؟

يوفر Fish Audio الآن ثلاث طرق لإنشاء صوت، وهي تخدم مهام مختلفة:

	Voice Design	Instant Voice Clone	Professional Voice Clone
المدخلات	وصف نصي	حوالي 10 ثوانٍ من الصوت	تسجيلات بجودة الاستوديو
الوقت	حوالي 15 ثانية	حوالي دقيقة واحدة	1–2 ساعة
الأفضل لـ	الشخصيات الأصلية والأصوات الجديدة تماماً	تكرار تسجيل موجود بسرعة	نسخة موثقة بجودة الاستوديو لشخص حقيقي
هل الصوت موجود مسبقاً؟	لا — تم إنشاؤه من الصفر	نعم	نعم — مع التحقق من الملكية

القاعدة العامة: إذا كان الصوت غير موجود بعد، صممه. إذا كان موجوداً، استنسخه.

أصلي حسب التصميم

هناك فائدة هادئة للأصوات المصممة تستحق الذكر: أنها لا تستعير من أي شخص. يتم توليد كل مخرجات Voice Design من وصف، وليس من تسجيلات شخص ما — ويجب أن يجتاز كل صوت يتم إنشاؤه على Fish Audio تأكيداً بأنه لا ينتحل شخصية حقيقية محددة. إنه سير عمل مصمم للحفاظ على مشروعك بعيداً عن مخاوف الموافقة وحقوق المظهر.

وعندما يكون الصوت الذي تحتاجه ينتمي لشخص حقيقي — لك، أو لممثل صوتي — نعتقد أن الحل ليس طمس هذا الخط، بل جعل الملكية صريحة. يطالب الممثلون الصوتيون حول العالم بهذا تماماً: الموافقة والتعويض العادل عن كيفية استخدام أصواتهم في عصر الذكاء الاصطناعي. هذه هي الفكرة وراء Professional Voice Clone الجديد الخاص بنا: نسخة موثقة بجودة الاستوديو لصوت شخص حقيقي، مبنية على التحقق من الملكية في الوقت الفعلي، مع خيار الإصدار التجاري ومشاركة الإيرادات لمالك الصوت. إنها بداية لصفقة أكثر نظافة بين أصحاب الأصوات والأشخاص الذين يرغبون في استخدام أصواتهم — المزيد عن ذلك في تعمقنا القادم.

صمم صوتك الأول في 15 ثانية

كان الصوت الصحيح يعني سابقاً تجربة أداء الممثلين، أو البحث في المكتبات، أو الرضا بـ "القريب بما فيه الكفاية". الآن يعني كتابة جملة واحدة جيدة.

صمم صوتك الأول مجاناً ← — مجاناً خلال فترة الإطلاق.

الأسئلة المتكررة

ما هو تصميم الصوت بالذكاء الاصطناعي؟

تصميم الصوت بالذكاء الاصطناعي هو إنشاء صوت اصطناعي أصلي من وصف نصي بدلاً من تسجيل صوتي. تصف سمات مثل العمر واللكنة والنبرة والوتيرة، ويقوم الذكاء الاصطناعي بتوليد صوت جديد يطابق ذلك الوصف، ويكون صالحاً للاستخدام في محتوى تحويل النص إلى كلام.

هل خاصية Voice Design مجانية؟

نعم — خلال فترة الإطلاق، يكون توليد الأصوات باستخدام Voice Design من Fish Audio مجانياً تماماً. السعر القياسي هو 2,000 رصيد لكل عملية توليد. إنشاء وحفظ نموذج الصوت الخاص بك مشمول في ذلك.

ما الفرق بين تصميم الصوت واستنساخ الصوت؟

استنساخ الصوت يكرر صوت شخص موجود من عينات صوتية. أما تصميم الصوت فينشئ صوتاً لم يسبق له مثيل من وصف مكتوب وحده. الاستنساخ مخصص لإعادة إنتاج صوت حقيقي؛ التصميم مخصص لابتكار صوت أصلي.

هل يمكنني استخدام الصوت المصمم تجارياً؟

الأصوات المصممة هي ابتكارات أصلية لا تعتمد على تسجيلات أي شخص حقيقي، مما يجعلها خياراً آمناً لمشاريع المحتوى. يجب أن يجتاز كل صوت تأكيداً بأنه لا ينتحل شخصية حقيقية محددة، ويجب أن يمتثل الاستخدام لسياسة استخدام Fish Audio.

كيف أكتب مطالبة جيدة لتصميم الصوت؟

قم بتثبيت الصوت في شخصية (مثلاً، "راوي وثائقي")، أضف ثلاث أو أربع صفات صوتية ملموسة (أجش، مشرق، خشن)، حدد الوتيرة، وصف سياق التحدث. الأوصاف الحسية المحددة تتفوق باستمرار على الصفات الغامضة.

Sabrina Shu

Sabrina is part of Fish Audio's support and marketing team, helping users get the most out of AI voice products while turning launches, updates, and customer insights into clear, practical content.

اقرأ المزيد من Sabrina Shu