كيفية استخدام الوسوم المضمنة في Fish Audio S2

10 مارس 2026

كيفية استخدام الوسوم المضمنة في Fish Audio S2

يدعم Fish Audio S2 الوسوم المضمنة - وهي إشارات لغة طبيعية قصيرة توضع بين أقواس مربعة في أي مكان في النص - للتحكم في كيفية إلقاء الكلام. يغطي هذا الدليل الوسوم المدعومة، وكيفية استخدامها، ونصائح للحصول على أفضل النتائج.


الصيغة الأساسية

ضع وسماً بين أقواس مربعة مباشرة قبل الكلمة أو العبارة التي تريد التأثير عليها:

The door was open. [whispering] I didn't want to go inside.

يمكن وضع الوسوم في أي موضع في النص، ويمكنك استخدام وسوم متعددة في عملية توليد واحدة.


الوسوم الموصى بها

يقبل S2 وسوم اللغة الطبيعية بصيغة حرة — لست مقيداً بقائمة ثابتة. ومع ذلك، فإن الوسوم أدناه مختبرة جيداً وتنتج نتائج قوية باستمرار. استخدمها كنقاط بداية، أو اكتب أوصافك الخاصة (مثل [speaking slowly, almost hesitant]) لتحكم أكثر دقة.

التنفس وردود الفعل الصوتية

الوسمالوصف
[clears throat]صوت تنحنح قبل التحدث
[inhalation] / [inhale]شهيق مسموع
[exhale]زفير مسموع
[sigh]تنهيدة معبرة
[panting]تلهث ثقيل وسريع
[breathing]تنفس مسموع بشكل عام
[gasp]شهقة مفاجئة وحادة
n### الأصوات الصوتية
الوسمالوصف
[groan]صوت أنين منخفض للتعبير عن الانزعاج أو السخط
[moaning]صوت بشري ممتد للألم أو الاستياء
[sobbing]نشيج مع أنفاس متشنجة
[crying]دموع مسموعة في الصوت
[laughing]ضحك كامل
[chuckling]ضحك خافت وهادئ
[giggle]قهقهة خفيفة عالية النبرة

الإيقاع

الوسمالوصف
[pause]صمت وجيز
[short pause]وقفة أقصر
[long pause]صمت ممتد لتأثير درامي

نمط الصوت

الوسمالوصف
[whispering] / [whispering voice]إلقاء خافت وهامس
[soft voice]هادئ ولطيف
[low voice]طبقة صوت أعمق وأقل حدة
[loud voice]مستوى صوت مرتفع
[shouting]صراخ بصوت عالٍ

العاطفة

الوسمالوصف
[excited]طاقة عالية، مبهج
[angry]نبرة قاسية وقوية
[sad]إلقاء ثقيل ومحبط

أخرى

الوسمالوصف
[emphasis]تشديد على الكلمة أو العبارة التالية
[rustling sound]صوت خشخشة في الخلفية

الموضع

تؤثر الوسوم على ما يأتي بعدها. ضع الوسم مباشرة قبل النقطة التي تريد أن يحدث فيها التحول.

جيد — الوسم عند نقطة الانتقال:

I thought everything was fine. [whispering] Then I heard the noise.

أقل فعالية — الوسم مبكر جداً:

[whispering] I thought everything was fine. Then I heard the noise.

في هذه الحالة، سيتم همس الفقرة بأكملها، بما في ذلك الجملة الأولى.


الجمع بين الوسوم

يمكنك ربط عدة وسوم عبر مقطع نصي لإحداث تغييرات في الإلقاء:

[soft voice] I wasn't sure what to say. [long pause] [loud voice] But then it hit me.

يمكن وضع وسوم ردود الفعل الصوتية بين الجمل لانتقالات تبدو طبيعية:

That was the third time this week. [sigh] I really need to fix that.

حوار متعدد المتحدثين

يدعم S2 توليد الكلام لعدة متحدثين وأدوار متعددة مع التحكم في الوسوم المضمنة لكل متحدث. ميزة تعدد المتحدثين ستتوفر قريباً في Fish Audio playground و API - تابعونا.


نصائح

ابدأ ببساطة. يمكن لوسم واحد موضوع بعناية مثل [whispering] أو [sigh] أن يغير المقطع بالكامل. لست بحاجة إلى وسم في كل جملة.

استخدم الوقفات للتحكم في الإيقاع. تعتبر وسوم [pause] و [long pause] من بين الوسوم الأكثر فائدة لجعل الكلام يبدو طبيعياً، خاصة قبل التحولات العاطفية.

اجعل ردود الفعل تحمل العاطفة. بدلاً من الاعتماد على وسوم العاطفة وحدها، جرب دمجها مع ردود الفعل: [sigh] [sad] I just don't know anymore. التنهيدة تعزز الشعور بالعاطفة جسدياً.

اختبر وكرر. قد تستجيب الأصوات المختلفة للوسوم بكثافة متفاوتة. إذا شعرت أن الوسم خفيف جداً، جرب تعزيزه بسياق في النص المحيط.


الروابط

أنشئ أصواتًا تبدو حقيقية

ابدأ في إنشاء أعلى جودة صوت اليوم

هل لديك حساب بالفعل؟ تسجيل الدخول

شارك هذه المقالة


Kyle Cui

Kyle CuiX

Kyle is a Founding Engineer at Fish Audio and UC Berkeley Computer Scientist and Physicist. He builds scalable voice systems and grew Fish into the #1 global AI text-to-speech platform. Outside of startups, he has climbed 1345 trees so far around the Bay Area. Find his irresistibly clouty thoughts on X at @kile_sway.

اقرأ المزيد من Kyle Cui >

المقالات الأخيرة

عرض الكل >