عرض لفترة محدودة- خصم 50% سنوياًاسترداد

قصص العملاء

تحويل نص إلى كلام لوكيل صوتي فوري يخدم 10 ملايين مستخدم.

كيف بنت Dubbing AI وكيلها الصوتي على Fish Audio: محرك TTS الوحيد الذي جمع القدرات الخمس التي يحتاجها الوكيل الفوري، وهي الطبيعية، والعمق العاطفي، وجودة استنساخ الصوت، وانخفاض زمن الاستجابة، ودعم اللغات المتعددة.

القطاع
المستهلكون · الألعاب · الترفيه
المنطقة
عالمي
حالة الاستخدام
وكيل صوتي (TTS فوري)
الجمهور
أكثر من 10 ملايين مستخدم
النشر
Cloud API · سطح المكتب والجوال
الحالة
Voice Agent في مرحلة بيتا
10M+

عبر الألعاب والبث والترفيه: النطاق الذي يجب أن يبدو فيه الوكيل الصوتي حقيقيًا في الوقت الفعلي وبلغة المستخدم.

Dubbing AI

Tiange Ling

الرئيس التنفيذي في Dubbing AI

"تقدم Fish Audio طبيعية صوت استثنائية، وتعبيرا عاطفيا غنيا، ومحرك TTS منخفض التأخير وموثوقا يدعم تجربة منتج Voice Agent الأساسية لدينا بشكل مثالي."

الرئيسة التنفيذية في Fish Audio

Rissa Cao

"وكلاء الصوت هم حالة الاستخدام التي تظهر فيها كل مقايضات الذكاء الاصطناعي الصوتي. لا يمكن أن يكون الوكيل سريعا ومسطحا، أو معبرا وبطيئا. يجب أن يبدو حقيقيا، في الوقت الحقيقي، وبلغة المستخدم. تبني Dubbing AI أصعب نسخة من هذا: صوتا يتحدث نيابة عن المستخدم عندما لا يستطيع أو لا يريد أن يتحدث بنفسه. المعيار هو واقعية على مستوى الهوية، وهذا هو المعيار الذي بنينا S2 Pro لتجاوزه."
Dubbing AI

عن Dubbing AI — 10 ملايين مستخدم عبر إنشاء الصوت واستنساخه وتغييره.

Dubbing AI هو منتج محلي لتقنيات الصوت بالذكاء الاصطناعي يقدم إنشاء الصوت واستنساخ الصوت وتغيير الصوت في الوقت الحقيقي عبر سطح المكتب والجوال في تجربة واحدة. تخدم المنصة أكثر من 10 ملايين مستخدم حول العالم عبر ثلاث فئات رئيسية: صنّاع المحتوى والستريمرز، ومستخدمو الترفيه الفرديون، والمستخدمون التجاريون بما في ذلك وكالات الإعلان وشركات الإعلام.

Dubbing AI هي طبقة الصوت للاعبين والستريمرز وصنّاع العلامات التجارية الذين يحتاجون إلى تشكيل الصوت أو تغييره أو استنساخه في الوقت الحقيقي على المنصات التي يعيشون عليها.

تقديم Voice Agent — وكيل يتحدث نيابة عنك.

توسّع ميزة Dubbing AI الجديدة، Voice Agent، مجموعة أدوات الصوت في المنصة من تغيير الصوت إلى التحدث نيابة عن المستخدم. فبدلًا من تغيير صوت المستخدم نفسه، يتحدث Voice Agent بالنيابة عنه.

حالات الاستخدام مباشرة وإنسانية. عندما يكون لاعب في وسط نقاش ولا يريد تصعيده، يمكن لـ Voice Agent أن يتحدث عنه. وعندما يكون شخص متعبًا جدًا لإجراء مكالمة حجز، يقوم Voice Agent بذلك. وعندما يكون المستخدم خجولًا أو منشغلًا بالعمل أو غير قادر مؤقتًا على التواصل، يتيح له Voice Agent التفاعل مع الآخرين في الوقت الحقيقي.

إنها امتداد لمهمة Dubbing AI عبر كل ميزات المنصة — تغيير الصوت، تحسين اللكنة، الترجمة في الوقت الحقيقي، والآن Voice Agent: مساعدة الناس على التواصل بسلاسة أكبر والتعبير عن أنفسهم بفعالية أعلى. يوسّع Voice Agent هذه المهمة إلى المواقف التي لا يكون فيها التحدث بالذات ممكنًا أو مثاليًا.

لكي يعمل Voice Agent، يجب أن يبدو صوت AI حقيقيًا. الطرف المستمع — الخصم في اللعبة أو موظف المطعم أو الشخص على الطرف الآخر من المكالمة — يجب أن يشعر بأنه يتحدث مع إنسان حقيقي، وليس مع صوت اصطناعي واضح. هنا دخلت Fish Audio.

تحدي TTS في الوقت الحقيقي لوكلاء الصوت: الكمون مقابل الطبيعية.

يكشف وكلاء الصوت أصعب مفاضلة في AI الصوتي. يجب أن يوازن TTS في الوقت الحقيقي لوكلاء الصوت بين الكمون والطبيعية والعاطفة، ومعظم المزوّدين يفرضون الاختيار. تميل نماذج الكمون المنخفض إلى أن تبدو مسطحة وآلية؛ بينما تميل النماذج التعبيرية إلى إدخال تأخيرات معالجة تكسر تدفق المحادثة.

بالنسبة إلى Dubbing AI Voice Agent، كلا العاملين حاسم بالقدر نفسه. إذا توقف الوكيل بوضوح بين إدخال المستخدم والرد المنطوق، تنكسر فكرة أن الطرف الآخر يتحدث مع شخص حقيقي. وإذا رد فورًا لكنه بدا آليًا، تنكسر الفكرة نفسها من اتجاه آخر. العامل الحاسم ليس أحدهما وحده، بل الجمع بينهما.

لماذا قيّمت Dubbing AI سوق TTS لبنية وكلاء الصوت.

قيّمت Dubbing AI عدة مسارات عمل صوتية لـ TTS قبل الاستقرار على Fish Audio. ارتبطت معايير التقييم مباشرة بالمتطلبات البنيوية لـ TTS لوكلاء الصوت: الطبيعية، العمق العاطفي، جودة استنساخ الصوت، الكمون المنخفض، والدعم متعدد اللغات — خمس قدرات يحقق معظم المزوّدين اثنتين أو ثلاثًا منها، ونادرًا ما يحققون الخمس كلها.

بالنسبة إلى Voice Agent يخدم 10 ملايين مستخدم عبر الألعاب والترفيه والاستخدامات التجارية، كان النموذج الذي ينجح في الطبيعية ويفشل في تعدد اللغات مستبعدًا. والنموذج الذي ينجح في الكمون لكنه يسطّح العاطفة كان مستبعدًا أيضًا. فرض استخدام Voice Agent تقييمًا لا يقبل إلا الخمس جميعًا.

لماذا فازت Fish Audio بتقييم Voice Agent — المعايير الخمسة كلها.

تميّزت Fish Audio بالتركيبة التي لم تجدها Dubbing AI في أي مكان آخر: القدرات الخمس كلها بالمستوى الذي يتطلبه وكيل صوت في الوقت الحقيقي. النماذج التي فازت بمعيار واحد لدى المزوّدين الآخرين لم تصلح لاستخدام Voice Agent. كان Fish هو النموذج الوحيد الذي استحق مكانه عبر كل أبعاد التقييم.

· الطبيعية
خروج صوتي يبدو كإنسان حقيقي يتحدث، لا كمركّب صوتي يقرأ.
· العمق العاطفي
سجل عاطفي يستمر عبر الجملة، وهي الطبقة التي تسطّحها معظم نماذج الكمون المنخفض.
· جودة استنساخ الصوت
أصوات مستنسخة تحافظ على الهوية عبر المحتوى، وهو أمر مهم لجمهور المبدعين والترفيه في Dubbing AI.
· كمون منخفض
استجابة في الوقت الحقيقي من دون تأخير معالجة ملحوظ، وهو شرط أساسي لأي وكيل محادثة.
· دعم متعدد اللغات
أكثر من 80 لغة مع تبديل لغوي طبيعي، وهو مطلوب لوكيل صوت يخدم قاعدة مستخدمين عالمية.

كيف تستخدم Dubbing AI منصة Fish Audio لـ TTS وكيل الصوت في الوقت الحقيقي.

تنشر Dubbing AI منصة Fish Audio عبر cloud API لتوليد text-to-speech في الوقت الحقيقي داخل ميزة Voice Agent. عندما يكتب المستخدمون النص الذي يريدون من Voice Agent نطقه، يحوله Fish إلى صوت طبيعي وغني عاطفيًا في الوقت الحقيقي، عبر اللغات واللهجات التي تتطلبها قاعدة مستخدمي Dubbing AI العالمية.

يعمل Voice Agent عبر المنصات على سطح المكتب والجوال، بما يطابق تغطية بقية منصة Dubbing AI. يستعد Voice Agent لإطلاق beta أولًا لجمهور اللاعبين على المنصة — وهي الفئة صاحبة الطلب الأقوى على حالات الاستخدام التي بُني من أجلها Voice Agent. كانت نتائج الاختبارات الداخلية قبل beta إيجابية جدًا.

نتائج التكامل.

المنتجات المستخدمة: Fish Audio S2 Pro · Text-to-Speech (cloud API)

أكثر من 10 ملايين مستخدم على منصة Dubbing AI الأوسع عبر الألعاب والبث والمبدعين التجاريين.

حققت Fish Audio 5 من 5 معايير تقييم: الطبيعية، العمق العاطفي، جودة الاستنساخ، الكمون المنخفض، وتعدد اللغات.

سيتم إطلاق Voice Agent beta أولًا لجمهور اللاعبين، مع نتائج اختبار داخلية إيجابية.

نشر عبر المنصات على سطح المكتب والجوال، بما يطابق كامل سطح Dubbing AI.

ما الخطوة التالية لـ Dubbing AI و Fish Audio.

مع انتقال Voice Agent من النسخة التجريبية إلى الإتاحة العامة عبر 10 ملايين مستخدم لدى Dubbing AI، يبقى Fish Audio طبقة TTS الفورية التي تشغل التجربة. ستصدر التوسعات المستقبلية لـ Voice Agent (إلى مزيد من اللغات والمواقف والسياقات متعددة المنصات) بالتوازي مع التحسينات المستمرة لنماذج Fish.

Fish Audio

هل تبني وكيل صوت؟

تحدث إلى فريقنا حول TTS فوري يوازن بين الطبيعية والعمق العاطفي وزمن الاستجابة والدعم متعدد اللغات، وهي التركيبة التي تتطلبها وكلاء الصوت.