عرض لفترة محدودة- خصم 50% سنوياًاسترداد
أصبح S2.1 Pro مجانيًا الآن للمطورين

ذكاء اصطناعي صوتي بجودة الإنتاج.بأسعار مناسبة للشركات الناشئة.مفتوح كمجتمع.

أطلق كلامًا طبيعيًا، واستنساخًا للأصوات، وتفريغًا للنصوص عبر واجهة برمجية واحدة. SDKs رسمية لـ Python وTypeScript. زمن استجابة أقل من ثانية. تسعير حسب الاستخدام من أول طلب.

S2.1 Pro يعمل مباشرةً. اختر صوتًا، واكتب سطرًا، واستمع إليه. النموذج نفسه المستخدم في الإنتاج لدى HeyGen وRetell وSanas — بلا تسجيل، ولا مكالمة مبيعات، ولا بيئة تجريبية.

تثق به فرق تبني تجارب صوتية في الإنتاج

وكلاء الصوت والذكاء الاصطناعي التحادثي
التعليق الصوتي للفيديو، الدبلجة، والموسيقى
التفاعلي والاجتماعي
التعليم والتعلّم

من التسجيل إلى أول صوت في 5 دقائق.

لا تحتاج إلى مكالمة مبيعات. احصل على مفتاح API، ثبّت SDK، وانطلق.

CURL · تحويل النص إلى كلام
# Text to speech in one call
curl -X POST \ https://api.fish.audio/v1/tts \
-H "Authorization: Bearer $FISH_API_KEY" \
-H "Content-Type: application/json" \
-H "model: s2.1-pro-free" \
-d '{"text": "Hello! Welcome to Fish Audio."}' \
--output welcome.mp3
PYTHON SDK
# Text to speech with the Python SDK
from fish_audio_sdk import Session, TTSRequest
 
session = Session("YOUR_API_KEY")
request = TTSRequest(text="Hello! Welcome to Fish Audio.")
with open("welcome.mp3", "wb") as f:
for chunk in session.tts(request):
f.write(chunk)

ما تُطلقه الفرق على Fish Audio.

صوت يصمد أمام الكاميرا

# فيديو الأفاتار

TTS قادر على مزامنة الشفاه ومدرك للمشاعر، مناسب لمنتجات الأفاتار الذكي. وسوم التوجيه المضمّنة تصنع الأداء، لا مجرد الكلمات.

HeyGen
VIGGLE
Pictoria

ذكاء اصطناعي تحادثي في الوقت الحقيقي

# وكيل صوتي

أقل من ثانية لتبادل الأدوار عبر WebSocket. TTS وASR بالبث في مكدّس واحد. مع دعم المقاطعة.

Retell
Sanas
Dubbing AI

محتوى صوتي ديناميكي.

# المحتوى الصوتي والرفاق الذكيون

من الملاحظات إلى الصوت، وأدوات التحضير، والرفاق الذكيين. تسعير لكل حرف يتوسع مع الاستخدام، لا مع عدد المقاعد.

PLAUD
Final Round AI

استنسخ خلال 30 ثانية. أو تجاوز الاستنساخ كليًا.

# تطبيقات الشخصيات

IVC من 30 ثانية من الصوت. PVC لنسخ بجودة الاستوديو. أو تصفّح مكتبة الأصوات وانطلق بدون استنساخ.

OpenArt

مصمم لمكدّس العمل في الوقت الحقيقي.

استخدم API الخاص بنا. أو استضف النموذج بنفسك

واجهة برمجية سحابية لأي فريق ينشئ اليوم. الاستضافة الذاتية كخيار Enterprise متميز حين يستدعي الإنتاج ذلك.

API مستضاف · لأي فريق

واجهة برمجية سحابية بنموذج الدفع حسب الاستخدام، بسعر $15 لكل مليون حرف. أسرع طريق إلى الإنتاج للفرق التي لا تحتاج إلى تشغيل النموذج بنفسها.

  • WebSocket streaming، REST، Python + TypeScript SDKs
  • $15 / 1M UTF-8 bytes — بلا التزام
  • صياغة التوجيه مضمّنة في كل طلب
  • النموذج نفسه الذي يُنشر بأوزان مفتوحة

استضف النموذج بنفسك.

نماذجنا مفتوحة المصدر — fish-speech، S1، S2 — متاحة كأوزان مفتوحة برخصة تجارية مدفوعة. انشرها في VPC أو مركز بيانات أو سحابة سيادية أو بيئة معزولة تمامًا. تعاقد متميز مخصص للفرق ذات الأحجام العالية التي تحتاج إلى توطين البيانات أو الضبط الدقيق أو النشر في بيئات منظّمة.

  • WebSocket streaming، REST، Python + TypeScript SDKs
  • $10k شهريًا
  • الحد الأدنى الفعلي: $120–150K سنويًا
  • وصول مباشر إلى فريق أبحاثنا

تسعيرلا يحمّل نموك عقوبة

ادفع حسب الاستخدام من اليوم الأول. لا رسوم مقاعد. لا التزامات سنوية. لا "تواصل معنا" للحصول على أسعار الإنتاج.

عرض التسعير الكامل
النموذج
TTS
TTS
TTS
ASR
اسم النموذج
S2.1 Pro Free
S2.1 Pro
S1
Transcribe-1
التسعير
مجاني للمطورين
$15 / 1M UTF-8 bytes
$15 / 1M UTF-8 bytes
$0.36 / ساعة

الأسئلة الشائعة

هل تنتقل من ElevenLabs أو Cartesia أو Rime؟

مقارنات تفصيلية حسب الإمكانات والسعر وشروط العقد. واجهة برمجية بنفس الشكل؛ تنتهي معظم عمليات الترحيل في الإنتاج في أقل من أسبوع.

اطّلع على المقارنة

المعايير والمنهجية والصوت الخام

نتائج اختبار تورينج الصوتي، ومنهجية التقييم الأعمى، ورخصة الأوزان المفتوحة. الأدلة الموضوعية وراء كل ادّعاء في هذه الصفحة.

اقرأ الأبحاث
Fish Audio

انطلق إلى الإنتاج في نهاية هذا الأسبوع

رصيد مجاني للبدء. لا تحتاج إلى بطاقة ائتمانية. نفس المستوى من النموذج الأولي حتى النطاق الكامل.