ذكاء اصطناعي صوتي بجودة الإنتاج.بأسعار مناسبة للشركات الناشئة.مفتوح كمجتمع.
أطلق كلامًا طبيعيًا، واستنساخًا للأصوات، وتفريغًا للنصوص عبر واجهة برمجية واحدة. SDKs رسمية لـ Python وTypeScript. زمن استجابة أقل من ثانية. تسعير حسب الاستخدام من أول طلب.

S2.1 Pro يعمل مباشرةً. اختر صوتًا، واكتب سطرًا، واستمع إليه. النموذج نفسه المستخدم في الإنتاج لدى HeyGen وRetell وSanas — بلا تسجيل، ولا مكالمة مبيعات، ولا بيئة تجريبية.
# The same call. The (direction) tags travel with the text.
curl https://api.fish.audio/v1/tts \
-H "Authorization: Bearer $FISH_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"text": "[chuckle] When you’re creating something new, there’s this [emphasis] beautiful mix of wonder and fear.",
"reference_id": "933563129e564b19a115bedd57b7406a",
"format": "mp3"
}' --output speech.mp3من التسجيل إلى أول صوت في 5 دقائق.
لا تحتاج إلى مكالمة مبيعات. احصل على مفتاح API، ثبّت SDK، وانطلق.
# Text to speech in one callcurl -X POST \ https://api.fish.audio/v1/tts \-H "Authorization: Bearer $FISH_API_KEY" \-H "Content-Type: application/json" \-H "model: s2.1-pro-free" \-d '{"text": "Hello! Welcome to Fish Audio."}' \--output welcome.mp3
# Text to speech with the Python SDKfrom fish_audio_sdk import Session, TTSRequestsession = Session("YOUR_API_KEY")request = TTSRequest(text="Hello! Welcome to Fish Audio.")with open("welcome.mp3", "wb") as f:for chunk in session.tts(request):f.write(chunk)
ما تُطلقه الفرق على Fish Audio.
صوت يصمد أمام الكاميرا
# فيديو الأفاتارTTS قادر على مزامنة الشفاه ومدرك للمشاعر، مناسب لمنتجات الأفاتار الذكي. وسوم التوجيه المضمّنة تصنع الأداء، لا مجرد الكلمات.
ذكاء اصطناعي تحادثي في الوقت الحقيقي
# وكيل صوتيأقل من ثانية لتبادل الأدوار عبر WebSocket. TTS وASR بالبث في مكدّس واحد. مع دعم المقاطعة.
محتوى صوتي ديناميكي.
# المحتوى الصوتي والرفاق الذكيونمن الملاحظات إلى الصوت، وأدوات التحضير، والرفاق الذكيين. تسعير لكل حرف يتوسع مع الاستخدام، لا مع عدد المقاعد.
استنسخ خلال 30 ثانية. أو تجاوز الاستنساخ كليًا.
# تطبيقات الشخصياتIVC من 30 ثانية من الصوت. PVC لنسخ بجودة الاستوديو. أو تصفّح مكتبة الأصوات وانطلق بدون استنساخ.
مصمم لمكدّس العمل في الوقت الحقيقي.
أوزان مفتوحة. رخصة تجارية مدفوعة.
نماذجنا مفتوحة المصدر — fish-speech، S1، وS2 — متاحة كأوزان مفتوحة برخصة تجارية مدفوعة. استضفها في بيئتك الخاصة (VPC، أو في الموقع، أو سحابة سيادية، أو بيئة معزولة) حين يستدعي الإنتاج ذلك. الاستضافة الذاتية تعاقد من مستوى Enterprise — انظر أدناه.
15,000+ وسمة توجيه. مضمّنة في أي طلب.
[warm], [near-whisper], [reassuring] — ينتقل التوجيه مع النص نفسه. لا معامل منفصل، ولا قائمة للاختيار منها، ولا ترحيل للمخطط (schema) عند توسّع مجموعة الوسوم.
اختبار تورينج الصوتي: 0.515.
لا يستطيع المستمعون التمييز بشكل موثوق بين S2.1 Pro والصوت البشري في التقييم الأعمى. 581 مقارنة وجهًا لوجه. المنهجية والصوت الخام منشوران.
$15 لكل مليون حرف. من أول طلب.
النموذج نفسه المستخدم لدى HeyGen وPictoria وDubbing AI وPlaud. ادفع حسب الاستخدام من أول طلب. لا "تواصل معنا" للحصول على أسعار الإنتاج.
استخدم API الخاص بنا. أو استضف النموذج بنفسك
واجهة برمجية سحابية لأي فريق ينشئ اليوم. الاستضافة الذاتية كخيار Enterprise متميز حين يستدعي الإنتاج ذلك.
API مستضاف · لأي فريق
واجهة برمجية سحابية بنموذج الدفع حسب الاستخدام، بسعر $15 لكل مليون حرف. أسرع طريق إلى الإنتاج للفرق التي لا تحتاج إلى تشغيل النموذج بنفسها.
- WebSocket streaming، REST، Python + TypeScript SDKs
- $15 / 1M UTF-8 bytes — بلا التزام
- صياغة التوجيه مضمّنة في كل طلب
- النموذج نفسه الذي يُنشر بأوزان مفتوحة
استضف النموذج بنفسك.
نماذجنا مفتوحة المصدر — fish-speech، S1، S2 — متاحة كأوزان مفتوحة برخصة تجارية مدفوعة. انشرها في VPC أو مركز بيانات أو سحابة سيادية أو بيئة معزولة تمامًا. تعاقد متميز مخصص للفرق ذات الأحجام العالية التي تحتاج إلى توطين البيانات أو الضبط الدقيق أو النشر في بيئات منظّمة.
- WebSocket streaming، REST، Python + TypeScript SDKs
- $10k شهريًا
- الحد الأدنى الفعلي: $120–150K سنويًا
- وصول مباشر إلى فريق أبحاثنا
تسعيرلا يحمّل نموك عقوبة
ادفع حسب الاستخدام من اليوم الأول. لا رسوم مقاعد. لا التزامات سنوية. لا "تواصل معنا" للحصول على أسعار الإنتاج.
عرض التسعير الكاملالأسئلة الشائعة
هل تنتقل من ElevenLabs أو Cartesia أو Rime؟
مقارنات تفصيلية حسب الإمكانات والسعر وشروط العقد. واجهة برمجية بنفس الشكل؛ تنتهي معظم عمليات الترحيل في الإنتاج في أقل من أسبوع.
المعايير والمنهجية والصوت الخام
نتائج اختبار تورينج الصوتي، ومنهجية التقييم الأعمى، ورخصة الأوزان المفتوحة. الأدلة الموضوعية وراء كل ادّعاء في هذه الصفحة.
انطلق إلى الإنتاج في نهاية هذا الأسبوع
رصيد مجاني للبدء. لا تحتاج إلى بطاقة ائتمانية. نفس المستوى من النموذج الأولي حتى النطاق الكامل.