ذكاء اصطناعي صوتي بجودة الإنتاج.بأسعار مناسبة للشركات الناشئة.مفتوح كمجتمع.

أطلق كلامًا طبيعيًا، واستنساخًا للأصوات، وتفريغًا للنصوص عبر واجهة برمجية واحدة. SDKs رسمية لـ Python وTypeScript. زمن استجابة أقل من ثانية. تسعير حسب الاستخدام من أول طلب.

احصل على مفتاح API اقرأ التوثيق

S2.1 Pro يعمل مباشرةً. اختر صوتًا، واكتب سطرًا، واستمع إليه. النموذج نفسه المستخدم في الإنتاج لدى HeyGen وRetell وSanas — بلا تسجيل، ولا مكالمة مبيعات، ولا بيئة تجريبية.

# The same call. The (direction) tags travel with the text.
curl https://api.fish.audio/v1/tts \
  -H "Authorization: Bearer $FISH_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "[chuckle] When you’re creating something new, there’s this [emphasis] beautiful mix of wonder and fear.",
    "reference_id": "933563129e564b19a115bedd57b7406a",
    "format": "mp3"
  }' --output speech.mp3

تثق به فرق تبني تجارب صوتية في الإنتاج

وكلاء الصوت والذكاء الاصطناعي التحادثي

التعليق الصوتي للفيديو، الدبلجة، والموسيقى

التفاعلي والاجتماعي

التعليم والتعلّم

من التسجيل إلى أول صوت في 5 دقائق.

لا تحتاج إلى مكالمة مبيعات. احصل على مفتاح API، ثبّت SDK، وانطلق.

CURL · تحويل النص إلى كلام

# Text to speech in one call
curl -X POST \ https://api.fish.audio/v1/tts \
-H "Authorization: Bearer $FISH_API_KEY" \
-H "Content-Type: application/json" \
-H "model: s2.1-pro-free" \
-d '{"text": "Hello! Welcome to Fish Audio."}' \
--output welcome.mp3

PYTHON SDK

# Text to speech with the Python SDK
from fish_audio_sdk import Session, TTSRequest
 
session = Session("YOUR_API_KEY")
request = TTSRequest(text="Hello! Welcome to Fish Audio.")
with open("welcome.mp3", "wb") as f:
    for chunk in session.tts(request):
        f.write(chunk)

ما تُطلقه الفرق على Fish Audio.

صوت يصمد أمام الكاميرا

# فيديو الأفاتار

TTS قادر على مزامنة الشفاه ومدرك للمشاعر، مناسب لمنتجات الأفاتار الذكي. وسوم التوجيه المضمّنة تصنع الأداء، لا مجرد الكلمات.

ذكاء اصطناعي تحادثي في الوقت الحقيقي

# وكيل صوتي

أقل من ثانية لتبادل الأدوار عبر WebSocket. TTS وASR بالبث في مكدّس واحد. مع دعم المقاطعة.

محتوى صوتي ديناميكي.

# المحتوى الصوتي والرفاق الذكيون

من الملاحظات إلى الصوت، وأدوات التحضير، والرفاق الذكيين. تسعير لكل حرف يتوسع مع الاستخدام، لا مع عدد المقاعد.

استنسخ خلال 30 ثانية. أو تجاوز الاستنساخ كليًا.

# تطبيقات الشخصيات

IVC من 30 ثانية من الصوت. PVC لنسخ بجودة الاستوديو. أو تصفّح مكتبة الأصوات وانطلق بدون استنساخ.

مصمم لمكدّس العمل في الوقت الحقيقي.

أوزان مفتوحة. رخصة تجارية مدفوعة.

نماذجنا مفتوحة المصدر — fish-speech، S1، وS2 — متاحة كأوزان مفتوحة برخصة تجارية مدفوعة. استضفها في بيئتك الخاصة (VPC، أو في الموقع، أو سحابة سيادية، أو بيئة معزولة) حين يستدعي الإنتاج ذلك. الاستضافة الذاتية تعاقد من مستوى Enterprise — انظر أدناه.

اقرأ شروط الترخيص

15,000+ وسمة توجيه. مضمّنة في أي طلب.

[warm], [near-whisper], [reassuring] — ينتقل التوجيه مع النص نفسه. لا معامل منفصل، ولا قائمة للاختيار منها، ولا ترحيل للمخطط (schema) عند توسّع مجموعة الوسوم.

تصفّح مكتبة التوجيه

اختبار تورينج الصوتي: 0.515.

لا يستطيع المستمعون التمييز بشكل موثوق بين S2.1 Pro والصوت البشري في التقييم الأعمى. 581 مقارنة وجهًا لوجه. المنهجية والصوت الخام منشوران.

اقرأ الأبحاث

$15 لكل مليون حرف. من أول طلب.

النموذج نفسه المستخدم لدى HeyGen وPictoria وDubbing AI وPlaud. ادفع حسب الاستخدام من أول طلب. لا "تواصل معنا" للحصول على أسعار الإنتاج.

عرض التسعير الكامل

استخدم API الخاص بنا. أو استضف النموذج بنفسك

واجهة برمجية سحابية لأي فريق ينشئ اليوم. الاستضافة الذاتية كخيار Enterprise متميز حين يستدعي الإنتاج ذلك.

API مستضاف · لأي فريق

واجهة برمجية سحابية بنموذج الدفع حسب الاستخدام، بسعر $15 لكل مليون حرف. أسرع طريق إلى الإنتاج للفرق التي لا تحتاج إلى تشغيل النموذج بنفسها.

WebSocket streaming، REST، Python + TypeScript SDKs
$15 / 1M UTF-8 bytes — بلا التزام
صياغة التوجيه مضمّنة في كل طلب
النموذج نفسه الذي يُنشر بأوزان مفتوحة

احصل على مفتاح API

استضف النموذج بنفسك.

نماذجنا مفتوحة المصدر — fish-speech، S1، S2 — متاحة كأوزان مفتوحة برخصة تجارية مدفوعة. انشرها في VPC أو مركز بيانات أو سحابة سيادية أو بيئة معزولة تمامًا. تعاقد متميز مخصص للفرق ذات الأحجام العالية التي تحتاج إلى توطين البيانات أو الضبط الدقيق أو النشر في بيئات منظّمة.