Zeitlich begrenztes Angebot- 50% RABATT JÄHRLICHEinlösen
23. Juni 2026Research

Fish Audio S2.1 Pro: Kostenlose Text-to-Speech-API für Entwickler

Fish Audio S2.1 Pro: Kostenlose Text-to-Speech-API für Entwickler

Kurze Zusammenfassung:

  • S2.1 Pro, das fortschrittlichste Sprachmodell von Fish Audio, ist jetzt als kostenlose Text-to-Speech-API verfügbar

  • 83 Sprachen, unbegrenzte Nutzung im Rahmen der Fair Use Policy

  • Modell-String: s2.1-pro-free — einfach in Ihre bestehenden Fish API-Aufrufe einfügen

S2.1 Pro kostenlos testen — erstes Audio in 5 Minuten →

Juni 2026 | Das Modell S2.1 Pro von Fish Audio ist jetzt als kostenlose Text-to-Speech-API mit unbegrenztem Zugriff unter Fair Use verfügbar.


Warum hochwertige Sprach-KI bisher immer teuer war

Wenn Sie jemals Text-to-Speech-APIs evaluiert haben, kennen Sie das Muster: Die Modelle, die wirklich gut klingen, kosten Geld.

Das kostenlose Kontingent von ElevenLabs bietet 10.000 Credits pro Monat (ca. 6 - 10 Minuten), bevor die Paywall greift. OpenAI TTS ist ein Pay-per-Use-Dienst ohne kostenlose Stufe. Googles neueste Gemini TTS-Modelle — ihre fortschrittlichsten — bieten keinerlei kostenlose Nutzung: Sie zahlen ab dem ersten Token. Das Muster in der Branche ist konsistent: State-of-the-Art-Sprachqualität war bisher ein kostenpflichtiges Feature.

Dies stellt Entwickler vor ein echtes Problem. Der Markt für KI-Stimmgeneratoren wächst jährlich um fast 20 % — aber die Werkzeuge zum Erstellen sprachgesteuerter Produkte blieben hinter einer Paywall verborgen. Ein Modell lässt sich mit 10.000 Credits nicht vernünftig evaluieren. Man kann keinen Sprach-Agenten prototypisieren, keine Hörbuch-Pipeline testen oder mit Voice Cloning experimentieren, ohne vorab Budget bereitzustellen oder Wochen damit zu verbringen, sich mit Open-Source-Alternativen herumzuschlagen, die eine eigene GPU-Infrastruktur erfordern.

Fish Audio ändert das heute.


Was ist S2.1 Pro?

S2.1-Pro Benchmark: Durchsatz (tok/s) und TTFB p50 (ms) über verschiedene Parallelitätsstufen von 1 bis 512, zeigt 8.006 tok/s bei c=64 und 73,2 ms TTFB bei c=1

S2.1 Pro ist das aktuelle State-of-the-Art-Sprachmodell von Fish Audio — das beste Modell, das wir haben, steht nun jedem Entwickler kostenlos über die API zur Verfügung. Es handelt sich um ein neuronales Sprachsynthesemodell, das für die KI-Sprachgenerierung auf Produktionsniveau entwickelt wurde, mit besonderen Stärken bei Streaming mit geringer Latenz, multilingualem TTS und Voice Cloning. Es baut auf der Grundlage von S2 auf, das wir Anfang dieses Jahres mit offenen Gewichten veröffentlicht haben.

Leistung

  • 61 % Gewinnrate gegenüber der vorherigen Generation S2 Pro in Head-to-Head-Hörvergleichen — siehe unseren Blindvergleich der TTS-Anbieter für mehr Kontext
  • ~70 ms Time-to-First-Audio (TTFA) bei einer Einzelanfrage — weniger als die ~100 ms der vorherigen Generation
  • 2x+ Durchsatzsteigerung bei hoher Parallelast

Den vollständigen technischen Hintergrund finden Sie in unserem Paper: Hier

Sprachunterstützung

S2.1 Pro unterstützt 83 Sprachen, darunter Englisch, Japanisch, Chinesisch, Koreanisch, Spanisch, Arabisch, Französisch, Deutsch, Portugiesisch, Russisch und Dutzende weitere. Dasselbe Modell verarbeitet alle Sprachen — keine separaten Endpunkte, keine Preisgestaltung pro Sprache.

Latenz

S2.1-Pro liefert eine TTFA (Time to First Audio) von ca. 90 ms über die Standard-API, was es für Live-Sprach-Agenten und Dialogsysteme tauglich macht. Wenn Sie eine feingranulare Kontrolle über Prosodie und Vortragsweise benötigen, sehen Sie sich auch die Möglichkeiten der Wort-Level-Sprachsteuerung von S2 an.


Warum Fish Audio dies jetzt kostenlos anbieten kann

Inferenz-Infrastruktur von Fish Audio S2.1-Pro: NVIDIA H200 mit FP8 GEMM und benutzerdefiniertem Scheduler liefert 125 Audio-tok/s pro Anfrage (RTF 0,17) und ~70 ms TTFA

Die Kurzfassung: Wir haben den Inferenz-Stack von Grund auf neu aufgebaut, und die Kosten pro Anfrage sind so stark gesunken, dass wir sie übernehmen können.

Eigene GPU-Kernel

Wir haben fish-scales-ops entwickelt, eine FP8 GEMM- und FlashAttention-Bibliothek für den Produktiveinsatz, die auf NVIDIA Hopper (H100/H200) und Blackwell (RTX 6000 PRO) Architekturen zugeschnitten ist. Bei den für das Voice-AI-Serving wichtigen Decode-Shapes übertrifft unser MXFP8-Pfad die torch.compile-fused cuBLAS-Referenz um das 2,1- bis 4,3-fache. Sie müssen nichts davon verstehen, um die API zu nutzen — aber es ist der Grund, warum die kostenlose Stufe nachhaltig ist.

Höherer Durchsatz

Auf einer einzelnen H200 mit FP8-Quantisierung hält das System einen Output-Durchsatz von über 8.000 Token/Sekunde bei 64 gleichzeitigen Anfragen aufrecht. Mehr Durchsatz pro GPU bedeutet mehr verarbeitete Anfragen pro Dollar, was den unbegrenzten kostenlosen Zugang wirtschaftlich tragbar macht.


Was „kostenlos“ wirklich bedeutet

Wir möchten ehrlich über die Einschränkungen sein, anstatt sie zu verstecken.

Was Sie erhalten:

  • Modell-String: s2.1-pro-free
  • Zugriff auf hohe Volumina ohne harte Zeichenbegrenzung (vorbehaltlich der Fair Use Policy)
  • Gleicher API-Endpunkt wie bei kostenpflichtigen Tarifen — keine separate Integration

Aktuelle Einschränkungen:

  • Dauer: Der kostenlose Zugang ist verfügbar bis zum 24. Juli 2026 — wir werden Änderungen mit Vorankündigung kommunizieren
  • Kein SLA: Keine Garantien für Uptime oder TTFA; entwickelt für Experimente und Prototyping
  • Keine Latenzgarantie: Best-Effort, nicht vertraglich zugesichert
  • Datenspeicherung: Anfragen können zur Verbesserung der Modellqualität verwendet werden — siehe unsere Datenschutzerklärung
  • Gewerbliche Nutzung: Bei einigen kommerziellen Szenarien kann es Einschränkungen geben. Produkte, die mehr als 1 Mio. $ ARR generieren, sollten uns kontaktieren, bevor sie S2.1 Pro Free nutzen. Einzelheiten finden Sie unter Preise & Ratenbegrenzungen

Wenn Sie Produktions-SLA und Latenzgarantien benötigen, stehen kostenpflichtige Tarife zur Verfügung. Diese Stufe ist der richtige Ort zum Aufbauen, Evaluieren und Entscheiden.


So nutzen Sie die kostenlose Text-to-Speech-API: S2.1 Pro Schnellstart

Holen Sie sich Ihren API-Schlüssel unter fish.audio/app/api-keys und tätigen Sie Ihren ersten Aufruf. Die Fish API akzeptiert msgpack-kodierte Anfragen und gibt Audio im gewählten Format zurück. Vollständige Referenz in der API-Dokumentation.

JavaScript

import { writeFile } from "fs/promises";

const body = {
  text: "Hello, world!",
  reference_id: "your_model_id",
  format: "mp3",
};

const res = await fetch("https://api.fish.audio/v1/tts", {
  method: "POST",
  headers: {
    Authorization: "Bearer <YOUR_API_KEY>",
    "Content-Type": "application/json",
    model: "s2.1-pro-free",
  },
  body: JSON.stringify(body),
});

if (!res.ok) {
  throw new Error(`TTS request failed: ${res.status} ${await res.text()}`);
}

const buffer = Buffer.from(await res.arrayBuffer());
await writeFile("output.mp3", buffer);

Python

import httpx

body = {
    "text": "Hello, world!",
    "reference_id": "your_model_id",
    "format": "mp3",
}

with httpx.Client() as client:
    res = client.post(
        "https://api.fish.audio/v1/tts",
        headers={
            "Authorization": "Bearer <YOUR_API_KEY>",
            "Content-Type": "application/json",
            "model": "s2.1-pro-free",
        },
        json=body,
    )

res.raise_for_status()

with open("output.mp3", "wb") as f:
    f.write(res.content)

Die einzige Änderung gegenüber jedem anderen Fish Audio API-Aufruf: Setzen Sie model: "s2.1-pro-free" in den Headern. Das ist alles.

Holen Sie sich Ihren kostenlosen API-Schlüssel →


S2.1 Pro im Vergleich zu ElevenLabs und den besten TTS-APIs im Jahr 2026

Die untenstehenden Informationen zu Wettbewerbern basieren auf öffentlich zugänglichen Dokumentationen und Preisenseiten Stand Juni 2026. Preise und Funktionen können sich ändern — prüfen Sie dies direkt beim jeweiligen Anbieter, bevor Sie eine Produktionsentscheidung treffen.

Vergleich kostenloser TTS-APIs im Jahr 2026: Fish Audio S2.1-Pro vs. ElevenLabs vs. OpenAI TTS vs. Google Cloud TTS

Für eine tiefergehende unabhängige Analyse siehe unseren Blindvergleich der TTS-Anbieter.

Fazit: Unter den von uns evaluierten großen TTS-API-Anbietern bietet Fish Audio derzeit eines der großzügigsten kostenlosen Zugangsmodelle — das einzige, bei dem die kostenlose Stufe dasselbe State-of-the-Art-Modell wie die kostenpflichtige Stufe nutzt, ohne harte Nutzungsobergrenze. Die kostenlose Stufe von ElevenLabs ist effektiv ein Test mit 10.000 Credits. Das fortschrittlichste TTS von Google (Gemini TTS) bietet überhaupt keine kostenlose Stufe.

Suchen Sie nach einer kostenlosen ElevenLabs-Alternative, die keine Kompromisse bei der Modellqualität eingeht? S2.1 Pro ist ab sofort ohne Nutzungsobergrenze verfügbar.

Suchen Sie nach einer kostenlosen OpenAI TTS-Alternative? Das TTS-Angebot von OpenAI hat keine kostenlose Stufe — S2.1 Pro ist eine überzeugende Option für die erste Evaluierung.

Vollständige API-Dokumentation ansehen und mit dem Bauen beginnen →


Was Sie damit bauen können

Die kostenlose Stufe ist bewusst nicht auf bestimmte Anwendungsfälle beschränkt. Hier sind die Szenarien, in denen die Kombination aus KI-Sprachgenerierung mit geringer Latenz, multilingualer Unterstützung und Voice Cloning von S2.1 Pro am meisten bewirkt.

Sprach-Agenten

Echtzeit-KI für Konversationen steht und fällt mit der Latenz. Mit einer TTFA von ca. 90 ms bei Standardaufrufen ist S2.1 Pro schnell genug für natürliche Dialoge. Kombinieren Sie es mit einem Speech-to-Text-Layer und einem LLM für eine vollständige Sprach-Pipeline ohne Abrechnung pro Zeichen. Sie können S2.1 Pro auch über unseren Support für MCP und Agent-Skills in Agenten-Workflows integrieren.

Hörbücher und lange Erzählungen

Die Unterstützung von 83 Sprachen und die natürliche Prosodie machen S2.1 Pro ideal für die Hörbuchproduktion und lange Sprachsynthesen. Unbegrenzte Nutzung bedeutet, dass Sie vollständige Manuskripte verarbeiten können, ohne auf einen Zeichenzähler zu achten oder Credits vorab kaufen zu müssen.

Voice Cloning

S2.1 Pro unterstützt Voice Cloning aus Referenz-Audio via API — übergeben Sie ein Referenz-Audio-Sample und das Modell synthetisiert Sprache in dieser Stimme. Erstellen Sie personalisierte Sprachanwendungen, lokalisieren Sie Inhalte mit konsistenter Sprecheridentität oder generieren Sie Charakterstimmen für Spiele und Animationen. Voice Cloning ist in der kostenlosen Stufe verfügbar, vorbehaltlich derselben Fair Use Policy.

Multilinguale Anwendungen

Wenn Ihre Anwendung Benutzer in mehreren Sprachen bedient, ist die Abdeckung von 83 Sprachen mit einer einzigen konsistenten KI-Sprach-API eine deutliche Vereinfachung gegenüber Alternativen, die separate Modell-Endpunkte pro Sprache erfordern oder Premium-Preise für nicht-englische Sprachsynthese verlangen.

Dialoge für Spiele-NPCs

Audio-Pipelines für Spiele profitieren von hohem Durchsatz und berechenbaren Kosten pro Anfrage. Die unbegrenzte kostenlose Nutzung macht es praktikabel, große Dialogbibliotheken zu erstellen und während der Entwicklung frei zu iterieren, bevor man sich auf ein Produktionsbudget festlegt.


Verfügbar über unser Partner-Ökosystem

S2.1 Pro ist auch über eine wachsende Zahl von Partnerplattformen verfügbar, darunter Runware, Retell, Sierra und andere.

Wenn Sie bereits auf einer dieser Plattformen entwickeln, ist S2.1 Pro ohne zusätzliche Integration oder Einrichtung zugänglich — nutzen Sie einfach das, was Sie bereits haben.

Wir bauen das Partnernetzwerk aktiv aus. Wenn Sie ein Plattform- oder Infrastrukturanbieter sind und an der Integration von S2.1 Pro interessiert sind, kontaktieren Sie unser Team, um die Möglichkeiten auszuloten.


Fair Use & wie es weitergeht

Die kostenlose Stufe unterliegt einer Fair Use Policy. Wir behalten uns das Recht vor, den Zugriff bei Nutzungsmustern zu drosseln oder einzuschränken, die eher nach Missbrauch als nach Entwicklung aussehen — Ziel ist es, den Zugang für die gesamte Entwickler-Community zu schützen und keine willkürlichen Grenzen für legitime Anwendungsfälle zu setzen. Einzelheiten finden Sie unter Preise & Ratenbegrenzungen.

Ein paar Dinge, die Sie erwarten können:

  • Der kostenlose Zugang ist ab sofort verfügbar für einen ersten Zeitraum. Wir werden rechtzeitig informieren, bevor sich etwas ändert.
  • Kostenpflichtige Tarife mit SLA-Garantien, Latenzzusagen und kommerzieller Lizenzierung sind für Produktions-Workloads verfügbar.
  • Investitionen in die Infrastruktur laufen weiter — die technische Arbeit, die diese kostenlose Stufe ermöglicht hat, ist kein einmaliges Ereignis.
  • Open-Source-Infrastruktur: Wir planen, die Infrastrukturkomponenten hinter S2.1 Pro als Open Source zu veröffentlichen — denselben Stack, der die kostenlose Stufe nachhaltig macht.

Wenn Sie Fish Audio für einen Produktiveinsatz evaluieren, ist die kostenlose Stufe der richtige Ort für den Anfang. Bauen Sie etwas Echtes, messen Sie, was für Ihre Anwendung wichtig ist, und melden Sie sich bei uns, wenn Sie bereit sind, über Produktionsanforderungen zu sprechen.

Keine Kreditkarte. Keine Warteliste. Keine Grenzen für das, was Sie ausprobieren können.

Holen Sie sich Ihren kostenlosen API-Schlüssel →","image_alt":"Fish Audio S2.1-Pro — jetzt offen für alle Entwickler und kostenlos","image_caption":"Fish Audio S2.1-Pro bietet modernste Text-to-Speech-Technologie für jeden Entwickler.","article_tags":["Forschung"],"faq":[{"question":"Was ist eine Text-to-Speech-API?","answer":"Eine Text-to-Speech-API (TTS-API) ist ein Webdienst, der geschriebenen Text in gesprochenes Audio umwandelt. Entwickler senden eine Textzeichenfolge an den API-Endpunkt und erhalten eine Audiodatei zurück — normalerweise im Format MP3, WAV oder Opus —, die in Anwendungen abgespielt, gespeichert oder in Echtzeit gestreamt werden kann. Moderne KI-Sprach-APIs wie S2.1 Pro verwenden neuronale Sprachsynthesemodelle, um natürlich klingendes Audio zu erzeugen, das kaum von menschlicher Sprache zu unterscheiden ist."},{"question":"Ist Fish Audio S2.1 Pro wirklich kostenlos?","answer":"Ja. S2.1 Pro ist über die Fish API unter Verwendung des Modell-Strings s2.1-pro-free kostenlos verfügbar. Es gibt keine harte Zeichenbegrenzung — die Nutzung unterliegt einer Fair Use Policy, um Missbrauch zu verhindern. Die kostenlose Stufe bietet kein SLA und keine Latenzgarantie, und Anfragen können zur Modellverbesserung gespeichert werden. Sie ist für Entwicklung, Prototyping und Evaluierung konzipiert. Vollständige Details finden Sie unter Preise & Ratenbegrenzungen."},{"question":"Was ist die beste kostenlose TTS-API im Jahr 2026?","answer":"Die beste kostenlose TTS-API hängt von Ihrem Anwendungsfall ab. Unter den großen Anbietern bietet Fish Audio S2.1 Pro einen großzügigen kostenlosen Zugang zu einem Modell der aktuellen Generation, ohne harte Nutzungsobergrenze und mit Unterstützung für 83 Sprachen. ElevenLabs bietet 10.000 kostenlose Credits pro Monat mit Zugriff auf seine Sprachbibliothek. Die älteren WaveNet-Stimmen von Google sind bis zu 4 Millionen Zeichen pro Monat kostenlos. OpenAI TTS und das neueste Gemini TTS von Google haben keine kostenlose Stufe. Für Entwickler, die eine State-of-the-Art KI-Sprach-API ohne Budgetbeschränkungen evaluieren möchten, ist S2.1 Pro ein starker Ausgangspunkt."},{"question":"Wie schneidet Fish Audio im Vergleich zu ElevenLabs ab?","answer":"Sowohl Fish Audio als auch ElevenLabs bieten hochwertige neuronale Sprachgenerierung und Voice Cloning. Die wichtigsten praktischen Unterschiede in der kostenlosen Stufe: Die kostenlose Stufe von Fish Audio nutzt dasselbe S2.1 Pro-Modell wie die kostenpflichtige Stufe ohne harte Nutzungsobergrenze; die kostenlose Stufe von ElevenLabs ist auf 10.000 Credits pro Monat begrenzt. Bei der Sprachunterstützung bietet Fish Audio 83 Sprachen gegenüber den 70+ von ElevenLabs. ElevenLabs verfügt über eine größere Bibliothek an vordefinierten Stimmen und ein etablierteres Ökosystem für kreative Inhalte. Fish Audio ist tendenziell stärker bei entwicklerfokussierten Anwendungsfällen, die geringe Latenz, hohe Parallelität oder multilinguale Unterstützung erfordern. Siehe unseren Blindvergleich der TTS-Anbieter für einen unabhängigen Benchmark."},{"question":"Unterstützt Fish Audio Voice Cloning?","answer":"Ja. S2.1 Pro unterstützt Voice Cloning aus Referenz-Audio. Sie können ein Referenz-Audio-Sample übergeben, und das Modell synthetisiert Sprache in dieser Stimme. Dies funktioniert in allen 83 unterstützten Sprachen, was besonders nützlich für die Lokalisierung von Inhalten ist, bei denen eine konsistente Sprecheridentität entscheidend ist. Unser Voice-Cloning-System gehört zu den stärksten seiner Klasse und liefert hohe Sprecherkonsistenz, natürliche Prosodie und stabile Leistung über Sprachen und Akzente hinweg. Voice Cloning ist in der kostenlosen Stufe verfügbar, vorbehaltlich derselben Fair Use Policy wie alle anderen Nutzungen von s2.1-pro-free."},{"question":"Kann ich Fish Audio kommerziell nutzen?","answer":"Für die kostenlose Stue (s2.1-pro-free) können Einschränkungen für bestimmte kommerzielle Szenarien gelten. Für die produktive kommerzielle Nutzung mit vollständiger Lizenzierung, SLA und ohne Datenspeicherung beziehen Sie sich bitte auf die kostenpflichtigen Tarife von Fish Audio. Die aktuellen Richtlinien finden Sie unter Preise & Ratenbegrenzungen sowie in den Nutzungsbedingungen."},{"question":"Welche Sprachen unterstützt Fish Audio?","answer":"S2.1 Pro unterstützt 83 Sprachen, darunter Englisch, Japanisch, Koreanisch, Chinesisch, Spanisch, Portugiesisch, Arabisch, Französisch, Deutsch, Russisch, Italienisch, Türkisch, Niederländisch, Polnisch, Vietnamesisch, Thai, Indonesisch und viele mehr. Alle Sprachen werden von demselben Modell bedient — es gibt keine separaten Endpunkte oder sprachspezifischen Preisstufen."}]}of_thought 1.34s}JSON format translated content based on the provided schema. The translation is natural for a German developer audience while preserving brand names and markdown. 1.25s}json{

Häufig Gestellte Fragen

What is a text-to-speech API?
A text-to-speech API (TTS API) is a web service that converts written text into spoken audio. Developers send a text string to the API endpoint and receive back an audio file — typically MP3, WAV, or Opus — which can be played back in applications, stored, or streamed in real time. Modern AI voice APIs like S2.1 Pro use neural speech synthesis models to produce natural-sounding audio that's difficult to distinguish from human speech.
Is Fish Audio S2.1 Pro really free?
Yes. S2.1 Pro is available at no cost via the Fish API using model string `s2.1-pro-free`. There is no hard character cap — usage is subject to a Fair Use Policy to prevent abuse. The free tier has no SLA and no latency guarantee, and requests may be retained for model improvement. It is designed for development, prototyping, and evaluation. See [Pricing & Rate Limits](https://docs.fish.audio/developer-guide/models-pricing/pricing-and-rate-limits) for full details.
What is the best free TTS API in 2026?
The best free TTS API depends on your use case. Among the major providers: Fish Audio S2.1 Pro offers generous free access to a current-generation model, with no hard usage cap and 83-language support. ElevenLabs offers 10,000 free credits per month with access to its voice library. Google's legacy WaveNet voices are free up to 4 million characters per month. OpenAI TTS and Google's latest Gemini TTS have no free tier. For developers who want to evaluate a state-of-the-art AI voice API without budget constraints, S2.1 Pro is a strong starting point.
How does Fish Audio compare with ElevenLabs?
Both Fish Audio and ElevenLabs offer high-quality neural voice generation and voice cloning. The main practical differences on the free tier: Fish Audio's free tier runs the same S2.1 Pro model as the paid tier with no hard usage cap; ElevenLabs' free tier is capped at 10,000 credits per month. On language coverage, Fish Audio supports 83 languages versus ElevenLabs' 70+. ElevenLabs has a larger library of pre-built voices and a more established creative content ecosystem. Fish Audio tends to be stronger for developer-focused use cases requiring low latency, high concurrency, or multilingual support. See our [blind TTS comparison](https://fish.audio/blog/blind-tts-provider-comparison-2026/) for an independent benchmark.
Does Fish Audio support voice cloning?
Yes. S2.1 Pro supports [voice cloning from reference audio](https://docs.fish.audio/features/voice-cloning). You can pass a reference audio sample and the model will synthesize speech in that voice. This works across all 83 supported languages, making it especially useful for content localization where consistent speaker identity is critical. Our voice cloning system is one of the strongest in its class, delivering high speaker consistency, natural prosody, and stable performance across languages and accents. Voice cloning is available on the free tier, subject to the same Fair Use Policy as all other s2.1-pro-free usage.
Can I use Fish Audio commercially?
The free tier (`s2.1-pro-free`) may have restrictions on certain commercial scenarios. For production commercial use with full licensing, SLA, and no data retention, refer to Fish Audio's paid plans. See [Pricing & Rate Limits](https://docs.fish.audio/developer-guide/models-pricing/pricing-and-rate-limits) and [Terms of Service](https://fish.audio/terms/) for the current policy.
What languages does Fish Audio support?
S2.1 Pro supports 83 languages, including English, Japanese, Korean, Chinese, Spanish, Portuguese, Arabic, French, German, Russian, Italian, Turkish, Dutch, Polish, Vietnamese, Thai, Indonesian, and many more. All languages are served by the same model — there are no separate endpoints or language-specific pricing tiers.
Shijia Liao

Shijia LiaoX

Founder & Chief-Scientist of Fish Audio.

Mehr von Shijia Liao lesen

Erstelle Stimmen, die echt wirken

Beginnen Sie noch heute mit der Erstellung von Audio in höchster Qualität.

Haben Sie bereits ein Konto? Einloggen