AI translatedDeutschEnglish

Was wir unter Open Source verstehen und warum es für S2 von Bedeutung ist

12. März 2026

Rissa CaoRissa Cao, CEO
OPEN SOURCEUNTERNEHMEN
Was wir unter Open Source verstehen und warum es für S2 von Bedeutung ist

Seit der Veröffentlichung von S2 war die am häufigsten gestellte Frage nicht etwa zu Benchmarks oder der Architektur, sondern zur Lizenz. „Könnt ihr klären, was ihr mit ‚Open Source‘ meint? Ich sehe nämlich, dass es nicht für die kommerzielle Nutzung vorgesehen ist.“ Eine berechtigte Frage. Hier ist unsere Antwort.

Was wir veröffentlicht haben

Mit S2 haben wir alle Komponenten bereitgestellt, die erforderlich sind, um das Modell auszuführen, zu untersuchen und darauf aufzubauen:

  • Modellgewichte: das vollständige Dual-AR-Modell mit 4 Milliarden Parametern
  • Code zur Feinabstimmung: Trainieren Sie auf Ihren eigenen Daten und Ihrer eigenen Infrastruktur
  • Inferenz-Engine für die Produktion: über SGLang-Omni, derselbe Stack, den wir in der Produktion einsetzen
  • Vollständiger technischer Bericht: Details zur Architektur, das Trainingsrezept und die Benchmark-Methodik Laden Sie es herunter. Lassen Sie es lokal laufen. Nehmen Sie eine Feinabstimmung vor. Überprüfen Sie jede Ebene. Alles ist vorhanden.

Was die Lizenz besagt

S2 wird unter der Fish Audio Research License veröffentlicht.

  • Forschung und nicht-kommerzielle Nutzung: völlig kostenlos. Keine Einschränkungen.
  • Kommerzielle Nutzung: erfordert eine separate Lizenz von Fish Audio. Keine versteckten Klauseln, keine rückwirkenden Einschränkungen.

Open Source vs. Open Weights: Wo S2 einzuordnen ist

Wir möchten hier ganz direkt sein: S2 ist ein „Open Weights“-Modell, kein „Open Source“-Modell nach der OSI-Definition. In der heutigen KI-Branche deckt der Begriff „Open Source“ ein breites Spektrum an Veröffentlichungsmodellen ab. Jede Organisation geht andere Kompromisse ein, um den Zugang für die Community mit der wirtschaftlichen Nachhaltigkeit in Einklang zu bringen. Wir haben unser aktuelles Lizenzmodell gewählt, um sicherzustellen, dass wir unsere Forschung und Entwicklung weiterhin finanzieren können, während wir gleichzeitig wertvolle Tools teilen. Anstatt über Bezeichnungen zu debattieren, möchten wir Ihnen volle Transparenz darüber bieten, was wir genau bereitstellen. Um unseren Ansatz zu verdeutlichen, folgt hier eine Aufschlüsselung, wie die Veröffentlichung von S2 im Vergleich zu anderen bedeutenden Modellen in diesem Bereich abschneidet:

Veröffentlichte KomponentenS2Llama 4DeepSeek R1Mistral Large 3GPT-OSS
Modellgewichte
Code zur Feinabstimmung
Inferenz-Engine
Technischer Bericht
Kostenlose kommerzielle Nutzung✅ (< 700M MAU)✅ (MIT)✅ (Apache 2.0)
Trainingsdaten

Wir glauben, dass dies eine der vollständigsten Veröffentlichungen im TTS-Bereich ist. Über die Gewichte und einen Bericht hinaus haben wir auch den Code zur Feinabstimmung und die Inferenz-Engine für die Produktion veröffentlicht, was in jedem Maßstab ungewöhnlich ist.

Warum wir uns für diese Lizenz entschieden haben

Die Entwicklung und Pflege eines hochmodernen TTS-Modells erfordert kontinuierliche Investitionen in Training, Dateninfrastruktur und Forschung. Als Startup, das in einem Markt mit einigen der größten Technologieunternehmen der Welt konkurriert, müssen wir Offenheit mit der Fähigkeit zur Weiterentwicklung in Einklang bringen. Die kommerzielle Lizenzierung ist unser Weg, die fortlaufende Entwicklung zu finanzieren. Sie ermöglicht es uns, weiterhin in das nächste Modell zu investieren, die Infrastruktur zu pflegen und das Team zu vergrößern. Für unsere Unternehmenskunden bedeutet dies, dass Sie ein stabiles, produktionsreifes TTS-Modell erhalten, das von einem engagierten Team unterstützt wird, anstatt sich auf nicht unterstützte Community-Updates verlassen zu müssen. Wir haben eine bewusste Entscheidung getroffen: Wir geben alles frei, was die Community und Entwickler benötigen, um S2 kostenlos zu nutzen, zu studieren und darauf aufzubauen, und bieten kommerzielle Lizenzen für Unternehmen an, die es in der Produktion einsetzen möchten. Wir halten dies für das richtige Gleichgewicht für unsere heutige Situation.

Was das für Unternehmenskunden bedeutet

Wenn Sie S2 für die kommerzielle Nutzung evaluieren, sieht der Weg wie folgt aus: Frei evaluieren. Laden Sie die Gewichte herunter, führen Sie sie auf Ihrer Infrastruktur aus, testen Sie Benchmarks für Ihre Anwendungsfälle. Die Forschungslizenz deckt all dies kostenlos ab. Kommerzielle Lizenzierung ist unkompliziert. Wenn Sie bereit für den Einsatz sind, kontaktieren Sie uns unter business@fish.audio. Wir bieten kommerzielle Lizenzen an, die Unternehmen die Flexibilität und rechtliche Klarheit geben sollen, die sie für eine sichere Entwicklung benötigen. Egal, ob Sie API-Zugriff, On-Premise-Deployment, White-Label-Integration oder eine individuelle Vereinbarung benötigen – wir finden gemeinsam mit Ihnen das passende Modell. Sie haben die volle technische Kontrolle. Da wir neben den Gewichten auch den Code zur Feinabstimmung und die Inferenz-Engine veröffentlicht haben, können Sie tiefe Integrationen bauen, im Wissen, dass der zugrunde liegende Stack transparent und überprüfbar ist. Eine kommerzielle Lizenz gewährt Ihnen das Recht zum Einsatz in der Produktion.

Warum wir weiterhin veröffentlichen, was wir können

Wir glauben daran, so offen zu sein, wie wir es wirtschaftlich vertreten können. Deshalb haben wir die komplette Inferenz-Engine veröffentlicht, obwohl wir sie auch proprietär hätten halten können. Deshalb haben wir den vollständigen technischen Bericht publiziert. Deshalb wird der Code zur Feinabstimmung zusammen mit den Gewichten bereitgestellt. Gleichzeitig stand die Community schon immer im Mittelpunkt von Fish Audio. Fish Audio begann als Open-Source-Projekt. 6 Millionen Creator und über 2 Millionen Sprachmodelle auf unserer Plattform sind nicht allein durch uns entstanden. Es geschah wegen dieser Community. Deshalb öffnen wir weiterhin, was wir können, und deshalb bleiben wir am Ball.


Testen Sie S2: fish.audio/s2
GitHub: github.com/fishaudio/fish-speech
HuggingFace: huggingface.co/fishaudio/s2-pro
Kommerzielle Lizenzierung: business@fish.audio

Erstelle Stimmen, die echt wirken

Beginnen Sie noch heute mit der Erstellung von Audio in höchster Qualität.

Haben Sie bereits ein Konto? Einloggen

Diesen Artikel teilen


Rissa Cao

Rissa CaoX

Rissa is the CEO and co-founder of Fish Audio, pushing breakthroughs in AI voice technology. Find her latest work at @rissa_cao.

Mehr von Rissa Cao lesen >

Neueste Artikel

Alle anzeigen >