オープンソースが意味するものと、S2にとってそれが重要である理由

S2をリリースして以来、最も多く寄せられた質問はベンチマークやアーキテクチャについてではなく、ライセンスについてでした。 「『オープンソース』が何を意味するのか明確にしてもらえますか? 商用利用不可のように見えるのですが。」 もっともな質問です。私たちの答えは以下の通りです。
公開したもの
S2では、モデルの実行、研究、および構築に必要なすべてのコンポーネントを公開しました:
- モデルウェイト: 40億パラメータ(4B)のフルDual-ARモデル
- 微調整コード: 独自のデータとインフラでトレーニング可能
- 本番用推論エンジン: 私たちが本番環境で使用しているものと同じスタックであるSGLang-Omni経由
- 完全なテクニカルレポート: アーキテクチャの詳細、トレーニングレシピ、ベンチマーク手法 ダウンロードして、ローカルで実行し、微調整してください。すべての層を検査できます。すべてがそこにあります。
ライセンスの内容
S2は Fish Audio Research License の下でリリースされています。
- 研究および非商用利用: 完全に無料。制限はありません。
- 商用利用: Fish Audio からの別途ライセンスが必要です。 隠れた条項や、遡及的な制限はありません。
オープンソース vs オープンウェイト:S2の立ち位置
これについては率直にお伝えしたいと考えています。S2はオープンウェイトであり、OSIの定義によるオープンソースではありません。 今日のAI業界において、「オープンソース」という言葉は幅広いリリースモデルを指すようになっています。各組織は、コミュニティへのアクセスとビジネスの持続可能性のバランスをとるために、それぞれ異なるトレードオフを行っています。私たちは、貴重なツールを共有しつつ、研究開発への資金提供を継続できるよう、現在のライセンスモデルを選択しました。 ラベルについて議論する代わりに、私たちが提供しているものを正確に開示したいと考えています。私たちの取り組みを明確にするため、S2のリリースとこの分野の他の主要モデルとの比較を以下に示します:
| 公開コンポーネント | S2 | Llama 4 | DeepSeek R1 | Mistral Large 3 | GPT-OSS |
|---|---|---|---|---|---|
| モデルウェイト | ✅ | ✅ | ✅ | ✅ | ✅ |
| 微調整コード | ✅ | ✅ | ✅ | ✅ | ❌ |
| 推論エンジン | ✅ | ❌ | ❌ | ❌ | ❌ |
| テクニカルレポート | ✅ | ✅ | ✅ | ✅ | ❌ |
| 無料商用利用 | ❌ | ✅ (< 700M MAU) | ✅ (MIT) | ✅ (Apache 2.0) | ✅ |
| 学習データ | ❌ | ❌ | ❌ | ❌ | ❌ |
私たちは、これがTTS分野で最も完全なリリースの1つであると信じています。ウェイトと論文だけでなく、微調整コードと本番用推論エンジンも公開しました。これは、どのような規模においても珍しいことです。
なぜこのライセンスを選んだのか
最先端のTTSモデルを構築し維持するには、トレーニング、データインフラ、および研究への継続的な投資が必要です。世界最大のテクノロジー企業と競合するスタートアップとして、私たちはオープンであることと、構築を続ける能力のバランスをとる必要があります。 商用ライセンスは、私たちが開発を継続するための資金源です。これにより、次のモデルへの投資を続け、インフラを維持し、チームを成長させることができます。エンタープライズのお客様にとっては、サポートのないコミュニティのアップデートに頼るのではなく、専任チームに支えられた安定した本番環境対応のTTSモデルを手に入れられることを意味します。 私たちは意図的な選択をしました。コミュニティや開発者がS2を使用、研究、構築するために必要なすべてを無料で公開し、本番環境にデプロイしたい企業には商用ライセンスを提供します。これが、現在の私たちにとって適切なバランスだと考えています。
エンタープライズのお客様にとっての意味
商用利用のためにS2を評価している場合、プロセスは以下のようになります: 自由に評価してください。 ウェイトをダウンロードし、自社のインフラで実行し、ユースケースに合わせてベンチマークを行ってください。研究ライセンスはこれらすべてを無償でカバーします。 商用ライセンスはシンプルです。 サービスを開始する準備ができたら、business@fish.audio までご連絡ください。企業が安心して構築するために必要な柔軟性と法的明確性を提供するように設計された商用ライセンスを提供しています。APIアクセス、オンプレミス環境へのデプロイ、ホワイトラベル統合、またはカスタムアレンジメントが必要な場合でも、お客様に最適な構造を一緒に検討します。 完全な技術的コントロール。 ウェイトとともに微調整コードと推論エンジンを公開したため、基盤となるスタックが透明で検査可能であることを理解した上で、深い統合を構築できます。商用ライセンスにより、本番環境へのデプロイ権限が付与されます。
なぜ可能な限り公開し続けるのか
私たちは、維持可能な限りオープンでありたいと考えています。だからこそ、プロプライエタリ(独占的)にしておくこともできた推論エンジンをすべて公開したのです。だからこそ、完全なテクニカルレポートを公開したのです。だからこそ、微調整コードをウェイトと共に出荷しているのです。 同時に、コミュニティは常に Fish Audio の核心にあります。Fish Audio はオープンソースプロジェクトとして始まりました。私たちのプラットフォーム上の600万人のクリエイターと200万以上の音声モデルは、私たちだけで実現したものではありません。それはこのコミュニティのおかげです。だからこそ、私たちは可能な限り公開し続け、どこにも去ることはありません。
S2を試す: fish.audio/s2
GitHub: github.com/fishaudio/fish-speech
HuggingFace: huggingface.co/fishaudio/s2-pro
商用ライセンスのお問い合わせ: business@fish.audio
Rissa is the CEO and co-founder of Fish Audio, pushing breakthroughs in AI voice technology. Find her latest work at @rissa_cao.
Rissa Caoの他の記事を読む
