우리가 말하는 '오픈 소스'의 의미와 S2에 이것이 중요한 이유

S2를 출시한 이후, 벤치마크나 아키텍처보다 더 자주 받은 질문은 바로 라이선스에 관한 것이었습니다.
"'오픈 소스'의 의미를 명확히 해주실 수 있나요? 상업적 이용이 불가능해 보여서요."
타당한 질문입니다. 이에 대한 답변을 드립니다.
우리가 공개한 것
S2와 함께 모델을 실행하고, 연구하고, 그 위에 구축하는 데 필요한 모든 구성 요소를 공개했습니다.
- 모델 가중치(Model weights): 40억 파라미터의 전체 Dual-AR 모델
- 미세 조정 코드(Fine-tuning code): 자체 인프라에서 고유한 데이터로 학습 가능
- 프로덕션 추론 엔진(Production inference engine): 실제 서비스와 동일한 스택인 SGLang-Omni 제공
- 전체 기술 보고서(Full technical report): 아키텍처 상세 정보, 학습 레시피, 벤치마크 방법론 직접 다운로드하고 로컬에서 실행하며 미세 조정해 보세요. 모든 레이어를 점검할 수 있습니다. 필요한 모든 것이 준비되어 있습니다.
라이선스 규정
S2는 Fish Audio Research License 하에 공개되었습니다.
- 연구 및 비상업적 이용: 완전 무료이며 제한이 없습니다.
- 상업적 이용: Fish Audio로부터 별도의 라이선스 취득이 필요합니다. 숨겨진 조항이나 소급 적용되는 제한 사항은 없습니다.
오픈 소스 vs 오픈 가중치: S2의 위치
이 점에 대해 명확히 말씀드리고자 합니다. S2는 OSI 정의에 따른 오픈 소스가 아니라, '오픈 가중치(Open weights)' 모델입니다.
오늘날 AI 업계에서 '오픈 소스'라는 용어는 광범위한 공개 모델을 포괄합니다. 모든 조직은 커뮤니티의 접근성과 비즈니스의 지속 가능성 사이에서 각기 다른 절충안을 선택합니다. 저희는 가치 있는 도구를 공유하면서도 연구 개발(R&D) 자금을 계속 확보하기 위해 현재의 라이선스 모델을 선택했습니다.
명칭에 대해 논쟁하기보다, 저희가 제공하는 것이 정확히 무엇인지 투명하게 공개하고자 합니다. 저희의 접근 방식을 명확히 하기 위해, S2의 공개 범위를 해당 분야의 다른 주요 모델들과 비교해 보았습니다.
| 공개된 구성 요소 | S2 | Llama 4 | DeepSeek R1 | Mistral Large 3 | GPT-OSS |
|---|---|---|---|---|---|
| 모델 가중치 | ✅ | ✅ | ✅ | ✅ | ✅ |
| 미세 조정 코드 | ✅ | ✅ | ✅ | ✅ | ❌ |
| 추론 엔진 | ✅ | ❌ | ❌ | ❌ | ❌ |
| 기술 보고서 | ✅ | ✅ | ✅ | ✅ | ❌ |
| 무료 상업적 이용 | ❌ | ✅ (< 700M MAU) | ✅ (MIT) | ✅ (Apache 2.0) | ✅ |
| 학습 데이터 | ❌ | ❌ | ❌ | ❌ | ❌ |
저희는 이것이 TTS 분야에서 가장 완성도 높은 공개 중 하나라고 믿습니다. 가중치와 논문을 넘어 미세 조정 코드와 프로덕션 추론 엔진까지 공개하는 것은 어떤 규모에서든 흔치 않은 일입니다.
이 라이선스를 선택한 이유
최첨단 TTS 모델을 구축하고 유지하려면 학습, 데이터 인프라 및 연구에 대한 지속적인 투자가 필요합니다. 세계 최대의 기술 기업들과 경쟁하는 스타트업으로서, 저희는 개방성과 지속적인 개발 능력 사이에서 균형을 잡아야 합니다.
상업적 라이선싱은 저희가 지속적으로 개발을 이어갈 수 있는 재원이 됩니다. 이를 통해 다음 모델에 투자하고, 인프라를 유지하며, 팀을 성장시킬 수 있습니다. 기업 고객에게 이는 지원되지 않는 커뮤니티 업데이트에 의존하는 대신, 전담 팀이 지원하는 안정적이고 즉시 프로덕션에 투입 가능한 TTS 모델을 얻게 됨을 의미합니다.
저희는 의도적인 선택을 내렸습니다. 커뮤니티와 개발자가 S2를 무료로 사용, 연구 및 구축하는 데 필요한 모든 것을 공개하되, 이를 프로덕션에 배포하려는 기업에는 상업적 라이선스를 제공하는 것입니다. 이것이 현재 저희의 상황에서 적절한 균형이라고 생각합니다.
기업 고객에게 갖는 의미
상업적 이용을 위해 S2를 검토 중이시라면 다음과 같은 단계를 거치게 됩니다:
자유롭게 평가하세요. 가중치를 다운로드하여 자체 인프라에서 실행하고 사용 사례에 맞춰 벤치마크를 수행하세요. 연구용 라이선스는 이 모든 과정을 비용 없이 보장합니다.
상업적 라이선스 절차는 간단합니다. 제품을 출시할 준비가 되었다면 business@fish.audio로 문의해 주세요. 저희는 기업이 확신을 가지고 개발할 수 있도록 유연성과 법적 명확성을 제공하는 상업적 라이선스를 갖추고 있습니다. API 액세스, 온프레미스 배포, 화이트 레이블 통합 또는 맞춤형 계약 등 무엇이 필요하시든 최적의 구조를 찾기 위해 협력하겠습니다.
완벽한 기술적 제어권을 가집니다. 가중치와 함께 미세 조정 코드와 추론 엔진을 공개했기 때문에, 기본 스택이 투명하고 점검 가능하다는 것을 알고 딥 인테그레이션을 구축할 수 있습니다. 상업적 라이선스는 이를 프로덕션에 배포할 수 있는 권한을 부여합니다.
가능한 것들을 계속 공개하는 이유
저희는 유지 가능한 한 최대한으로 개방하는 것을 신조로 삼고 있습니다. 독점할 수도 있었던 전체 추론 엔진을 공개한 이유, 완전한 기술 보고서를 발표한 이유, 그리고 가중치와 함께 미세 조정 코드를 제공하는 이유가 바로 여기에 있습니다.
동시에 커뮤니티는 언제나 Fish Audio의 핵심이었습니다. Fish Audio는 오픈 소스 프로젝트로 시작되었습니다. 저희 플랫폼의 600만 크리에이터와 200만 개 이상의 음성 모델은 저희만의 힘으로 이루어진 것이 아니라, 바로 이 커뮤니티 덕분에 가능했습니다. 이것이 저희가 가능한 부분을 계속해서 공개하는 이유이며, 저희가 여러분 곁을 지키는 이유입니다.
S2 체험하기: fish.audio/s2
GitHub: github.com/fishaudio/fish-speech
HuggingFace: huggingface.co/fishaudio/s2-pro
상업적 라이선스 문의: business@fish.audio
Rissa is the CEO and co-founder of Fish Audio, pushing breakthroughs in AI voice technology. Find her latest work at @rissa_cao.
Rissa Cao의 더 많은 글 보기
