기간 한정 혜택- 연간 50% 할인사용하기
S2.1 Pro가 이제 개발자에게 무료입니다

프로덕션급 음성 AI.스타트업 가격으로.커뮤니티처럼 열린.

API 하나로 생동감 있는 음성 합성, 음성 복제, 음성 인식을 구현하세요. 공식 Python, TypeScript SDK 제공. 서브-세컨드 지연 시간. 첫 호출부터 종량제 과금.

S2.1 Pro가 라이브로 실행 중입니다. 음성을 선택하고 문장을 입력하면 바로 들을 수 있습니다. HeyGen, Retell, Sanas가 프로덕션에서 사용하는 바로 그 모델 — 회원가입도, 영업 통화도, 데모 환경도 필요 없습니다.

프로덕션에서 음성 제품을 만드는 팀들이 신뢰합니다

음성 에이전트 및 대화형 AI
비디오 보이스오버, 더빙 및 음악
인터랙티브 및 소셜
교육 및 학습

가입부터 첫 오디오까지 5 단 몇 분이면 충분합니다.

영업 통화 필요 없음. API 키를 발급받고, SDK를 설치하고, 바로 배포하세요.

CURL · 텍스트 음성 변환
# Text to speech in one call
curl -X POST \ https://api.fish.audio/v1/tts \
-H "Authorization: Bearer $FISH_API_KEY" \
-H "Content-Type: application/json" \
-H "model: s2.1-pro-free" \
-d '{"text": "Hello! Welcome to Fish Audio."}' \
--output welcome.mp3
PYTHON SDK
# Text to speech with the Python SDK
from fish_audio_sdk import Session, TTSRequest
 
session = Session("YOUR_API_KEY")
request = TTSRequest(text="Hello! Welcome to Fish Audio.")
with open("welcome.mp3", "wb") as f:
for chunk in session.tts(request):
f.write(chunk)

Fish로 만드는 팀들의 활용 사례.

카메라 앞에서도 살아있는 음성

# 아바타 비디오

AI 아바타 제품을 위한 입 모양 동기화 가능, 감정 인식 TTS. 인라인 방향 태그가 단순한 텍스트가 아닌 퍼포먼스를 이끌어냅니다.

HeyGen
VIGGLE
Pictoria

리얼타임 대화형 AI

# 음성 에이전트

WebSocket으로 1초 미만 턴테이킹. 스트리밍 TTS와 ASR을 하나의 스택으로 제공하며, 인터럽션을 인식합니다.

Retell
Sanas
Dubbing AI

동적 음성 콘텐츠.

# 오디오 콘텐츠 & 컴패니언

노트를 오디오로, 학습 도구, AI 컴패니언. 좌석이 아닌 사용량에 비례하는 문자당 과금.

PLAUD
Final Round AI

30초 만에 복제. 또는 복제 없이 바로 시작.

# 캐릭터 앱

30초 오디오로 IVC 즉시 복제. 스튜디오급 복제본을 위한 PVC. 또는 음성 라이브러리를 탐색하여 복제 없이 바로 배포.

OpenArt

API를 사용하거나 모델을 직접 호스팅하세요

지금 당장 구축하는 팀을 위한 클라우드 API. 프로덕션 요구사항이 생기면 엔터프라이즈 계약으로 자체 호스팅.

Hosted API · 모든 팀

클라우드 API, 종량제, 백만 자당 $15. 모델을 직접 운영할 필요 없는 팀을 위한 가장 빠른 프로덕션 진입 경로.

  • WebSocket 스트리밍, REST, Python + TypeScript SDK
  • $15 / 1M UTF-8 bytes — 약정 없음
  • 모든 호출에서 방향 태그 구문을 인라인으로 지정
  • 오픈 웨이트로 제공되는 동일한 모델

모델 자체 호스팅

오픈소스 모델인 fish-speech, S1, S2는 유료 상업 라이선스와 함께 오픈 웨이트로 제공됩니다. VPC, 데이터 센터, 소버린 클라우드, 또는 에어갭 환경에 직접 배포할 수 있습니다. 데이터 상주, 파인튜닝, 또는 규제 환경 배포가 필요한 고용량 팀을 위한 프리미엄 계약입니다.

  • WebSocket 스트리밍, REST, Python + TypeScript SDK
  • $10k/월
  • 실질 최소 비용: $120–150K/년
  • 리서치 팀과의 직접 소통

가격 정책성장해도 부담을 키우지 않게

첫날부터 종량제. 좌석 요금 없음. 연간 약정 없음. 프로덕션 요금 때문에 "문의하기" 버튼을 누를 일 없음.

전체 요금제 보기
모델
TTS
TTS
TTS
ASR
모델명
S2.1 Pro Free
S2.1 Pro
S1
Transcribe-1
요금
개발자 무료
$15 / 1M UTF-8 bytes
$15 / 1M UTF-8 bytes
$0.36 / 시간

자주 묻는 질문

ElevenLabs, Cartesia, 또는 Rime에서 오셨나요?

기능, 가격, 계약 조건별 상세 비교. API 구조가 유사하여 대부분의 프로덕션 마이그레이션은 일주일 이내에 완료됩니다.

비교 보기

벤치마크, 방법론, 원본 오디오

Audio Turing Test 결과, 블라인드 평가 방법론, 오픈 웨이트 라이선스. 이 페이지의 모든 주장을 뒷받침하는 근거들.

리서치 읽기
Fish Audio

이번 주말에 프로덕션까지

무료 크레딧으로 시작. 카드 불필요. 프로토타입부터 스케일까지 동일한 티어.