Google Docs 텍스트 음성 변환(TTS) 완벽 튜토리얼: 시작 및 사용 가이드
2026년 2월 28일
Google Docs에서 3,000단어 분량의 수업 계획안을 막 마쳤습니다. 학생들보다 먼저 어색한 문구를 찾아내기 위해 내용을 소리로 들어보고 싶으실 겁니다. 모든 메뉴를 클릭하고, [Accessibility] 설정을 확인하고, 도움말 바에서 "말하기(speak)"를 검색해 봅니다. 20분 후, Google Docs에는 내장된 "읽어주기(Read Aloud)" 버튼이 없다는 사실을 깨닫게 됩니다.
이러한 혼란의 순간은 약 15억 명의 Google Workspace 사용자 중 상당수가 한 번쯤 겪는 일입니다. Google Docs는 지구상에서 가장 인기 있는 글쓰기 도구 중 하나이지만, 자체 텍스트 음성 변환 지원은 접근성 설정 뒤에 숨겨져 있거나 대부분의 사람들이 기대하는 방식으로는 존재하지 않습니다. 다행인 점은 전문적인 수준의 오디오 출력을 제공하는 무료 텍스트 음성 변환 솔루션을 활용할 수 있는 세 가지 명확한 방법이 있다는 것입니다.
Google Docs에는 "읽어주기" 버튼이 없습니다. 대신 실제로 있는 기능은 다음과 같습니다.
이 부분에서 대부분의 사용자가 혼란을 겪습니다. 리본 메뉴에 눈에 띄는 "읽어주기" 기능이 있는 Microsoft Word와 달리, Google Docs는 음성 기능을 접근성 프레임워크 내에 숨겨두었습니다. 이는 콘텐츠 제작 도구로 설계된 것이 아니라, 스크린 리더 사용자를 위해 설계되었기 때문입니다.
이러한 차이는 중요합니다. 내장 옵션은 보조 기술 기능이 시스템 음성으로 텍스트를 읽어주는 방식 그대로 들리기 때문입니다. 블로그 포스트를 교정하거나 스크립트를 들을 수 있는 오디오로 변환하기 위해 TTS가 필요한 경우, 내장된 방식은 30초도 안 되어 한계를 느끼게 될 것입니다.
각 방법을 자세히 살펴보기 전에 세 가지 방법을 비교해 보겠습니다:
| 방법 | 비용 | 음성 품질 | 언어 | 가장 적합한 용도 |
|---|---|---|---|---|
| ChromeVox / 스크린 리더 | 무료 | 기계적인 시스템 음성 | 제한적 | 접근성, 기본적인 교정 |
| Chrome 확장 프로그램 (Read Aloud, Natural Reader) | 무료 / 월 $10-20 | 중간 수준, 제어 제한적 | 10-30개 | 가벼운 청취, 간단한 교정 |
| 전용 AI TTS (Fish Audio) | 무료 플랜 / 월 $11 | 전문가 수준, 자연스러운 운율 | 30개 이상 | 콘텐츠 제작, 성우 녹음, 다국어 지원 |
방법 1: Google 내장 스크린 리더 사용하기 (무료, 5분 소요)
이 방법은 비용이 들지 않고 설치도 필요 없습니다. 작동은 하지만 사용하기 번거롭고 콘텐츠 제작자를 위해 설계된 기능은 아닙니다.
Chrome OS 또는 Chrome 브라우저에서
- Google Docs 파일을 엽니다.
- 도구 > 접근성 설정으로 이동합니다.
- "스크린 리더 지원 사용"을 체크합니다.
- 메뉴 바에 새로운 접근성 메뉴가 나타납니다.
- 소리 내어 읽고 싶은 텍스트를 선택합니다.
- 접근성 > 말하기 > 선택 영역 말하기를 선택합니다.
Mac에서
ChromeVox 대신 macOS 내장 음성 기능을 사용할 수 있습니다:
- Google Docs에서 텍스트를 선택합니다.
- 시스템 설정 > 접근성 > 콘텐츠 말하기로 이동합니다.
- "선택 항목 말하기"를 활성화합니다.
- Google Docs에서 텍스트를 선택하고 Option + Esc(또는 직접 설정한 단축키)를 누릅니다.
Windows에서
Windows에도 유사한 접근성 경로가 있습니다:
- Windows + Ctrl + Enter를 눌러 내레이터를 활성화합니다.
- Chrome에서 Google Docs로 이동합니다.
- 내레이터가 페이지 콘텐츠를 읽어줍니다.
실제로 듣게 될 소리
단조롭고 기계적인 시스템 음성이 텍스트를 단어 단위로 읽어줍니다. 감정도, 속도 변화도 없으며 음성을 선택할 수도 없습니다. 마치 GPS가 원고 전체를 읽어주는 것처럼 들릴 것입니다.
누락된 단어를 확인하거나 단락 순서를 검증하는 용도로는 괜찮습니다. 하지만 스크립트가 대화체처럼 들리는지, 대화가 자연스럽게 흐르는지, 혹은 학생이 10분 동안 집중해서 들을 수 있을지를 판단하기에는 적합하지 않습니다.
방법 2: "재생" 버튼을 추가하는 Chrome 확장 프로그램 (무료 ~ 월 $20)
Chrome 확장 프로그램은 UI 문제를 해결해 줍니다. 눈에 보이는 재생 버튼을 추가하고 시스템 기본값보다 더 나은 음성을 제공합니다. 가장 많이 사용되는 옵션은 다음과 같습니다:
- Read Aloud: 무료이며 Google, Microsoft, Amazon 음성을 포함한 여러 TTS 엔진을 지원합니다. 인터페이스가 간단하고 브라우저 기반입니다. 선택한 엔진에 따라 품질이 다릅니다.
- Natural Reader: 기본 음성이 포함된 무료 플랜과 프리미엄 음성을 위한 월 $10-20 플랜이 있습니다. 웹 페이지 전반에서 작동하는 플로팅 툴바를 제공합니다.
- Speechify: 학생들에게 인기가 많으며 읽는 동안 텍스트를 강조 표시합니다. 무료 플랜은 제한적이며, 유료 플랜은 월 약 $12부터 시작합니다.
Read Aloud 설정 방법 (가장 인기 있는 무료 옵션)
- Chrome 웹 스토어에서 "Read Aloud"를 설치합니다.
- Google Docs 파일을 엽니다.
- 브라우저 도구 모음에서 Read Aloud 확장 프로그램 아이콘을 클릭합니다.
- 재생 버튼을 누릅니다. 확장 프로그램이 페이지에 보이는 텍스트를 읽어줍니다.
부딪히게 될 한계
확장 프로그램은 가볍게 듣기에는 편리하지만, 다음과 같은 지속적인 한계가 있습니다:
- 음성 커스텀 불가: 몇 가지 사전 설정된 음성만 제공됩니다. 속도, 감정 또는 강조를 세밀하게 조정할 수 없습니다.
- 발음 오류: 전문 용어, 고유 명사, 약어가 엉망으로 발음되는 경우가 많습니다. 사용자 정의 발음 규칙을 추가할 방법이 없습니다.
- 내보내기 불가: 대부분의 무료 확장 프로그램은 브라우저에서 텍스트를 읽어줄 뿐 오디오 파일로 내보낼 수 없습니다. 비디오, 팟캐스트 또는 강의를 위해 MP3나 WAV 파일이 필요한 경우 난감해집니다.
- 언어 품질의 급격한 저하: 영어 음성은 무난할 수 있습니다. 하지만 한국어, 아랍어 또는 포르투갈어로 전환하면 품질 차이가 확연해집니다.
- 목소리 복제 불가: 일관된 브랜드 보이스를 만들거나 여러 프로젝트에서 기존 내레이터의 목소리를 맞출 수 없습니다.
짧은 이메일 초안을 빠르게 교정하거나 듣는 용도로는 확장 프로그램이 유용합니다. 하지만 청중과 공유할 결과물을 만드는 데는 적합하지 않습니다.
방법 3: AI TTS를 통해 Google Docs를 전문적인 오디오로 변환하기
여기서부터는 워크플로우가 단순히 "문서를 듣는 것"에서 "문서로 오디오를 제작하는 것"으로 전환됩니다. Google Docs에서 글을 쓰고 실제 사람이 녹음한 것 같은 결과물이 필요한 제작자, 교육자 또는 마케터라면 전용 AI TTS 플랫폼이 정답입니다.
워크플로우는 간단합니다. Google Docs에서 텍스트를 복사하여 TTS 플랫폼에 붙여넣고, 목소리를 선택하고, 생성한 후 다운로드하면 됩니다.
왜 Fish Audio가 이 워크플로우에 가장 적합한 도구인가요?
Fish Audio의 텍스트 음성 변환 엔진은 정확히 이 사용 사례를 위해 제작되었습니다. 즉, 서면 콘텐츠를 자연스럽고 제작 가능한 수준의 오디오로 바꾸는 것입니다. 특히 Google Docs 사용자들에게 확장 프로그램보다 더 나은 이유는 다음과 같습니다.
콘텐츠에 딱 맞는 음성 선택. Fish Audio의 라이브러리에는 언어, 악센트, 톤, 사용 사례별로 태그가 지정된 2,000,000개 이상의 음성이 있습니다. 따뜻하고 대화체인 튜토리얼을 작성하시나요? 필터로 검색해 보세요. 격식 있는 기업 교육 모듈을 제작하시나요? 그에 맞는 음성도 준비되어 있습니다. 네 가지 일반적인 옵션에 갇힐 필요가 없습니다.
텍스트를 이해하는 듯한 운율. "명확한" TTS 음성과 실제로 텍스트를 이해하는 것처럼 들리는 음성의 차이는 운율(Prosody), 즉 자연스러운 말의 리듬, 강조, 억양에서 옵니다. Fish Audio의 모델은 Chrome 확장 프로그램이 따라올 수 없는 수준으로 이를 처리합니다. 질문은 질문처럼 들리고, 목록은 자연스러운 호흡으로 끊어 읽어줍니다. 괄호 안의 부연 설명은 실제 사람이 읽는 것처럼 미묘하게 낮게 처리됩니다.
품질 저하 없는 8개 국어 지원. Google Docs에서 이중 언어 수업 계획안이나 다국어 마케팅 문구를 작성하는 경우, Fish Audio는 지원되는 모든 언어에서 음성 품질을 유지합니다. 영어에서 자연스럽게 들리던 목소리가 일본어나 스페인어로 바뀐다고 해서 갑자기 기계적으로 변하지 않습니다.
10초 목소리 복제. 모든 오디오가 자신의 목소리처럼 들리기를 원하시나요? 목소리 복제(Voice cloning)에는 단 10초의 샘플만 있으면 됩니다. 짧은 녹음본을 업로드하면, 그 시점부터 오디오로 변환하는 모든 Google Docs에 여러분의 목소리 정체성이 반영됩니다.
실제로 사용할 수 있는 오디오 파일. 텍스트를 읽어주고 사라지는 브라우저 확장 프로그램과 달리, Fish Audio는 다운로드 가능한 오디오 파일을 생성합니다. 이를 YouTube 동영상, 온라인 강의 모듈, 팟캐스트 에피소드 또는 프레젠테이션에 바로 활용할 수 있습니다.
단계별 가이드: Google Docs에서 전문 오디오까지 5분 완성
- Google Docs를 열고 변환하려는 텍스트를 선택합니다 (또는 Ctrl/Cmd + A로 전체 선택).
- 텍스트를 복사합니다 (Ctrl/Cmd + C).
- fish.audio/text-to-speech로 이동하여 입력 필드에 텍스트를 붙여넣습니다.
- 라이브러리에서 목소리를 선택합니다. 필터를 사용하여 언어, 성별, 톤 또는 악센트별로 범위를 좁힙니다.
- 필요에 따라 속도, 감정, 강조 등 설정을 조정합니다.
- 생성(Generate)을 클릭하고 오디오를 미리 듣습니다.
- 파일을 MP3 또는 WAV로 다운로드합니다.
그게 전부입니다. 1,000단어 분량의 Google Docs 문서는 약 7~8분 분량의 완성된 오디오로 변환됩니다. 붙여넣기부터 다운로드까지의 전체 과정은 Chrome 확장 프로그램을 설정하는 것보다 적은 시간이 걸립니다.
비용 안내
Fish Audio는 단순한 샘플 문장이 아니라 실제 문서로 테스트해 볼 수 있을 만큼 넉넉한 무료 플랜을 제공합니다. 유료 플랜은 월 $11부터 시작하며 매월 250,000 크레딧을 제공합니다. 이는 최대 200분 분량(S1 모델 기준)의 완성된 오디오로 변환될 수 있습니다. 음성 품질이 떨어지고 오디오 내보내기도 안 되면서 월 $10-20를 청구하는 프리미엄 Chrome 확장 프로그램과 비교해 보세요. 상세 가격표는 공식 웹사이트에서 확인할 수 있습니다.
시간을 낭비하게 만드는 4가지 실수 (및 해결 방법)
올바른 도구를 사용하더라도 몇 가지 흔한 실수가 발목을 잡을 수 있습니다:
- 숨겨진 문자가 포함된 서식 있는 텍스트 붙여넣기. Google Docs에서 텍스트를 복사할 때 보이지 않는 서식이 포함될 수 있습니다. 생성된 오디오에 이상한 일시 정지나 누락된 단어가 있다면, 먼저 일반 텍스트 편집기에 붙여넣거나 단축키(Ctrl/Cmd + Shift + V)를 사용하여 서식을 제거한 후 TTS 도구에 붙여넣으세요.
- 호흡 조절을 위한 구두점 무시. TTS 엔진은 구두점을 호흡의 신호로 사용합니다. 쉼표가 없는 긴 문장은 숨 가쁘게 한 번에 읽히게 됩니다. 자연스럽게 쉴 곳에 쉼표를 찍고, 마침표를 사용하여 명확하게 끊어주세요. 이 습관 하나가 음성을 바꾸는 것보다 출력 품질을 더 크게 개선합니다.
- 톤을 정하기 전에 음성부터 선택하기. 음성 라이브러리를 무작위로 훑어보지 마세요. 먼저 이 콘텐츠가 격식 있는가, 아니면 캐주얼한가? 활기찬가, 차분한가? 교육적인가, 대화체인가? 를 결정한 후 필터를 사용하세요. 20분이 아니라 2분 만에 적합한 목소리를 찾을 수 있습니다.
- 다시 듣기 건너뛰기. 오디오를 생성한 후, Google Docs를 읽으면서 1배속으로 다시 들어보세요. 눈으로 읽을 때는 몰랐던 어색한 문구, 만연체 문장, 톤의 부조화를 발견할 수 있습니다. 이것이 TTS가 제공하는 가장 큰 가치인 교정(proofreading)의 핵심입니다.
어떤 방법을 선택해야 할까요?
가장 적합한 접근 방식은 목적에 따라 다릅니다:
- 짧은 이메일이나 메모를 빠르게 자가 교정할 때: 방법 1 (내장 스크린 리더). 무료이며 즉각적입니다.
- 다른 일을 하면서 블로그 초안을 들을 때: 방법 2 (Read Aloud 같은 Chrome 확장 프로그램). 설정 없이 편리합니다.
- 강의, 비디오 또는 팟캐스트용 오디오를 제작할 때: 방법 3 (Fish Audio). 다운로드 가능하고 전문적인 품질의 오디오를 제공하는 유일한 옵션입니다.
- 다국어 문서를 변환할 때: 방법 3. 확장 프로그램은 언어 간 품질을 유지하지 못합니다.
- 콘텐츠 전반에 걸쳐 일관된 브랜드 보이스를 구축할 때: 방법 3에서 Fish Audio 목소리 복제 활용. 자신의 목소리를 한 번만 복제하면 어디든 사용할 수 있습니다.
결론
Google Docs는 여전히 대부분의 콘텐츠가 시작되는 곳이지만, 오디오 제작을 위해 만들어지지는 않았습니다. 내장된 스크린 리더와 Chrome 확장 프로그램은 가볍게 듣는 용도로는 괜찮지만, 전문가 수준의 오디오가 필요하거나, 다국어 지원이 필요하거나, 실제 파일로 저장하여 활용해야 하는 순간 한계에 부딪히게 됩니다.
2026년 현재 가장 깔끔한 워크플로우는 여전히 가장 단순한 방식입니다. Google Docs에서 글을 쓰고, Fish Audio로 변환하는 것입니다. 이미 익숙한 글쓰기 도구와 여러분의 텍스트를 제대로 들려줄 수 있는 TTS 엔진을 결합해 보세요. 지금 작업 중인 텍스트를 복사해 무료 플랜으로 시작해 보시기 바랍니다.
