Windows, Mac, iPhone, Android, Chromebook에서 텍스트 음성 변환(TTS)을 켜는 방법

2026년 3월 5일

가이드

Windows, Mac, iPhone, Android, Chromebook에서 텍스트 음성 변환(TTS)을 켜는 방법

모든 주요 운영 체제에는 수년 전부터 텍스트 음성 변환(TTS) 기능이 내장되어 제공되고 있습니다. Windows, macOS, 그리고 스마트폰에도 이 기능이 있습니다. 하지만 접근성 사용 실태 조사에 따르면, 실제 이 기능을 켜서 사용하는 사용자는 12% 미만입니다. 이는 사용자가 기능을 원하지 않아서가 아니라, 대부분의 사람들이 한 번도 열어보지 않을 메뉴 깊숙이 설정이 숨겨져 있기 때문입니다.

이 기능을 사용하면 이메일, 기사, 문서, 웹 페이지 전체를 소리 내어 읽을 수 있습니다. 어떤 기기에서든 기능을 켜는 데 1분도 걸리지 않습니다. 다만, 듣기에 거부감이 없는 목소리를 선택하려면 약간의 고민이 필요합니다.

Windows 10 및 11

Windows는 두 가지 별도의 TTS 기능을 제공합니다. '내레이터'는 화면의 모든 내용을 읽어주는 전체 화면 읽기 도구이며, '소리 내어 읽기'는 특정 Microsoft 앱에 내장된 가벼운 도구입니다.

내레이터 활성화하기

내레이터는 버튼, 메뉴, 알림, 본문 텍스트 등 모든 인터페이스 요소를 읽어줍니다. 활성화 방법은 다음과 같습니다.

Win + Ctrl + Enter를 눌러 즉시 활성화
또는 설정 > 접근성 > 내레이터(Windows 11) 또는 설정 > 접근성 > 내레이터(Windows 10)에서 토글 스위치를 켭니다.

내레이터가 활성화되면 즉시 음성이 나옵니다. 바로 조정하면 좋은 몇 가지 설정은 다음과 같습니다.

음성 선택: 내레이터 설정에서 "음성 선택"을 클릭하여 설치된 옵션 간에 전환할 수 있습니다. Microsoft David와 Microsoft Zira가 기본값입니다. 동일한 메뉴에서 추가 음성을 다운로드할 수 있습니다.
속도 및 피치: 음성 속도 슬라이더를 조정합니다. 기본값은 보통 편안하게 듣기에는 너무 느립니다. 60~70% 정도로 시작하여 미세 조정해 보세요.
자세히 표시 수준: 내레이터는 모든 UI 세부 정보를 알리거나 필수적인 내용만 알릴 수 있습니다. "자세히 표시 수준"에서 레벨을 3 또는 4로 낮추면 모든 요소 뒤에 "버튼", "확인란"과 같이 반복되는 안내를 줄일 수 있습니다.

Edge 및 Word에서 소리 내어 읽기 사용하기

전체 인터페이스를 읽어주는 대신 특정 콘텐츠만 읽으려는 경우, Microsoft Edge와 Word에 내장된 '소리 내어 읽기' 기능을 사용하면 내레이터보다 더 자연스러운 음성을 들을 수 있습니다.

Edge에서: 웹 페이지를 열고 Ctrl + Shift + U를 누르거나, 오른쪽 상단의 점 세 개 메뉴를 클릭하고 "소리 내어 읽기"를 선택합니다. 상단에 음성 및 속도 제어 기능이 있는 재생 바가 나타납니다.
Word에서: 검토 > 소리 내어 읽기로 이동합니다. 커서 위치부터 문서를 읽어줍니다.

소리 내어 읽기는 인터넷에 연결되어 있을 때 Microsoft의 온라인 신경망 음성을 사용하며, 이는 내레이터의 오프라인 음성보다 훨씬 자연스럽게 들립니다.

macOS

macOS는 TTS를 두 가지 단계로 나눕니다. '말하기 콘텐츠'는 필요할 때 텍스트를 읽어주며, 'VoiceOver'는 음성으로 전체 인터페이스를 탐색하기 위한 전체 화면 읽기 도구입니다.

말하기 콘텐츠 활성화하기

대부분의 Mac 사용자가 원하는 옵션입니다. Mac의 작동 방식을 변경하지 않고 강조 표시된 텍스트나 전체 화면을 읽어줍니다.

시스템 설정 > 접근성 > 말하기 콘텐츠를 엽니다.
선택 항목 말하기를 켜면 키보드 단축키로 강조 표시된 텍스트를 읽을 수 있습니다.
화면 말하기를 켜면 현재 화면에 보이는 모든 내용을 읽을 수 있습니다.

'선택 항목 말하기'를 활성화한 후, 텍스트를 강조 표시하고 Option + Esc를 누르면 소리 내어 읽어줍니다. 재생, 일시 정지, 속도 조절이 가능한 작은 컨트롤러가 나타납니다.

설정할 가치가 있는 항목:

시스템 음성: 드롭다운을 클릭하여 사용 가능한 음성을 탐색합니다. "Siri 음성"이라고 표시된 옵션은 Alex나 Samantha와 같은 기존 음성보다 훨씬 자연스럽습니다.
말하기 속도: 기본값은 다소 느린 편입니다. 음성이 느릿하지 않고 대화하듯 들릴 때까지 슬라이더를 올리세요.
컨트롤러 표시: 음성 재생 시 항상 재생 오버레이가 표시되도록 설정합니다.

VoiceOver 활성화하기

VoiceOver는 macOS의 전체 화면 읽기 도구입니다. 모든 인터페이스 요소를 알리고 탐색 방식을 변경합니다. 접근성을 위해 꼭 필요한 경우가 아니라면 대부분의 사용자에게는 권장되지 않습니다.

Cmd + F5를 눌러 VoiceOver를 켜거나 끕니다.
또는 시스템 설정 > 접근성 > VoiceOver로 이동하여 토글을 켭니다.

VoiceOver는 학습 과정이 필요합니다. 활성화되면 마우스 클릭 대신 키보드 단축키로 탐색하며, 시스템이 포커스된 각 요소를 읽어줍니다. Apple은 VoiceOver 설정 패널에서 내장 튜토리얼을 제공합니다.

iPhone 및 iPad

iOS는 강조 표시된 한 문장을 읽는 것부터 화면 전체를 읽어주는 것까지 다양한 TTS 옵션을 제공합니다.

선택 항목 말하기 및 화면 말하기 활성화하기

이 두 기능은 기기 사용 방식을 바꾸지 않고도 대부분의 사용 사례를 충족합니다.

설정 > 접근성 > 말하기 콘텐츠로 이동합니다.
선택 항목 말하기 켜기: 텍스트 선택 메뉴에 "말하기" 버튼이 추가됩니다. 텍스트를 강조 표시하고 "말하기"를 탭하면 기기가 이를 읽어줍니다.
화면 말하기 켜기: 화면 상단에서 두 손가락으로 아래로 쓸어내리면 전체 페이지를 읽어줍니다. 속도, 건너뛰기, 일시 정지 조절이 가능한 재생 컨트롤러가 나타납니다.

동일한 메뉴의 추가 옵션:

콘텐츠 강조 표시: 이 기능을 켜면 단어나 문장이 읽히는 동안 실시간으로 강조 표시됩니다.
음성: 해당 언어의 향상된 음성 또는 프리미엄 음성 팩을 다운로드하려면 탭하세요. 프리미엄 음성은 용량이 크지만 음질이 훨씬 좋습니다.
말하기 속도: 슬라이더로 조절 가능합니다. 미리 보기 문장보다는 실제 콘텐츠 문단으로 테스트해 보세요.

VoiceOver 활성화하기

iOS의 VoiceOver는 터치 제스처를 변경하는 전체 화면 읽기 도구입니다. 한 번 탭하면 항목이 선택되고 읽어주며, 두 번 탭하면 활성화됩니다.

설정 > 접근성 > VoiceOver로 이동하여 켭니다.
또는 "Siri야, VoiceOver 켜줘"라고 말합니다.
또는 설정 > 접근성 > 접근성 단축키에서 설정한 경우 측면 버튼을 세 번 클릭합니다.

VoiceOver는 탭과 스와이프 방식을 변경하므로 예상치 못하게 켜지면 당황스러울 수 있습니다. 이러한 제스처 변경은 시각적 단서 대신 오디오로 탐색하는 사용자를 위해 의도적으로 설계된 것입니다.

Android

Android의 TTS 기능에는 전체 화면을 읽어주는 TalkBack, 필요할 때 읽어주는 '선택하여 읽어주기', 그리고 다른 앱에서 호출할 수 있는 시스템 레벨의 TTS 엔진이 포함됩니다.

선택하여 읽어주기 활성화하기

대부분의 사용자에게 가장 적합한 시작점입니다. 기기 탐색 방식을 바꾸지 않고 탭하거나 선택한 항목을 읽어줍니다.

설정 > 접근성 > 선택하여 읽어주기로 이동합니다.
기능을 켭니다.
화면에 작은 오버레이 아이콘이 나타납니다. 이를 탭한 후 읽고 싶은 텍스트를 탭하거나 드래그하세요.

Samsung 기기에서는 설정 > 접근성 > 설치된 앱 > 선택하여 읽어주기 경로에 있을 수 있습니다.

TalkBack 활성화하기

TalkBack은 Android의 VoiceOver와 같은 기능입니다. 모든 요소를 설명하고 터치 동작을 '선택 후 활성화' 모델로 변경합니다.

설정 > 접근성 > TalkBack으로 이동하여 켭니다.
또는 Android 9 이상에서 두 볼륨 버튼을 3초 동안 길게 눌러 TalkBack을 켭니다.

제스처 변경 사항은 다음과 같습니다.

한 번 탭: 항목을 선택하고 읽어줌
두 번 탭: 활성화
두 손가락 스와이프: 페이지 스크롤
한 손가락으로 오른쪽/왼쪽 스와이프: 다음 또는 이전 요소로 이동

TTS 엔진 구성하기

Android에서는 시스템 전체의 모든 음성 출력을 담당할 TTS 엔진을 선택할 수 있습니다.

설정 > 접근성 > 텍스트 음성 변환 출력으로 이동합니다. (Samsung 기기: 설정 > 일반 관리 > 언어 및 입력 방식 > 텍스트 음성 변환)
기본 엔진을 선택합니다. Google TTS 엔진은 대부분의 기기에 사전 설치되어 있습니다. Samsung은 자체 대안 엔진을 제공합니다.
엔진 옆의 톱니바퀴 아이콘을 탭하여 추가 언어 팩을 다운로드합니다.
"말하기 속도" 및 "음조" 슬라이더를 사용하여 음성을 사용자 지정합니다.

Chromebook

ChromeOS는 TTS 옵션을 한곳에 모아두어 다른 플랫폼보다 설정이 간편합니다.

선택하여 읽어주기 활성화하기

설정 > 접근성 > 텍스트 음성 변환으로 이동합니다.
선택하여 읽어주기를 켭니다.
시스템 트레이의 '선택하여 읽어주기' 아이콘을 클릭한 후, 화면의 텍스트를 드래그하여 읽습니다.

ChromeVox 활성화하기

ChromeVox는 ChromeOS의 전체 화면 읽기 도구입니다.

Ctrl + Alt + Z를 눌러 ChromeVox를 켜거나 끕니다.
또는 설정 > 접근성 > 텍스트 음성 변환 > ChromeVox에서 활성화합니다.

ChromeVox는 활성화되는 즉시 설명을 시작합니다. Android와 마찬가지로 Google TTS 엔진을 사용하며 동일한 언어 팩과 음성 옵션을 지원합니다.

내장 음성의 장점과 한계

이제 TTS를 켰습니다. 약 30초 정도 듣다 보면 어떤 패턴을 발견하게 될 것입니다.

내장 음성은 짧고 단순한 문장을 잘 처리합니다. 일반적인 단어를 정확하게 발음하고, 마침표에서 멈추며, 일정한 속도를 유지합니다. 알림이나 짧은 문자 메시지를 읽는 데는 충분합니다.

하지만 긴 콘텐츠에서는 한계가 드러납니다. 내장 음성으로 긴 기사 전체를 들어보면서 다음 징후가 있는지 확인해 보세요.

단조로운 강조: 모든 문장이 똑같이 들립니다. 중요한 단어에 강조가 없고, 의문문에서도 사람의 목소리처럼 끝이 올라가지 않습니다.
어색한 문장 부호 처리: 세미콜론, 콜론, 괄호가 포함된 문구에서 대부분의 엔진이 혼란을 겪습니다. 이를 무시하거나 이상할 정도로 길게 멈춥니다.
발음 오류: 전문 용어, 브랜드 이름, 외래어가 뭉개지는 경우가 많습니다. 한 번 잘못 발음하면 해당 단어가 나올 때마다 똑같은 오류를 반복합니다.
청취 피로도: 2~3분이 지나면 단조로운 음질 때문에 정신적으로 피로해집니다. 이는 사람들이 TTS를 켰다가 금방 다시 끄게 되는 주요 원인입니다.

이것은 버그가 아닙니다. 내장 TTS 엔진은 작은 파일 크기, 오프라인 사용, 보편적 호환성에 최적화되어 있기 때문입니다. 음질은 그 대가로 타협된 부분입니다.

AI 텍스트 음성 변환이 바꾸는 판도

기사를 듣거나, 귀로 교정하거나, 보이스오버를 제작하기 위해 TTS를 켰는데 내장 음성 때문에 실망했다면, 문제는 TTS 기능 자체가 아니라 엔진에 있습니다.

Fish Audio와 같은 AI 음성 플랫폼은 인간의 말소리를 학습한 신경망 모델을 사용합니다. 단순히 음절 조각을 이어 붙이는 대신, 이 모델들은 오디오를 처음부터 생성하여 말소리를 생생하게 만드는 리듬, 강조, 톤의 변화를 포착합니다. 첫 문장만 들어봐도 그 차이가 명확합니다. Fish Audio의 텍스트 음성 변환이 기기 기본 TTS보다 뛰어난 점은 다음과 같습니다.

스타일 제어: 기쁨, 슬픔부터 분노, 평온함까지 거의 모든 표현 요구 사항을 충족하는 업계 최고 수준의 64가지 이상의 감정 및 스타일 제어 기능을 제공합니다.
자연스러운 운율: 엔진이 중요한 단어를 강조하고, 연결을 부드럽게 하며, 문장 구조에 따라 속도를 조절합니다. 질문은 질문처럼, 목록은 목록처럼 들립니다. 내장 TTS는 모든 것을 동일한 가중치로 읽습니다.
13개 언어 및 교차 언어 지원: 영어, 중국어, 스페인어, 일본어 등을 전환하여 사용할 수 있으며, 심지어 한 문단 내에서도 발음이 깨지지 않고 부드럽게 이어집니다.
브라우저 기반 워크플로우: 소프트웨어를 설치할 필요가 없습니다. fish.audio/text-to-speech로 이동하여 텍스트를 붙여넣고 음성을 선택한 다음 다운로드 가능한 오디오를 생성하기만 하면 됩니다.

일관된 콘텐츠를 위한 보이스 클로닝

여러 프로젝트에서 동일한 목소리가 필요한 제작자를 위해, Fish Audio의 보이스 클로닝(Voice Cloning)은 단 10초의 참조 오디오만으로 맞춤형 모델을 생성합니다. 모델은 화자의 톤, 리듬, 음성 질감을 학습하여 새로운 텍스트에 이러한 특성을 적용합니다.

실제 활용 사례는 다음과 같습니다.

YouTube 및 팟캐스트 제작: 모든 대본을 직접 녹음할 필요 없이 일관된 목소리로 내레이션을 생성합니다.
다국어 콘텐츠: 클로닝된 목소리는 다른 언어로 음성을 생성할 때도 고유의 캐릭터를 유지합니다.
브랜드 보이스 일관성: 광고, 튜토리얼, 고객 커뮤니케이션 전반에 걸쳐 매번 스튜디오 녹음을 예약하지 않고도 동일한 목소리를 사용합니다.

개발자를 위한 API 액세스

Fish Audio의 API는 프로그래밍 방식의 사용을 위해 전체 TTS 및 보이스 클로닝 엔진을 제공합니다. 스트리밍 지원을 통해 밀리초 단위의 응답 시간을 제공하므로, 실시간 음성 애플리케이션에서 버퍼링이 필요하지 않습니다.

가격 및 플랜 세부 정보는 fish.audio/plan에서 확인할 수 있습니다. 테스트를 위한 무료 등급도 제공됩니다.

결론

어떤 플랫폼에서든 텍스트 음성 변환을 켜는 데는 1분도 걸리지 않습니다. Windows에서는 Win + Ctrl + Enter, Mac에서는 Option + Esc, iPhone에서는 두 손가락 스와이프, Android에서는 '선택하여 읽어주기', Chromebook에서는 Ctrl + Alt + Z입니다. 이 기능은 이미 여러분의 기기에서 준비된 채 기다리고 있습니다.

더 중요한 질문은 그 기능을 계속 켜두고 싶을 것인가입니다. 내장 음성은 빠른 읽기나 기본적인 접근성 용도로는 적합하지만, 장시간 청취나 콘텐츠 제작용으로 설계되지는 않았습니다. 만약 내장 음성 때문에 2분 만에 기능을 끄고 싶어진다면, 완전히 포기하기 전에 Fish Audio의 TTS를 사용해 보세요. 사전 설치된 엔진과 현대적인 AI 음성의 차이는 말소리를 참아내며 듣는 것과 실제로 독서보다 듣는 것을 선호하게 되는 것의 차이입니다.

실감 나는 목소리를 만들어보세요

오늘부터 최고 품질의 오디오를 생성하세요.

무료로 가입하기

이미 계정이 있으신가요? 로그인

이 글 공유하기

Kyle Cui

Kyle is a Founding Engineer at Fish Audio and UC Berkeley Computer Scientist and Physicist. He builds scalable voice systems and grew Fish into the #1 global AI text-to-speech platform. Outside of startups, he has climbed 1345 trees so far around the Bay Area. Find his irresistibly clouty thoughts on X at @kile_sway.

Kyle Cui의 더 많은 글 보기 >

Windows, Mac, iPhone, Android, Chromebook에서 텍스트 음성 변환(TTS)을 켜는 방법

Windows 10 및 11

내레이터 활성화하기

Edge 및 Word에서 소리 내어 읽기 사용하기

macOS

말하기 콘텐츠 활성화하기

VoiceOver 활성화하기

iPhone 및 iPad

선택 항목 말하기 및 화면 말하기 활성화하기

VoiceOver 활성화하기

Android

선택하여 읽어주기 활성화하기

TalkBack 활성화하기

TTS 엔진 구성하기

Chromebook

선택하여 읽어주기 활성화하기

ChromeVox 활성화하기

내장 음성의 장점과 한계

AI 텍스트 음성 변환이 바꾸는 판도

일관된 콘텐츠를 위한 보이스 클로닝

개발자를 위한 API 액세스

결론

실감 나는 목소리를 만들어보세요

최근 글

우리가 말하는 오픈 소스의 의미와 S2에 이것이 중요한 이유

Fish Audio S2! 단어 수준의 세밀한 AI 음성 제어

Fish Audio, S2 오픈 소스 공개: 미세 제어와 프로덕션 스트리밍의 결합

우리가 말하는 오픈 소스의 의미와 S2에 이것이 중요한 이유

Fish Audio S2! 단어 수준의 세밀한 AI 음성 제어

Fish Audio, S2 오픈 소스 공개: 미세 제어와 프로덕션 스트리밍의 결합