Um Guia Completo para Conversão de Texto em Fala no Mac: Configurações, Uso e Métodos de Desativação

28 de fev. de 2026

Um Guia Completo para Conversão de Texto em Fala no Mac: Configurações, Uso e Métodos de Desativação

Você terminou um roteiro de podcast de 2.000 palavras no Pages, apertou o atalho Falar Seleção e ouviu uma voz que parecia ter sido gravada dentro de um micro-ondas em 2009. Você mergulhou nos Ajustes do Sistema, encontrou seis menus diferentes que mencionam "fala" ou "conteúdo falado", mudou três coisas e, de alguma forma, piorou a situação. Agora seu Mac anuncia todas as notificações em voz alta e você não consegue descobrir como desligar isso.

O macOS tem conversão de texto em fala integrada desde o início dos anos 2000. A Apple aprimorou o recurso significativamente nos últimos anos, mas as configurações estão espalhadas por vários painéis, o comportamento muda entre as versões do macOS e a lacuna entre o que as vozes integradas podem fazer e o que os criadores de conteúdo realmente precisam continua grande. A boa notícia: depois que você sabe onde tudo fica, a configuração leva cerca de 5 minutos. E quando você superar as opções integradas, o caminho de atualização é mais simples do que a maioria das pessoas espera.

O macOS possui 3 sistemas de TTS separados. A maioria das pessoas encontra apenas 1.

Esta é a parte que causa mais confusão. A Apple não tem um botão único de "texto para fala". Ela possui três sistemas distintos que se sobrepõem, cada um controlado de um lugar diferente:

SistemaO que fazOnde encontrarUso principal
Conteúdo FaladoLê o texto selecionado ou a tela inteira em voz altaAjustes do Sistema > Acessibilidade > Conteúdo FaladoLeitura de artigos, revisão e acessibilidade
VoiceOverLeitor de tela completo para usuários com deficiência visualAjustes do Sistema > Acessibilidade > VoiceOverNavegação, acessibilidade
Voz da SiriAlimenta as respostas da Siri e o feedback de ditadoAjustes do Sistema > SiriRespostas da assistente virtual

A maioria das pessoas que pesquisa "texto para fala no Mac" quer o Conteúdo Falado. Esse é o recurso que lê o texto selecionado em qualquer aplicativo usando um atalho de teclado. O VoiceOver é uma ferramenta de acessibilidade completa que narra tudo na tela, incluindo botões, menus e títulos de janelas. Ligar o VoiceOver quando você só quer a leitura de um texto é como chamar um caminhão de bombeiros para acender uma vela.

Configurando o Conteúdo Falado: O Guia de 5 Minutos

Para macOS Sonoma (14) e posteriores

  1. Abra os Ajustes do Sistema (clique no menu Apple > Ajustes do Sistema)
  2. Clique em Acessibilidade na barra lateral
  3. Clique em Conteúdo Falado
  4. Ative a opção Falar Seleção
  5. Escolha sua voz preferida clicando no menu suspenso ao lado de "Voz do Sistema"
  6. Ajuste o controle deslizante de velocidade da fala conforme sua preferência
  7. Opcionalmente, ative Falar item sob o cursor se desejar a funcionalidade de ler ao passar o mouse

Para macOS Ventura (13) e anteriores

O caminho é ligeiramente diferente em versões mais antigas:

  1. Abra as Preferências do Sistema (não Ajustes do Sistema)
  2. Clique em Acessibilidade
  3. Clique em Conteúdo Falado na barra lateral esquerda
  4. Marque Falar Seleção
  5. Clique no menu suspenso Voz do Sistema para escolher uma voz
  6. Ajuste a velocidade da fala

O atalho de teclado

Assim que o Conteúdo Falado estiver ativado, selecione qualquer texto em qualquer aplicativo e pressione Option + Esc para ouvi-lo em voz alta. Você pode personalizar este atalho:

  1. Nas configurações de Conteúdo Falado, clique em Opções ao lado de Falar Seleção
  2. Defina sua combinação de teclas preferida
  3. Ative ou desative o controlador na tela (um pequeno painel flutuante com controles de reproduzir/pausar/pular)

Vale a pena ativar esse controlador na tela. Ele permite pausar, retomar, avançar e ajustar a velocidade sem precisar voltar aos Ajustes do Sistema todas as vezes.

Escolhendo a Voz Certa (A Apple tem mais do que você imagina)

A maioria dos usuários de Mac só ouviu a "Samantha" ou a voz padrão da Siri. A Apple oferece, na verdade, dezenas de vozes em vários idiomas, e a diferença de qualidade entre as vozes básicas e os downloads premium é significativa.

Como baixar vozes premium

  1. Vá em Ajustes do Sistema > Acessibilidade > Conteúdo Falado
  2. Clique no menu suspenso Voz do Sistema
  3. Clique em Gerenciar Vozes
  4. Navegue por idioma. As vozes premium são marcadas com um ícone de download.
  5. Clique na seta de download ao lado de qualquer voz. Os arquivos variam de 150 MB a 900 MB, dependendo do nível de qualidade.

Níveis de qualidade de voz

A Apple categoriza suas vozes em vários níveis de qualidade:

  • Vozes compactas: Tamanho de arquivo pequeno, qualidade robótica. Boas para anúncios rápidos do sistema. Não utilizáveis para ouvir nada mais longo que um parágrafo.
  • Vozes padrão: Qualidade intermediária. Decentes para revisar documentos curtos. Você notará um ritmo não natural em passagens mais longas.
  • Vozes Premium/Aprimoradas: Os maiores downloads, mas visivelmente mais naturais. Elas usam síntese de rede neural e soam mais próximas de uma pessoa real. "Zoe (Premium)", "Evan (Premium)" e várias outras entram nesta categoria.

Mesmo as vozes premium, no entanto, têm um limite. Elas soam bem por 2 a 3 minutos. Depois disso, a prosódia fica plana, a variação emocional desaparece e a voz se estabiliza em um ritmo monótono que é difícil de ouvir por períodos prolongados. Isso não é um erro. É uma limitação do tamanho do modelo no dispositivo que a Apple consegue distribuir de forma prática.

Usando Texto para Fala em Apps do Mac

Uma vez que o Conteúdo Falado está ativo, o atalho Option + Esc funciona em quase todos os aplicativos do Mac. Veja como ele se comporta nos mais comuns:

Pages e TextEdit: Selecione o texto, pressione o atalho. Funciona de forma confiável. A voz lê a passagem selecionada e para.

Safari e Chrome: Selecione o texto em qualquer página da web e pressione o atalho. Útil para ouvir artigos enquanto faz outra coisa. O Safari também possui um Modo Leitura separado que remove a formatação da página antes da leitura, o que às vezes melhora o ritmo.

Preview (PDFs): Selecione o texto em um PDF e pressione o atalho. A qualidade depende se o PDF possui texto selecionável. Documentos digitalizados sem OCR não funcionarão.

Mail: Selecione o corpo de um e-mail, pressione o atalho. Prático para e-mails longos que você prefere ouvir a ler.

Terminal: Sim, você também pode acionar o TTS a partir da linha de comando. Execute say "Seu texto aqui" e o macOS o lerá em voz alta usando a voz do sistema. Para textos mais longos: say -f /caminho/para/arquivo.txt. Você pode até exportar para áudio: say -f roteiro.txt -o saida.aiff. Esse último comando é o mais próximo que o macOS chega de um recurso nativo de exportação de áudio.

O truque do Terminal que a maioria das pessoas não conhece

O comando say aceita uma flag -v para especificar qualquer voz instalada:

say -v "Zoe (Premium)" "Este é um teste da voz premium."

say -v "?"

Esse segundo comando lista todas as vozes instaladas no seu sistema. É a maneira mais rápida de testar vozes sem precisar clicar nos Ajustes do Sistema.

Como Desativar o Texto para Fala (Quando ele não para de falar)

Esta seção existe porque um número surpreendente de usuários de Mac ativa acidentalmente o VoiceOver ou o Conteúdo Falado e não consegue descobrir como silenciá-lo. Se o seu Mac está narrando tudo na tela agora, aqui está a solução mais rápida:

Se o VoiceOver estiver rodando (Mac narrando cada clique e botão)

Pressione Cmd + F5 imediatamente. Isso desativa o VoiceOver. Em MacBooks com Touch Bar ou modelos mais novos, você também pode pressionar três vezes o botão Touch ID.

Se o Falar Seleção não parar no meio da leitura

Pressione Option + Esc novamente para interromper a leitura atual. Se isso não funcionar, clique em qualquer lugar fora do texto selecionado.

Se o seu Mac fala notificações ou alertas

  1. Vá em Ajustes do Sistema > Acessibilidade > Conteúdo Falado
  2. Desative Falar anúncios
  3. Aproveite para verificar se Falar item sob o cursor também está desativado, se não desejar a leitura ao passar o mouse

Checklist para desativação completa

Para silenciar completamente todo o TTS no seu Mac:

  • Conteúdo Falado: Ajustes do Sistema > Acessibilidade > Conteúdo Falado > Desative tudo
  • VoiceOver: Ajustes do Sistema > Acessibilidade > VoiceOver > Desative (ou pressione Cmd + F5)
  • Feedback de voz da Siri: Ajustes do Sistema > Siri > Feedback de Voz > Desativado
  • Alertas sonoros: Ajustes do Sistema > Som > Desmarque "Reproduzir som na inicialização" e ajuste o volume de alerta

Depois de seguir esta lista, seu Mac permanecerá em silêncio, a menos que você acione explicitamente a fala novamente.

Onde o TTS do macOS atinge seu limite (e o que fazer a seguir)

As vozes integradas da Apple são boas o suficiente para duas coisas: revisão rápida de documentos curtos e acessibilidade. Para qualquer coisa além disso, você encontrará limitações severas:

  • Sem personalização de voz: Você não pode ajustar a emoção, ênfase ou ritmo além de um único controle deslizante de velocidade. A voz lê uma piada e uma tragédia com a mesma entonação.
  • Seleção limitada de vozes: Mesmo com todas as vozes premium baixadas, você está escolhendo entre talvez 15 a 20 opções em inglês. Se precisar de um tom, sotaque ou personalidade específica para produção de conteúdo, a biblioteca é muito pequena.
  • Sem clonagem de voz: Não há como criar uma voz que soe como você ou que corresponda a uma voz de marca específica.
  • Exportação de áudio primitiva: O comando say exporta para AIFF, mas não há uma maneira integrada de gerar MP3, WAV ou áudio pronto para podcast com normalização adequada.
  • A qualidade multilíngue cai rápido: As vozes premium da Apple são fortes em inglês. Mude para tailandês, árabe ou português e você voltará à qualidade robótica.
  • Sem consistência em textos longos: A prosódia se perde após 2 a 3 minutos, tornando a audição prolongada cansativa. Um roteiro de 20 minutos soará visivelmente pior no minuto 18 do que no minuto 1.

Essas limitações não importam se você estiver usando o TTS para encontrar erros de digitação em um e-mail. Elas importam muito se você estiver produzindo um vídeo para o YouTube, narrando um curso ou convertendo conteúdo escrito em áudio que um público realmente ouvirá.

Da Revisão no Mac para a Produção de Áudio Profissional

Quando suas necessidades superam as vozes integradas, a mudança no fluxo de trabalho é direta: continue escrevendo no seu Mac, mas gere o áudio por meio de uma plataforma de IA dedicada.

Fish Audio preenche exatamente as lacunas que o macOS deixa abertas. Veja o que muda quando você faz a troca:

Mais de 2.000.000 de vozes em vez de 20. A biblioteca de vozes do Fish Audio é categorizada por idioma, sotaque, tom e caso de uso. Precisa de uma voz de inglês americano calorosa e conversacional para um tutorial? Filtre por ela. Precisa de um narrador japonês nítido para um vídeo de produto localizado? Está lá. A seleção é cerca de 100.000 vezes maior do que a que a Apple oferece.

Prosódia que se mantém em roteiros longos. A arquitetura do modelo do Fish Audio lida com variações emocionais e ritmo em conteúdos extensos. Uma narração de 15 minutos mantém seu caráter do início ao fim, sem a deriva monótona que ocorre após 2 a 3 minutos com as vozes do macOS. Perguntas soam como perguntas. A ênfase cai onde deveria.

Clonagem de voz em 15 segundos. Quer que cada peça de áudio soe como você? Envie uma amostra de 15 segundos e o Fish Audio cria um clone que carrega sua identidade vocal em qualquer texto que você gerar. A Apple não oferece nada comparável.

Mais de 13 idiomas sem perda de qualidade. O Fish Audio mantém a pronúncia de nível nativo em todo o seu conjunto de idiomas. Uma voz que soa natural em inglês permanece natural em espanhol, mandarim, japonês e árabe. Sem quedas repentinas de qualidade ao trocar de idioma.

Arquivos de áudio prontos para produção. Gere e baixe arquivos MP3 ou WAV prontos para YouTube, hospedagem de podcast, plataformas de cursos ou qualquer outro canal de distribuição. Sem gambiarras no Terminal, sem cadeias de conversão de AIFF para MP3.

O fluxo de trabalho do criador no Mac

  1. Escreva seu roteiro no Pages, Google Docs ou qualquer editor de texto do Mac
  2. Revisão rápida usando o Conteúdo Falado do macOS (Option + Esc) para detectar frases estranhas
  3. Copie o texto finalizado e cole-o em fish.audio/text-to-speech
  4. Escolha uma voz da biblioteca (ou use sua voz clonada)
  5. Ajuste a emoção e o ritmo para combinar com seu conteúdo
  6. Gere e baixe o arquivo de áudio
  7. Arraste para o seu projeto: Final Cut Pro, Logic Pro, GarageBand, seu editor de podcast, o que quer que você use

Esse fluxo de trabalho mantém o TTS do macOS em seu ponto ideal (revisão gratuita e instantânea) e usa o Fish Audio para a parte que realmente precisa de um som profissional.

Quanto custa

O Fish Audio oferece um plano gratuito generoso o suficiente para testar com roteiros reais. Planos pagos começam em $11 por mês para 250.000 créditos, até 200 minutos (~3h 20m) de geração S1, ou até 400 minutos (~6h 40m) de geração v1.5 ou v1.6. Para perspectiva, o TTS do macOS é gratuito, mas não pode exportar arquivos de áudio utilizáveis. Um dublador humano para 15 horas de conteúdo gravado custaria entre $3.000 e $15.000. O detalhamento completo de preços está aqui. fish-logo

Conclusão

O macOS tem um sistema de conversão de texto em fala (TTS) capaz, escondido atrás de painéis de configurações espalhados. Depois que você entende que o Conteúdo Falado é o recurso que você realmente quer, que Option + Esc é o atalho e que existem downloads de vozes premium, a configuração integrada de texto para fala do Mac lida bem com revisões rápidas e audições casuais. E se o VoiceOver começar a narrar acidentalmente sua tela inteira, Cmd + F5 é seu botão de pânico.

Mas as vozes integradas foram projetadas para acessibilidade e feedback do sistema, não para produção de conteúdo. No momento em que você precisa de um áudio que o público ouvirá por mais de 2 minutos, vozes que combinem com sua marca ou saída multilíngue que não soe como um motor de tradução, você superou o que a Apple oferece. Escreva no seu Mac, revise com o Conteúdo Falado e produza com o Fish Audio. A ferramenta de escrita que você já possui, combinada com um motor de texto para fala feito para o áudio que seu público realmente ouve.

Perguntas Frequentes

Ative o 'Conteúdo Falado' em Ajustes do Sistema > Acessibilidade. Uma vez ativado, selecione o texto e pressione Option + Esc.
Se o seu Mac estiver narrando botões e janelas, pressione Cmd + F5 para desativar o VoiceOver instantaneamente.
Sim, em Ajustes do Sistema > Acessibilidade > Conteúdo Falado, clique no menu de vozes e selecione 'Gerenciar Vozes' para baixar as versões 'Premium' ou 'Aprimoradas'.

Crie vozes que parecem reais

Comece a gerar áudio da mais alta qualidade hoje.

Já tem uma conta? Entrar

Compartilhar este artigo


Kyle Cui

Kyle CuiX

Kyle is a Founding Engineer at Fish Audio and UC Berkeley Computer Scientist and Physicist. He builds scalable voice systems and grew Fish into the #1 global AI text-to-speech platform. Outside of startups, he has climbed 1345 trees so far around the Bay Area. Find his irresistibly clouty thoughts on X at @kile_sway.

Leia mais de Kyle Cui >

Artigos Recentes

Ver tudo >