Guía completa de texto a voz en Mac: ajustes, uso y métodos de desactivación
28 feb 2026
Terminaste un guion de podcast de 2.000 palabras en Pages, pulsaste el atajo Leer selección y escuchaste una voz que sonaba como si hubiera sido grabada dentro de un microondas en 2009. Investigaste en Ajustes del Sistema, encontraste seis menús diferentes que mencionan "voz" o "contenido leído", cambiaste tres cosas y, de alguna manera, lo empeoraste. Ahora tu Mac anuncia cada notificación en voz alta y no sabes cómo apagarlo.
macOS ha tenido texto a voz (TTS) integrado desde principios de la década de 2000. Apple lo ha mejorado significativamente en los últimos años, pero los ajustes están dispersos en múltiples paneles, el comportamiento cambia entre versiones de macOS y la brecha entre lo que las voces integradas pueden hacer y lo que los creadores de contenido realmente necesitan sigue siendo amplia. La buena noticia: una vez que sabes dónde está todo, la configuración lleva unos 5 minutos. Y cuando las opciones integradas se te queden cortas, el camino de actualización es más sencillo de lo que la mayoría espera.
macOS tiene 3 sistemas de TTS independientes. La mayoría de la gente solo encuentra 1.
Esta es la parte que causa más confusión. Apple no tiene un único interruptor de "texto a voz". Tiene tres sistemas distintos que se solapan, cada uno controlado desde un lugar diferente:
| Sistema | Qué hace | Dónde encontrarlo | Uso principal |
|---|---|---|---|
| Contenido leído | Lee el texto seleccionado o toda la pantalla en voz alta | Ajustes del Sistema > Accesibilidad > Contenido leído | Lectura de artículos, corrección de textos y accesibilidad |
| VoiceOver | Lector de pantalla completo para usuarios con discapacidad visual | Ajustes del Sistema > Accesibilidad > VoiceOver | Navegación, accesibilidad |
| Voz de Siri | Potencia las respuestas de Siri y el dictado | Ajustes del Sistema > Siri | Respuestas del asistente virtual |
La mayoría de las personas que buscan "texto a voz en Mac" quieren Contenido leído. Esa es la función que lee el texto seleccionado en cualquier aplicación mediante un atajo de teclado. VoiceOver es una herramienta de accesibilidad completa que narra todo lo que hay en pantalla, incluidos botones, menús y títulos de ventanas. Activar VoiceOver cuando solo quieres que se lea un texto es como llamar a un camión de bomberos para encender una vela.
Configuración de Contenido leído: La guía de 5 minutos
Para macOS Sonoma (14) y versiones posteriores
- Abre Ajustes del Sistema (haz clic en el menú Apple > Ajustes del Sistema)
- Haz clic en Accesibilidad en la barra lateral
- Haz clic en Contenido leído
- Activa Leer selección
- Elige tu voz preferida haciendo clic en el menú desplegable junto a "Voz del sistema"
- Ajusta el control deslizante de velocidad de lectura a tu gusto
- Opcionalmente, activa Leer el ítem bajo el puntero si deseas la funcionalidad de pasar el cursor para leer
Para macOS Ventura (13) y versiones anteriores
La ruta es ligeramente diferente en versiones antiguas:
- Abre Preferencias del Sistema (no Ajustes del Sistema)
- Haz clic en Accesibilidad
- Haz clic en Contenido leído en la barra lateral izquierda
- Marca Leer selección
- Haz clic en el menú desplegable Voz del sistema para elegir una voz
- Ajusta la velocidad de lectura
El atajo de teclado
Una vez activado el Contenido leído, selecciona cualquier texto en cualquier aplicación y presiona Option + Esc para escucharlo en voz alta. Puedes personalizar este atajo:
- En los ajustes de Contenido leído, haz clic en Opciones junto a Leer selección
- Establece tu combinación de teclas preferida
- Activa o desactiva el controlador en pantalla (un pequeño panel flotante con controles de reproducción/pausa/salto)
Vale la pena activar ese controlador en pantalla. Te permite pausar, reanudar, saltar hacia adelante y ajustar la velocidad sin tener que volver a Ajustes del Sistema cada vez.
Elegir la voz adecuada (Apple tiene más de las que crees)
La mayoría de los usuarios de Mac solo han escuchado a "Samantha" o la voz predeterminada de Siri. Apple ofrece en realidad docenas de voces en varios idiomas, y la diferencia de calidad entre las voces básicas y las descargas premium es significativa.
Cómo descargar voces premium
- Ve a Ajustes del Sistema > Accesibilidad > Contenido leído
- Haz clic en el menú desplegable Voz del sistema
- Haz clic en Gestionar voces
- Explora por idioma. Las voces premium están marcadas con un icono de descarga
- Haz clic en la flecha de descarga junto a cualquier voz. Los archivos varían entre 150 MB y 900 MB, según el nivel de calidad
Niveles de calidad de voz
Apple categoriza sus voces en varios niveles:
- Voces compactas: Tamaño de archivo pequeño, calidad robótica. Están bien para anuncios rápidos del sistema, pero no para escuchar nada más largo que un párrafo.
- Voces estándar: Calidad de nivel medio. Decentes para corregir documentos cortos. Notarás un ritmo poco natural en pasajes más largos.
- Voces Premium/Mejoradas: Son las descargas más pesadas, pero notablemente más naturales. Utilizan síntesis de redes neuronales y suenan más parecidas a una persona real. "Zoe (Premium)", "Evan (Premium)" y varias otras entran en esta categoría.
Incluso las voces premium tienen un límite. Suenan bien durante 2 o 3 minutos. Pasado ese tiempo, la prosodia se aplana, la variación emocional desaparece y la voz se asienta en un ritmo monótono que es difícil de escuchar durante periodos prolongados. No es un error, es una limitación del tamaño del modelo en el dispositivo que Apple puede distribuir de forma práctica.
Uso de texto a voz en las aplicaciones de Mac
Una vez que el Contenido leído está activo, el atajo Option + Esc funciona en casi todas las aplicaciones de Mac. Así se comporta en las más comunes:
Pages y TextEdit: Selecciona el texto, presiona el atajo. Funciona de manera fiable. La voz lee el pasaje seleccionado y se detiene.
Safari y Chrome: Selecciona texto en cualquier página web y presiona el atajo. Útil para escuchar artículos mientras haces otra cosa. Safari también tiene un Modo de lectura independiente que elimina el formato de la página antes de leer, lo que a veces mejora el ritmo.
Preview (PDFs): Selecciona texto en un PDF y presiona el atajo. La calidad depende de si el PDF tiene texto seleccionable. Los documentos escaneados sin OCR no funcionarán.
Mail: Selecciona el cuerpo de un correo, presiona el atajo. Práctico para correos largos que prefieres escuchar en lugar de leer.
Terminal: Sí, también puedes activar el TTS desde la línea de comandos. Ejecuta say "Tu texto aquí" y macOS lo leerá en voz alta usando la voz del sistema. Para textos más largos: say -f /ruta/al/archivo.txt. Incluso puedes exportar a audio: say -f guion.txt -o salida.aiff. Este último comando es lo más parecido que tiene macOS a una función integrada de exportación de audio.
El truco de Terminal que la mayoría no conoce
El comando say acepta una bandera -v para especificar cualquier voz instalada:
say -v "Zoe (Premium)" "This is a test of the premium voice."
say -v "?"
Ese segundo comando enumera todas las voces instaladas en su sistema. Es la forma más rápida de probar voces sin tener que navegar por los Ajustes del Sistema.
Cómo desactivar el texto a voz (cuando no deja de hablar)
Esta sección existe porque un número sorprendente de usuarios de Mac activan accidentalmente VoiceOver o el Contenido leído y no saben cómo silenciarlo. Si tu Mac está narrando todo lo que aparece en pantalla, aquí tienes la solución más rápida:
Si VoiceOver está ejecutándose (el Mac narra cada clic y botón)
Presiona Cmd + F5 inmediatamente. Esto desactiva VoiceOver. En los MacBook con Touch Bar o modelos más nuevos, también puedes pulsar tres veces el botón Touch ID.
Si Leer selección no se detiene a mitad de lectura
Presiona Option + Esc de nuevo para detener la lectura actual. Si eso no funciona, haz clic en cualquier lugar fuera del texto seleccionado.
Si tu Mac lee notificaciones o alertas
- Ve a Ajustes del Sistema > Accesibilidad > Contenido leído
- Desactiva Leer anuncios
- Mientras estás allí, comprueba que Leer el ítem bajo el puntero también esté desactivado si no quieres la lectura al pasar el cursor
Lista de verificación para desactivación total
Para silenciar completamente todo el TTS en tu Mac:
- Contenido leído: Ajustes del Sistema > Accesibilidad > Contenido leído > Desactiva todo
- VoiceOver: Ajustes del Sistema > Accesibilidad > VoiceOver > Desactivar (o presionar Cmd + F5)
- Feedback de voz de Siri: Ajustes del Sistema > Siri > Respuestas de voz > Desactivado
- Alertas de audio: Ajustes del Sistema > Sonido > Desmarca "Reproducir sonido al arrancar" y ajusta el volumen de alerta
Después de revisar esta lista, tu Mac permanecerá en silencio a menos que actives explícitamente el habla de nuevo.
Dónde el TTS de macOS alcanza su límite (y qué hacer después)
Las voces integradas de Apple son lo suficientemente buenas para dos cosas: la corrección rápida de documentos cortos y la accesibilidad. Para cualquier cosa más allá de eso, te encontrarás con limitaciones insalvables:
- Sin personalización de voz: No puedes ajustar la emoción, el énfasis o el ritmo más allá de un simple control de velocidad. La voz lee un chiste y una tragedia con la misma inflexión.
- Selección de voces limitada: Incluso con todas las voces premium descargadas, estás eligiendo entre unas 15 o 20 opciones en inglés. Si necesitas un tono, acento o personalidad específicos para la producción de contenido, la biblioteca es demasiado pequeña.
- Sin clonación de voz: No hay forma de crear una voz que suene como tú o que coincida con la voz de una marca específica.
- La exportación de audio es primitiva: El comando
sayexporta a AIFF, pero no hay una forma integrada de generar MP3, WAV o audio listo para podcast con una normalización adecuada. - La calidad multilingüe cae rápido: Las voces premium de Apple son fuertes en inglés. Cambia a tailandés, árabe o portugués y volverás a una calidad robótica.
- Sin consistencia en textos largos: La prosodia deriva después de 2 o 3 minutos, lo que hace que la escucha prolongada sea fatigante. Un guion de 20 minutos sonará notablemente peor en el minuto 18 que en el minuto 1.
Estas limitaciones no importan si usas el TTS para detectar errores tipográficos en un correo. Importan mucho si estás produciendo un vídeo de YouTube, narrando un curso o convirtiendo contenido escrito en audio que una audiencia realmente vaya a escuchar.
De la corrección en Mac a la producción de audio profesional
Cuando tus necesidades superan las voces integradas, el cambio en el flujo de trabajo es sencillo: sigue escribiendo en tu Mac, pero genera el audio a través de una plataforma de TTS con IA dedicada.
Fish Audio llena exactamente los huecos que macOS deja abiertos. Esto es lo que cambia cuando haces el cambio:
Más de 2.000.000 de voces en lugar de 20. La biblioteca de voces de Fish Audio está categorizada por idioma, acento, tono y caso de uso. ¿Necesitas una voz de inglés americano cálida y conversacional para un tutorial? Filtrala. ¿Necesitas un narrador japonés nítido para un vídeo de producto localizado? Ahí está. La selección es aproximadamente 100.000 veces mayor que la que ofrece Apple.
Prosodia que se mantiene en guiones largos. La arquitectura del modelo de Fish Audio maneja la variación emocional y el ritmo en contenidos extensos. Una locución de 15 minutos mantiene su carácter de principio a fin, sin la deriva monótona que aparece tras 2 o 3 minutos con las voces de macOS. Las preguntas suenan como preguntas. El énfasis recae donde debe.
Clonación de voz en 15 segundos. ¿Quieres que cada pieza de audio suene como tú? Sube una muestra de 15 segundos y Fish Audio creará un clon que llevará tu identidad vocal a cualquier texto que generes. Apple no ofrece nada comparable.
Más de 13 idiomas sin pérdida de calidad. Fish Audio mantiene una pronunciación de nivel nativo en todo su conjunto de idiomas. Una voz que suena natural en inglés sigue siendo natural en español, mandarín, japonés y árabe. No hay una caída repentina de calidad al cambiar de idioma.
Archivos de audio listos para producción. Genera y descarga archivos MP3 o WAV listos para YouTube, alojamiento de podcasts, plataformas de cursos o cualquier otro canal de distribución. Sin trucos de Terminal, sin cadenas de conversión de AIFF a MP3.
El flujo de trabajo del creador en Mac
- Escribe tu guion en Pages, Google Docs o cualquier editor de texto de Mac
- Corrección rápida usando el Contenido leído de macOS (Option + Esc) para detectar frases forzadas
- Copia el texto final y pégalo en fish.audio/text-to-speech
- Elige una voz de la biblioteca (o usa tu voz clonada)
- Ajusta la emoción y el ritmo para que coincidan con tu contenido
- Genera y descarga el archivo de audio
- Suéltalo en tu proyecto: Final Cut Pro, Logic Pro, GarageBand, tu editor de podcasts o lo que sea que uses
Ese flujo de trabajo mantiene el TTS de macOS en su punto ideal (corrección instantánea y gratuita) y utiliza Fish Audio para la parte que realmente necesita sonar profesional.
Lo que cuesta
Fish Audio ofrece un nivel gratuito lo suficientemente generoso como para probar con guiones reales. Los planes de pago comienzan en $11 al mes por 250.000 créditos, lo que equivale a hasta 200 minutos (~3h 20m) de generación S1, o hasta 400 minutos (~6h 40m) de generación v1.5 o v1.6. En perspectiva, el TTS de macOS es gratuito pero no puede exportar archivos de audio utilizables. Un actor de voz humano para 15 horas de contenido grabado costaría entre $3.000 y $15.000. El desglose completo de precios está aquí.

Conclusión
macOS tiene un sistema de texto a voz (TTS) capaz que se esconde tras paneles de ajustes dispersos. Una vez que sabes que Contenido leído es la función que realmente quieres, que Option + Esc es el atajo y que existen descargas de voces premium, la configuración integrada de texto a voz de Mac maneja bien la corrección rápida y la escucha casual. Y si VoiceOver comienza accidentalmente a narrar toda tu pantalla, Cmd+F5 es tu botón de pánico.
Pero las voces integradas fueron diseñadas para la accesibilidad y el feedback del sistema, no para la producción de contenido. En el momento en que necesites un audio que una audiencia vaya a escuchar durante más de 2 minutos, voces que coincidan con tu marca o una salida multilingüe que no suene como un motor de traducción, habrás superado lo que Apple ofrece. Escribe en tu Mac, corrige con Contenido leído y produce con Fish Audio. La herramienta de escritura que ya tienes, junto con un motor de texto a voz diseñado para el audio que tu audiencia realmente escucha.","article_tag":"Guía","faq":[],"image_alt":"Logotipo de Fish Audio","image_caption":"Cree voces realistas con IA utilizando Fish Audio para sus proyectos en Mac"}

