Cómo activar el texto a voz en Windows, Mac, iPhone, Android y Chromebook
5 mar 2026
Todos los sistemas operativos principales incluyen texto a voz integrado desde hace años. Windows lo tiene. macOS lo tiene. Tu teléfono lo tiene. Pero menos del 12 % de los usuarios lo han activado alguna vez, según encuestas de uso de accesibilidad. No porque no lo quieran, sino porque el ajuste está enterrado bajo menús que la mayoría de la gente nunca abre.
Esta función puede leer correos electrónicos, artículos, documentos y páginas web enteras en voz alta. Activarla toma menos de un minuto en cualquier dispositivo. Conseguir una voz que no te haga arrepentirte de la decisión requiere un poco más de reflexión.
Windows 10 y 11
Windows ofrece dos funciones de TTS distintas. El Narrador es el lector de pantalla completo que anuncia todo lo que aparece en pantalla. Leer en voz alta es una herramienta más ligera integrada en aplicaciones específicas de Microsoft.
Activación del Narrador
El Narrador lee todos los elementos de la interfaz: botones, menús, notificaciones y texto del cuerpo. Para activarlo:
- Presiona Win + Ctrl + Enter para una activación instantánea
- O abre Configuración > Accesibilidad > Narrador (Windows 11) o Configuración > Accesibilidad > Narrador (Windows 10) y activa el interruptor
Una vez activo, el Narrador comienza a hablar de inmediato. Algunos ajustes que vale la pena ajustar enseguida:
- Selección de voz: En los ajustes del Narrador, haz clic en "Elegir una voz" para cambiar entre las opciones instaladas. Microsoft David y Microsoft Zira son las predeterminadas. Se pueden descargar voces adicionales desde el mismo menú
- Velocidad y tono: Ajusta el control deslizante de la velocidad de voz. El valor predeterminado suele ser demasiado lento para una escucha cómoda. Comienza alrededor del 60-70 % y ajústalo desde ahí
- Nivel de detalle: El Narrador puede anunciar cada detalle de la interfaz de usuario o solo lo esencial. En "Nivel de detalle", reducir el nivel a 3 o 4 elimina anuncios repetitivos como "botón" y "casilla de verificación" después de cada elemento
Uso de Leer en voz alta en Edge y Word
Para leer contenido específico en lugar de narrar toda la interfaz, tanto Microsoft Edge como Word incluyen una función de Leer en voz alta con voces que suenan mejor que las del Narrador.
- En Edge: Abre cualquier página web, presiona Ctrl + Shift + U, o haz clic en el menú de tres puntos y selecciona "Leer en voz alta". Aparecerá una barra de reproducción en la parte superior con controles de voz y velocidad
- En Word: Ve a Revisar > Leer en voz alta. La función leerá tu documento desde la posición del cursor hacia adelante
Leer en voz alta utiliza las voces neuronales en línea de Microsoft cuando estás conectado a internet, las cuales suenan notablemente más naturales que las voces sin conexión del Narrador.
macOS
macOS divide el TTS en dos niveles. Contenido hablado lee texto bajo demanda. VoiceOver es el lector de pantalla completo para navegar por toda la interfaz mediante la voz.
Activación de Contenido hablado
Esta es la opción que la mayoría de los usuarios de Mac desean. Lee el texto resaltado o pantallas completas sin cambiar la forma en que funciona tu Mac.
- Abre Ajustes del Sistema > Accesibilidad > Contenido hablado
- Activa Leer selección para leer cualquier texto resaltado mediante un atajo de teclado
- Activa Leer pantalla para leer todo lo visible en la pantalla actual
Después de activar Leer selección, resalta cualquier texto y presiona Option + Esc para escucharlo en voz alta. Aparecerá un pequeño controlador con controles de reproducción, pausa y velocidad.
Vale la pena configurar:
- Voz del sistema: Haz clic en el menú desplegable para explorar las voces disponibles. Las opciones etiquetadas como "Voz de Siri" suenan significativamente más naturales que las voces antiguas como Alex o Samantha
- Velocidad de habla: El valor predeterminado es conservador. Deslízalo hacia arriba hasta que la voz suene conversacional, no lenta
- Mostrar controlador: Activa esto para tener una superposición de reproducción persistente siempre que la voz esté activa
Activación de VoiceOver
VoiceOver es el lector de pantalla completo de macOS. Anuncia cada elemento de la interfaz y cambia el funcionamiento de la navegación. La mayoría de los usuarios no necesitan VoiceOver a menos que dependan de él por accesibilidad.
- Presiona Cmd + F5 para activar o desactivar VoiceOver
- O ve a Ajustes del Sistema > Accesibilidad > VoiceOver y activa el interruptor
VoiceOver tiene una curva de aprendizaje. Cuando está activo, navegas con atajos de teclado en lugar de clics de ratón, y el sistema anuncia cada elemento enfocado. Apple incluye un tutorial integrado accesible desde el panel de ajustes de VoiceOver.
iPhone y iPad
iOS ofrece varias opciones de TTS, que van desde leer una sola frase resaltada hasta narrar toda la pantalla.
Activación de Leer selección y Leer pantalla en voz alta
Estas dos funciones cubren la mayoría de los casos de uso sin cambiar el funcionamiento de tu dispositivo.
- Ve a Ajustes > Accesibilidad > Contenido hablado
- Activa Leer selección: Añade un botón "Voz" al menú de selección de texto. Resalta cualquier texto, toca "Voz" y el dispositivo lo leerá en voz alta
- Activa Leer pantalla en voz alta: Desliza hacia abajo con dos dedos desde la parte superior de la pantalla para que se lea toda la página. Aparecerá un controlador de reproducción con controles de velocidad, salto y pausa
Opciones adicionales en el mismo menú:
- Resaltar contenido: Activa esto para ver las palabras o frases resaltadas en tiempo real mientras se pronuncian
- Voces: Toca para descargar paquetes de voces mejoradas o premium para tu idioma. Las voces premium son descargas más grandes pero suenan notablemente mejor
- Velocidad de habla: Ajustable mediante un control deslizante. Pruébalo con un párrafo de contenido real en lugar de la frase de vista previa
Activación de VoiceOver
VoiceOver en iOS es un lector de pantalla completo que cambia los gestos táctiles. Un toque selecciona un elemento y lo lee en voz alta. Dos toques lo activan.
- Ve a Ajustes > Accesibilidad > VoiceOver y actívalo
- O di "Oye Siri, activa VoiceOver"
- O pulsa tres veces el botón lateral si has configurado la Función rápida de accesibilidad en Ajustes > Accesibilidad > Función rápida
Debido a que VoiceOver altera el funcionamiento de los toques y deslizamientos, puede resultar desorientador si no lo esperas. Los cambios en los gestos son intencionados y están diseñados para usuarios que navegan mediante señales de audio en lugar de visuales.
Android
Las funciones de TTS de Android incluyen TalkBack para la lectura de pantalla completa, Seleccionar para pronunciar para la lectura bajo demanda, y un motor de TTS a nivel de sistema al que otras aplicaciones pueden llamar.
Activación de Seleccionar para pronunciar
Para la mayoría de los usuarios, Seleccionar para pronunciar es el punto de partida adecuado. Lee lo que toques o selecciones sin cambiar la navegación de tu dispositivo.
- Ve a Ajustes > Accesibilidad > Seleccionar para pronunciar
- Actívalo
- Aparecerá un pequeño icono flotante en la pantalla. Tócalo, luego toca o arrastra sobre el texto que quieras leer en voz alta
En los dispositivos Samsung, la ruta puede ser Ajustes > Accesibilidad > Aplicaciones instaladas > Seleccionar para pronunciar.
Activación de TalkBack
TalkBack es el equivalente en Android de VoiceOver. Narra cada elemento y cambia el comportamiento táctil a un modelo de seleccionar y luego activar.
- Ve a Ajustes > Accesibilidad > TalkBack y actívalo
- O mantén presionados ambos botones de volumen durante 3 segundos en Android 9 y versiones superiores para activar o desactivar TalkBack
Al igual que VoiceOver en iOS, TalkBack cambia el funcionamiento de los gestos:
- Un toque selecciona y anuncia un elemento
- Dos toques lo activa
- Deslizar con dos dedos desplaza la página
- Deslizar con un dedo a la derecha o izquierda se mueve al elemento siguiente o anterior
Configuración del motor de TTS
Android te permite elegir qué motor de TTS potencia toda la salida de voz en todo el sistema.
- Ve a Ajustes > Accesibilidad > Salida de síntesis de voz, o en dispositivos Samsung, Ajustes > Administración general > Idioma y entrada > Texto a voz
- Selecciona tu motor preferido. El motor de TTS de Google viene preinstalado en la mayoría de los dispositivos. Samsung ofrece su propia alternativa
- Toca el icono del engranaje junto al motor para descargar paquetes de idiomas adicionales
- Usa los controles deslizantes de "Velocidad de la voz" y "Tono" para personalizar cómo suena la voz
Chromebook
ChromeOS mantiene sus opciones de TTS en un solo lugar, lo que hace que la configuración sea más sencilla que en la mayoría de las otras plataformas.
Activación de Seleccionar para pronunciar
- Ve a Configuración > Accesibilidad > Texto a voz
- Activa Seleccionar para pronunciar
- Haz clic en el icono de Seleccionar para pronunciar en la bandeja del sistema, luego arrastra sobre cualquier texto en pantalla para escucharlo
Activación de ChromeVox
ChromeVox es el lector de pantalla completo de ChromeOS.
- Presiona Ctrl + Alt + Z para activar o desactivar ChromeVox
- O actívalo en Configuración > Accesibilidad > Texto a voz > ChromeVox
ChromeVox comienza a narrar inmediatamente tras su activación. Utiliza el motor de TTS de Google, al igual que Android, y admite los mismos paquetes de idiomas y opciones de voz.
En qué aciertan las voces integradas y dónde se quedan cortas
Has activado el TTS. En unos 30 segundos de escucha, notarás el patrón.
Las voces integradas manejan bien las frases cortas y sencillas. Pronuncian correctamente las palabras comunes, hacen pausas en los puntos y mantienen una velocidad constante. Para leer una notificación o un mensaje de texto de dos líneas, están bien.
Las grietas aparecen con el contenido más largo. Lee un artículo completo en voz alta usando cualquier voz integrada y presta atención a estas señales:
- Énfasis plano: Todas las frases suenan igual. Las palabras importantes no reciben ningún énfasis adicional. Las preguntas no suben de tono de la forma en que lo haría una voz humana
- Ritmo torpe con la puntuación: Los puntos y coma, los dos puntos y las frases entre paréntesis confunden a la mayoría de los motores. La voz los ignora o inserta pausas extrañamente largas
- Deriva en la pronunciación: Los términos técnicos, los nombres de marcas y las palabras extranjeras se destrozan. La voz se empeña en una pronunciación y repite el mismo error cada vez que encuentra la palabra
- Fatiga del oyente: Después de 2 o 3 minutos, la calidad monótona se vuelve mentalmente agotadora. Esta es la razón principal por la que la gente desactiva el TTS poco después de activarlo
Estos no son errores. Los motores de TTS integrados están optimizados para un tamaño de archivo pequeño, uso sin conexión y compatibilidad universal. La calidad del sonido es la concesión.
El Texto a voz con IA cambia la ecuación
Si activaste el TTS con la esperanza de escuchar artículos, corregir textos de oído o producir locuciones, y la voz integrada te hizo reconsiderarlo, el problema no era la función. Era el motor.
Las plataformas de voz con IA como Fish Audio utilizan modelos neuronales entrenados con el habla humana. En lugar de concatenar fragmentos de sílabas, estos modelos generan audio desde cero, capturando el ritmo, el énfasis y la variación tonal que hacen que el habla suene viva. La diferencia es obvia desde la primera frase.
Esto es lo que el Texto a voz de Fish Audio ofrece y que el TTS a nivel de dispositivo no:
- Controles estilísticos: Más de 64 controles emocionales y estilísticos líderes en la industria, que cubren casi cualquier necesidad expresiva, desde la alegría y la tristeza hasta la ira y la calma
- Prosodia natural: El motor enfatiza las palabras importantes, suaviza las transiciones y varía el ritmo en función de la estructura de la frase. Una pregunta suena como una pregunta. Una lista suena como una lista. El TTS integrado lo lee todo con el mismo peso
- 13 idiomas con soporte para varios idiomas: Cambia entre inglés, mandarín, español, japonés y más, incluso dentro del mismo párrafo, sin que la pronunciación se desmorone
- Flujo de trabajo basado en el navegador: No requiere instalación de software. Ve a fish.audio/text-to-speech, pega tu texto, elige una voz y genera audio descargable
Clonación de voz para contenido consistente
Para los creadores que necesitan la misma voz en múltiples proyectos, la Clonación de voz de Fish Audio crea un modelo personalizado a partir de tan solo 10 segundos de audio de referencia. El modelo aprende el tono, el ritmo y la textura vocal del hablante, y luego aplica esas características a cualquier texto nuevo.
Las aplicaciones prácticas incluyen:
- Producción de YouTube y podcasts: Genera narraciones con una voz constante sin tener que grabar cada guion
- Contenido multilingüe: Una voz clonada conserva su carácter al generar voz en diferentes idiomas
- Consistencia de la voz de marca: Utiliza la misma voz en anuncios, tutoriales y comunicaciones con los clientes sin tener que programar tiempo de estudio para cada actualización
Acceso a la API para desarrolladores
La API de Fish Audio expone todo el motor de TTS y de clonación de voz para su uso programático. Los tiempos de respuesta se sitúan en el rango de los milisegundos con soporte para streaming, lo que significa que las aplicaciones de voz en tiempo real no necesitan almacenamiento en búfer.
Los detalles de precios y planes se encuentran en fish.audio/plan. Existe un nivel gratuito disponible para realizar pruebas.
Conclusión
Activar el texto a voz toma menos de un minuto en cualquier plataforma. Win + Ctrl + Enter en Windows, Option + Esc en Mac, deslizar con dos dedos en iPhone, Seleccionar para pronunciar en Android, Ctrl + Alt + Z en Chromebook. La función ya está en tu dispositivo, esperando.
La pregunta más difícil es si querrás mantenerla activada. Las voces integradas funcionan para lecturas rápidas y elementos esenciales de accesibilidad, pero no fueron diseñadas para una escucha prolongada o la producción de contenido. Si la voz te impulsa a pulsar el interruptor de apagado en dos minutos, prueba el TTS de Fish Audio antes de renunciar por completo al concepto. La brecha entre un motor preinstalado y una voz de IA moderna es la diferencia entre tolerar el habla y preferirla realmente a la lectura.


