Cómo activar el texto a voz en Windows, Mac, iPhone, Android y Chromebook

5 mar 2026

Guía

Cómo activar el texto a voz en Windows, Mac, iPhone, Android y Chromebook

Todos los sistemas operativos principales incluyen texto a voz integrado desde hace años. Windows lo tiene. macOS lo tiene. Tu teléfono lo tiene. Pero menos del 12 % de los usuarios lo han activado alguna vez, según encuestas de uso de accesibilidad. No porque no lo quieran, sino porque el ajuste está enterrado bajo menús que la mayoría de la gente nunca abre.

Esta función puede leer correos electrónicos, artículos, documentos y páginas web enteras en voz alta. Activarla toma menos de un minuto en cualquier dispositivo. Conseguir una voz que no te haga arrepentirte de la decisión requiere un poco más de reflexión.

Windows 10 y 11

Windows ofrece dos funciones de TTS distintas. El Narrador es el lector de pantalla completo que anuncia todo lo que aparece en pantalla. Leer en voz alta es una herramienta más ligera integrada en aplicaciones específicas de Microsoft.

Activación del Narrador

El Narrador lee todos los elementos de la interfaz: botones, menús, notificaciones y texto del cuerpo. Para activarlo:

Presiona Win + Ctrl + Enter para una activación instantánea
O abre Configuración > Accesibilidad > Narrador (Windows 11) o Configuración > Accesibilidad > Narrador (Windows 10) y activa el interruptor

Una vez activo, el Narrador comienza a hablar de inmediato. Algunos ajustes que vale la pena ajustar enseguida:

Selección de voz: En los ajustes del Narrador, haz clic en "Elegir una voz" para cambiar entre las opciones instaladas. Microsoft David y Microsoft Zira son las predeterminadas. Se pueden descargar voces adicionales desde el mismo menú
Velocidad y tono: Ajusta el control deslizante de la velocidad de voz. El valor predeterminado suele ser demasiado lento para una escucha cómoda. Comienza alrededor del 60-70 % y ajústalo desde ahí
Nivel de detalle: El Narrador puede anunciar cada detalle de la interfaz de usuario o solo lo esencial. En "Nivel de detalle", reducir el nivel a 3 o 4 elimina anuncios repetitivos como "botón" y "casilla de verificación" después de cada elemento

Uso de Leer en voz alta en Edge y Word

Para leer contenido específico en lugar de narrar toda la interfaz, tanto Microsoft Edge como Word incluyen una función de Leer en voz alta con voces que suenan mejor que las del Narrador.

En Edge: Abre cualquier página web, presiona Ctrl + Shift + U, o haz clic en el menú de tres puntos y selecciona "Leer en voz alta". Aparecerá una barra de reproducción en la parte superior con controles de voz y velocidad
En Word: Ve a Revisar > Leer en voz alta. La función leerá tu documento desde la posición del cursor hacia adelante

Leer en voz alta utiliza las voces neuronales en línea de Microsoft cuando estás conectado a internet, las cuales suenan notablemente más naturales que las voces sin conexión del Narrador.

macOS

macOS divide el TTS en dos niveles. Contenido hablado lee texto bajo demanda. VoiceOver es el lector de pantalla completo para navegar por toda la interfaz mediante la voz.

Activación de Contenido hablado

Esta es la opción que la mayoría de los usuarios de Mac desean. Lee el texto resaltado o pantallas completas sin cambiar la forma en que funciona tu Mac.

Abre Ajustes del Sistema > Accesibilidad > Contenido hablado
Activa Leer selección para leer cualquier texto resaltado mediante un atajo de teclado
Activa Leer pantalla para leer todo lo visible en la pantalla actual

Después de activar Leer selección, resalta cualquier texto y presiona Option + Esc para escucharlo en voz alta. Aparecerá un pequeño controlador con controles de reproducción, pausa y velocidad.

Vale la pena configurar:

Voz del sistema: Haz clic en el menú desplegable para explorar las voces disponibles. Las opciones etiquetadas como "Voz de Siri" suenan significativamente más naturales que las voces antiguas como Alex o Samantha
Velocidad de habla: El valor predeterminado es conservador. Deslízalo hacia arriba hasta que la voz suene conversacional, no lenta
Mostrar controlador: Activa esto para tener una superposición de reproducción persistente siempre que la voz esté activa

Activación de VoiceOver

VoiceOver es el lector de pantalla completo de macOS. Anuncia cada elemento de la interfaz y cambia el funcionamiento de la navegación. La mayoría de los usuarios no necesitan VoiceOver a menos que dependan de él por accesibilidad.

Presiona Cmd + F5 para activar o desactivar VoiceOver
O ve a Ajustes del Sistema > Accesibilidad > VoiceOver y activa el interruptor

VoiceOver tiene una curva de aprendizaje. Cuando está activo, navegas con atajos de teclado en lugar de clics de ratón, y el sistema anuncia cada elemento enfocado. Apple incluye un tutorial integrado accesible desde el panel de ajustes de VoiceOver.

iPhone y iPad

iOS ofrece varias opciones de TTS, que van desde leer una sola frase resaltada hasta narrar toda la pantalla.

Activación de Leer selección y Leer pantalla en voz alta

Estas dos funciones cubren la mayoría de los casos de uso sin cambiar el funcionamiento de tu dispositivo.

Ve a Ajustes > Accesibilidad > Contenido hablado
Activa Leer selección: Añade un botón "Voz" al menú de selección de texto. Resalta cualquier texto, toca "Voz" y el dispositivo lo leerá en voz alta
Activa Leer pantalla en voz alta: Desliza hacia abajo con dos dedos desde la parte superior de la pantalla para que se lea toda la página. Aparecerá un controlador de reproducción con controles de velocidad, salto y pausa

Opciones adicionales en el mismo menú:

Resaltar contenido: Activa esto para ver las palabras o frases resaltadas en tiempo real mientras se pronuncian
Voces: Toca para descargar paquetes de voces mejoradas o premium para tu idioma. Las voces premium son descargas más grandes pero suenan notablemente mejor
Velocidad de habla: Ajustable mediante un control deslizante. Pruébalo con un párrafo de contenido real en lugar de la frase de vista previa

Activación de VoiceOver

VoiceOver en iOS es un lector de pantalla completo que cambia los gestos táctiles. Un toque selecciona un elemento y lo lee en voz alta. Dos toques lo activan.

Ve a Ajustes > Accesibilidad > VoiceOver y actívalo
O di "Oye Siri, activa VoiceOver"
O pulsa tres veces el botón lateral si has configurado la Función rápida de accesibilidad en Ajustes > Accesibilidad > Función rápida

Debido a que VoiceOver altera el funcionamiento de los toques y deslizamientos, puede resultar desorientador si no lo esperas. Los cambios en los gestos son intencionados y están diseñados para usuarios que navegan mediante señales de audio en lugar de visuales.

Android

Las funciones de TTS de Android incluyen TalkBack para la lectura de pantalla completa, Seleccionar para pronunciar para la lectura bajo demanda, y un motor de TTS a nivel de sistema al que otras aplicaciones pueden llamar.

Activación de Seleccionar para pronunciar

Para la mayoría de los usuarios, Seleccionar para pronunciar es el punto de partida adecuado. Lee lo que toques o selecciones sin cambiar la navegación de tu dispositivo.

Ve a Ajustes > Accesibilidad > Seleccionar para pronunciar
Actívalo
Aparecerá un pequeño icono flotante en la pantalla. Tócalo, luego toca o arrastra sobre el texto que quieras leer en voz alta

En los dispositivos Samsung, la ruta puede ser Ajustes > Accesibilidad > Aplicaciones instaladas > Seleccionar para pronunciar.

Activación de TalkBack

TalkBack es el equivalente en Android de VoiceOver. Narra cada elemento y cambia el comportamiento táctil a un modelo de seleccionar y luego activar.

Ve a Ajustes > Accesibilidad > TalkBack y actívalo
O mantén presionados ambos botones de volumen durante 3 segundos en Android 9 y versiones superiores para activar o desactivar TalkBack

Al igual que VoiceOver en iOS, TalkBack cambia el funcionamiento de los gestos:

Un toque selecciona y anuncia un elemento
Dos toques lo activa
Deslizar con dos dedos desplaza la página
Deslizar con un dedo a la derecha o izquierda se mueve al elemento siguiente o anterior

Configuración del motor de TTS

Android te permite elegir qué motor de TTS potencia toda la salida de voz en todo el sistema.

Ve a Ajustes > Accesibilidad > Salida de síntesis de voz, o en dispositivos Samsung, Ajustes > Administración general > Idioma y entrada > Texto a voz
Selecciona tu motor preferido. El motor de TTS de Google viene preinstalado en la mayoría de los dispositivos. Samsung ofrece su propia alternativa
Toca el icono del engranaje junto al motor para descargar paquetes de idiomas adicionales
Usa los controles deslizantes de "Velocidad de la voz" y "Tono" para personalizar cómo suena la voz

Chromebook

ChromeOS mantiene sus opciones de TTS en un solo lugar, lo que hace que la configuración sea más sencilla que en la mayoría de las otras plataformas.

Activación de Seleccionar para pronunciar

Ve a Configuración > Accesibilidad > Texto a voz
Activa Seleccionar para pronunciar
Haz clic en el icono de Seleccionar para pronunciar en la bandeja del sistema, luego arrastra sobre cualquier texto en pantalla para escucharlo

Activación de ChromeVox

ChromeVox es el lector de pantalla completo de ChromeOS.

Presiona Ctrl + Alt + Z para activar o desactivar ChromeVox
O actívalo en Configuración > Accesibilidad > Texto a voz > ChromeVox

ChromeVox comienza a narrar inmediatamente tras su activación. Utiliza el motor de TTS de Google, al igual que Android, y admite los mismos paquetes de idiomas y opciones de voz.

En qué aciertan las voces integradas y dónde se quedan cortas

Has activado el TTS. En unos 30 segundos de escucha, notarás el patrón.

Las voces integradas manejan bien las frases cortas y sencillas. Pronuncian correctamente las palabras comunes, hacen pausas en los puntos y mantienen una velocidad constante. Para leer una notificación o un mensaje de texto de dos líneas, están bien.

Las grietas aparecen con el contenido más largo. Lee un artículo completo en voz alta usando cualquier voz integrada y presta atención a estas señales:

Énfasis plano: Todas las frases suenan igual. Las palabras importantes no reciben ningún énfasis adicional. Las preguntas no suben de tono de la forma en que lo haría una voz humana
Ritmo torpe con la puntuación: Los puntos y coma, los dos puntos y las frases entre paréntesis confunden a la mayoría de los motores. La voz los ignora o inserta pausas extrañamente largas
Deriva en la pronunciación: Los términos técnicos, los nombres de marcas y las palabras extranjeras se destrozan. La voz se empeña en una pronunciación y repite el mismo error cada vez que encuentra la palabra
Fatiga del oyente: Después de 2 o 3 minutos, la calidad monótona se vuelve mentalmente agotadora. Esta es la razón principal por la que la gente desactiva el TTS poco después de activarlo

Estos no son errores. Los motores de TTS integrados están optimizados para un tamaño de archivo pequeño, uso sin conexión y compatibilidad universal. La calidad del sonido es la concesión.

El Texto a voz con IA cambia la ecuación

Si activaste el TTS con la esperanza de escuchar artículos, corregir textos de oído o producir locuciones, y la voz integrada te hizo reconsiderarlo, el problema no era la función. Era el motor.

Las plataformas de voz con IA como Fish Audio utilizan modelos neuronales entrenados con el habla humana. En lugar de concatenar fragmentos de sílabas, estos modelos generan audio desde cero, capturando el ritmo, el énfasis y la variación tonal que hacen que el habla suene viva. La diferencia es obvia desde la primera frase. Esto es lo que el Texto a voz de Fish Audio ofrece y que el TTS a nivel de dispositivo no:

Controles estilísticos: Más de 64 controles emocionales y estilísticos líderes en la industria, que cubren casi cualquier necesidad expresiva, desde la alegría y la tristeza hasta la ira y la calma
Prosodia natural: El motor enfatiza las palabras importantes, suaviza las transiciones y varía el ritmo en función de la estructura de la frase. Una pregunta suena como una pregunta. Una lista suena como una lista. El TTS integrado lo lee todo con el mismo peso
13 idiomas con soporte para varios idiomas: Cambia entre inglés, mandarín, español, japonés y más, incluso dentro del mismo párrafo, sin que la pronunciación se desmorone
Flujo de trabajo basado en el navegador: No requiere instalación de software. Ve a fish.audio/text-to-speech, pega tu texto, elige una voz y genera audio descargable

Clonación de voz para contenido consistente

Para los creadores que necesitan la misma voz en múltiples proyectos, la Clonación de voz de Fish Audio crea un modelo personalizado a partir de tan solo 10 segundos de audio de referencia. El modelo aprende el tono, el ritmo y la textura vocal del hablante, y luego aplica esas características a cualquier texto nuevo.

Las aplicaciones prácticas incluyen:

Producción de YouTube y podcasts: Genera narraciones con una voz constante sin tener que grabar cada guion
Contenido multilingüe: Una voz clonada conserva su carácter al generar voz en diferentes idiomas
Consistencia de la voz de marca: Utiliza la misma voz en anuncios, tutoriales y comunicaciones con los clientes sin tener que programar tiempo de estudio para cada actualización

Acceso a la API para desarrolladores

La API de Fish Audio expone todo el motor de TTS y de clonación de voz para su uso programático. Los tiempos de respuesta se sitúan en el rango de los milisegundos con soporte para streaming, lo que significa que las aplicaciones de voz en tiempo real no necesitan almacenamiento en búfer.

Los detalles de precios y planes se encuentran en fish.audio/plan. Existe un nivel gratuito disponible para realizar pruebas.

Conclusión

Activar el texto a voz toma menos de un minuto en cualquier plataforma. Win + Ctrl + Enter en Windows, Option + Esc en Mac, deslizar con dos dedos en iPhone, Seleccionar para pronunciar en Android, Ctrl + Alt + Z en Chromebook. La función ya está en tu dispositivo, esperando.

La pregunta más difícil es si querrás mantenerla activada. Las voces integradas funcionan para lecturas rápidas y elementos esenciales de accesibilidad, pero no fueron diseñadas para una escucha prolongada o la producción de contenido. Si la voz te impulsa a pulsar el interruptor de apagado en dos minutos, prueba el TTS de Fish Audio antes de renunciar por completo al concepto. La brecha entre un motor preinstalado y una voz de IA moderna es la diferencia entre tolerar el habla y preferirla realmente a la lectura.

Crea voces que se sienten reales

Comienza a generar audio de la más alta calidad hoy mismo.

Regístrate gratis

¿Ya tienes una cuenta? Iniciar sesión

Compartir este artículo

Kyle Cui

Kyle is a Founding Engineer at Fish Audio and UC Berkeley Computer Scientist and Physicist. He builds scalable voice systems and grew Fish into the #1 global AI text-to-speech platform. Outside of startups, he has climbed 1345 trees so far around the Bay Area. Find his irresistibly clouty thoughts on X at @kile_sway.

Leer más de Kyle Cui >