Tutorial completo sobre texto a voz en iPhone: Cómo activarlo, usarlo y desactivarlo

28 feb 2026

Tutorial completo sobre texto a voz en iPhone: Cómo activarlo, usarlo y desactivarlo

Estás en el metro con un PDF de 12 páginas de tu profesor y quedan 20 minutos para clase. Le pides a Siri que "lea este documento". Siri abre una búsqueda web. Intentas con "Oye Siri, lee mi pantalla". Siri te dice que no puede hacerlo. Abres el PDF, buscas un botón de reproducción y no encuentras nada. En algún lugar de tu teléfono hay una función que lee texto en voz alta, pero Apple la escondió a tres menús de profundidad dentro de los ajustes de Accesibilidad, los cuales nunca has abierto: el sistema integrado de texto a voz de iPhone (iPhone TTS).

Esa experiencia se repite millones de veces al día en los 1.200 millones de iPhone activos en todo el mundo. iOS tiene un motor de texto a voz (TTS) integrado genuinamente capaz, con voces de sonido natural, resaltado de palabras y controles de velocidad. Pero Apple lo diseñó como una función de accesibilidad, no como una herramienta de consumo de contenido, y eso se nota en lo difícil que es encontrarlo. Una vez que conoces el camino, la configuración lleva 2 minutos. La calidad de la voz del texto a voz de iPhone te sorprenderá.

Tu iPhone tiene 2 sistemas TTS. Siri no es uno de ellos.

El primer error que hay que aclarar: Siri puede hablarte, pero no puede leer por ti usando el texto a voz de iPhone (iPhone TTS). Siri genera respuestas usando su propio modelo de voz, pero no tiene un comando de "leer este texto" o "leer esta pantalla" que funcione de manera fiable en todas las aplicaciones con el texto a voz de iOS.

Los sistemas TTS reales integrados en iOS son:

SistemaQué haceDónde encontrarloCuándo usarlo
Leer selecciónLee en voz alta el texto resaltadoAjustes > Accesibilidad > Contenido leídoLeer pasajes específicos, corrección de textos
Leer pantallaLee toda la pantalla visibleAjustes > Accesibilidad > Contenido leídoArtículos, correos electrónicos, documentos completos
VoiceOverLector de pantalla completo (narra cada elemento)Ajustes > Accesibilidad > VoiceOverSolo para accesibilidad visual

La mayoría de las personas buscan Leer selección o Leer pantalla para el texto a voz de iPhone. VoiceOver es un sistema de navegación completo para usuarios con discapacidad visual que narra cada pulsación, botón y gesto. Activar VoiceOver cuando solo quieres que se lea un artículo en voz alta usando el texto a voz de iOS hará que tu teléfono sea casi inutilizable hasta que descubras cómo desactivarlo (lo que requiere un patrón de pulsación diferente una vez que está activo).

No toques VoiceOver a menos que lo necesites específicamente.

Activar el texto a voz: Configuración en 2 minutos

Paso a paso para iOS 17 e iOS 18

  1. Abre Ajustes
  2. Pulsa Accesibilidad
  3. Pulsa Contenido leído
  4. Activa Leer selección (lee el texto resaltado)
  5. Activa Leer pantalla (lee toda la pantalla)
  6. Ajusta el control deslizante de Velocidad de habla. El valor predeterminado es de aproximadamente 180 palabras por minuto. A la mayoría de la gente le resultan cómodas entre 200 y 220 ppm. Experimenta.
  7. Pulsa Voces para cambiar la voz predeterminada (más sobre esto a continuación)

Eso es todo. Ambas funciones están ahora activas.

Cómo activar cada una

Leer selección: En cualquier aplicación, mantén presionado para seleccionar texto. En el menú emergente sobre la selección, pulsa Leer. (Si no ves "Leer", pulsa la flecha derecha en el menú emergente para encontrarlo).

Leer pantalla: Desliza hacia abajo desde la parte superior de la pantalla con dos dedos. Aparecerá un pequeño controlador de audio con controles de reproducción/pausa, avanzar, retroceder, velocidad y un botón de cierre. Este controlador flota sobre el contenido y permanece activo hasta que lo cierres.

El gesto de deslizar con dos dedos es el que la mayoría de la gente nunca descubre. Convierte tu iPhone en un reproductor de podcasts para cualquier texto en pantalla.

Elegir una voz que no suene como un robot de 2012

Apple ofrece docenas de voces en varios idiomas, y la diferencia de calidad entre la predeterminada y las opciones premium es espectacular. La mayoría de los usuarios nunca cambian la predeterminada, lo que significa que están escuchando una voz compacta optimizada para el tamaño del archivo en lugar de para la naturalidad.

Cómo descargar mejores voces

  1. Ve a Ajustes > Accesibilidad > Contenido leído > Voces
  2. Pulsa tu idioma (por ejemplo, español)
  3. Verás una lista de nombres de voces. Las voces con un icono de descarga aún no se han instalado.
  4. Pulsa el nombre de una voz para escuchar una vista previa. Pulsa el icono de descarga para instalarla.
  5. Las voces premium están etiquetadas como "Mejorada" o "Premium". Ocupan entre 100 MB y 500 MB.

Qué voces valen realmente la pena descargar

Para inglés, las mejores opciones de Apple a partir de iOS 18 son:

  • Zoe (Premium): Inglés americano cálido y conversacional. Lo más parecido de Apple a un narrador de sonido natural.
  • Evan (Premium): Inglés americano claro y un poco más formal. Funciona bien para artículos de noticias y contenido profesional.
  • Siri Voz 2 / Voz 4: Las voces de Siri más nuevas se basan en redes neuronales y suenan más naturales que las opciones antiguas, aunque todavía tienen una calidad "digital" notable en pasajes largos.

Para otros idiomas, la calidad varía. El japonés, el mandarín, el español y el francés tienen voces premium decentes. Los idiomas con menos hablantes a menudo solo tienen voces compactas que suenan notablemente robóticas.

Conclusión: dedica 5 minutos a descargar 2 o 3 voces premium y compáralas. La diferencia entre la voz compacta predeterminada y una descarga premium es la diferencia entre tolerar el TTS y disfrutarlo realmente.

Uso del texto a voz en las aplicaciones del iPhone

Una vez activado el Contenido leído, funciona en casi todas las aplicaciones de tu teléfono. Pero "funciona" significa cosas diferentes en distintos contextos.

Safari

Desliza dos dedos hacia abajo en cualquier página de artículo para activar Leer pantalla (texto a voz de iPhone). La lectura comienza en la parte superior del contenido visible. Para una experiencia más limpia, pulsa primero el icono del Modo de lectura (el icono de las líneas en la barra de direcciones). El Modo de lectura elimina anuncios, navegación y contenido de la barra lateral, por lo que la voz lee solo el cuerpo del artículo en lugar de anunciar "Menú. Inicio. Acerca de. Suscribirse. Banner de cookies".

Ese truco del Modo de lectura por sí solo reduce a la mitad el factor de molestia.

Notas

Leer selección funciona en notas individuales. Selecciona el texto, pulsa Leer. Leer pantalla lee toda la nota. Útil para revisar tus propios escritos de oído. Si una frase suena mal cuando se lee en voz alta, generalmente también se lee mal.

Mail

Selecciona el cuerpo de un correo electrónico y pulsa Leer, o desliza con dos dedos para leer el correo completo. Los hilos largos de correo electrónico funcionan, pero pueden resultar confusos porque la voz lee todo el hilo, incluidas las respuestas citadas. Selecciona solo el mensaje más reciente para obtener mejores resultados.

Books (Apple Books)

Apple Books tiene su propio sistema de texto a voz (texto a voz de iOS) independiente del Contenido leído (texto a voz de iPhone). Abre un libro, pulsa la página, pulsa el menú Aa y busca la opción "Escuchar" o de audio (la disponibilidad varía según el libro y la versión de iOS). La calidad suele coincidir con los ajustes de voz de tu Contenido leído.

Kindle

Leer pantalla (texto a voz de iPhone) funciona en la aplicación Kindle mediante un deslizamiento de dos dedos. La voz lee la página visible. Tendrás que pasar manualmente a la siguiente página cuando termine, lo que lo hace poco práctico para sesiones de lectura largas. No hay integración de paso de página automático entre Contenido leído y Kindle.

PDF (en la aplicación Archivos)

Abre un PDF en la aplicación Archivos. Desliza dos dedos hacia abajo. La voz lee el texto seleccionable del PDF. Los PDF escaneados sin capas de texto OCR no funcionarán. Si tu PDF no suena, es probable que sea una imagen escaneada en lugar de un documento basado en texto, por lo que no será compatible con el texto a voz de iOS.

Aplicaciones de terceros

Leer selección funciona en la mayoría de las aplicaciones que muestran texto: Notion, Google Docs, Slack, WhatsApp, Reddit, Twitter/X. Leer pantalla (deslizar con dos dedos) es menos fiable en aplicaciones de terceros porque lee todos los elementos visibles de la interfaz de usuario, no solo el contenido. Leer selección con selección manual de texto suele ser más preciso.

4 ajustes que hacen que el TTS de iPhone sea realmente utilizable

La configuración predeterminada de Contenido leído funciona, pero cuatro ajustes rápidos la hacen significativamente mejor.

1. Resaltar contenido mientras se habla. Ve a Ajustes > Accesibilidad > Contenido leído y activa Resaltar contenido. Elige si quieres resaltar palabras, frases o ambas. Esto te permite seguir visualmente la lectura y es sorprendentemente útil al corregir tus propios textos.

2. Ajusta tu velocidad correctamente. La velocidad de habla predeterminada es demasiado lenta para la mayoría de los oyentes. Súbela a 1.3x-1.5x (aproximadamente 220-270 ppm). También puedes ajustar la velocidad en tiempo real usando el controlador flotante que aparece durante Leer pantalla.

3. Añade correcciones de pronunciación. Ve a Ajustes > Accesibilidad > Contenido leído > Pronunciación. Puedes añadir reglas de pronunciación personalizadas para palabras que la voz suele pronunciar mal: nombres de marcas, términos técnicos y nombres de personas. Cada entrada te permite escribir la palabra y luego deletrear cómo debe pronunciarse fonéticamente.

4. Crea un acceso directo con Toque posterior. Ve a Ajustes > Accesibilidad > Tocar > Toque posterior. Configura Pulsar dos veces o Triple pulsación para activar "Leer pantalla". Ahora puedes iniciar el TTS tocando la parte trasera de tu iPhone dos veces en lugar de hacer el gesto de deslizar con dos dedos, que es incómodo de realizar con una sola mano.

Ese acceso directo de Toque posterior es un pequeño cambio que hace que la función parezca diseñada para el uso diario en lugar de estar enterrada en los menús de accesibilidad.

Cómo desactivar el texto a voz (y detener VoiceOver si lo activaste por accidente)

Detener una lectura actual

Pulsa el botón X en el controlador de audio flotante, o usa de nuevo el gesto de deslizar hacia abajo con dos dedos para desactivar Leer pantalla. Para Leer selección, simplemente pulsa en cualquier otro lugar de la pantalla.

Desactivar el Contenido leído por completo

  1. Ve a Ajustes > Accesibilidad > Contenido leído
  2. Desactiva Leer selección
  3. Desactiva Leer pantalla

Emergencia: VoiceOver está activado y tu teléfono lo narra todo

Este es el escenario de pánico. Activaste accidentalmente VoiceOver y ahora cada pulsación se narra, y el gesto normal de pulsar para seleccionar ya no funciona. VoiceOver cambia todo el modelo de interacción: una sola pulsación lee un elemento en voz alta; una doble pulsación lo activa.

Solución más rápida: Dile a Siri: "Desactiva VoiceOver". Esto funciona incluso si no puedes navegar por la pantalla.

Si Siri no está disponible:

  1. Pulsa una vez Ajustes (VoiceOver lo leerá en voz alta)
  2. Pulsa dos veces Ajustes (se abre)
  3. Pulsa una vez Accesibilidad, luego pulsa dos veces para abrir
  4. Pulsa una vez VoiceOver, luego pulsa dos veces para abrir
  5. Pulsa una vez el interruptor de VoiceOver, luego pulsa dos veces para desactivarlo

Si tienes un Mac: Conecta tu iPhone, abre Finder (o iTunes en versiones antiguas de macOS) y gestiona los ajustes de Accesibilidad desde allí.

La clave a recordar es: con VoiceOver activado, todo es una pulsación para seleccionar y doble pulsación para activar. Una vez que interiorices ese patrón, podrás navegar hasta el interruptor. Pero pedirlo a Siri es más rápido.

El techo: Lo que el TTS de iPhone no puede hacer

El TTS integrado de Apple en iPhone es impresionante para ser una función del sistema, pero tiene límites claros:

  • Sin exportación de audio. La voz lee el texto en voz alta a través de tu altavoz o auriculares. No hay forma de guardar el audio como MP3, WAV o cualquier archivo que puedas usar en un vídeo, podcast o presentación.
  • Sin clonación de voz. No puedes crear una voz que suene como tú o que coincida con una identidad de marca específica.
  • Una voz, una personalidad. No puedes asignar diferentes voces a diferentes personajes en una historia, a diferentes oradores en una transcripción o a diferentes secciones de un documento.
  • Control limitado de la emoción y el ritmo. Un control deslizante de velocidad es el único ajuste. No puedes añadir énfasis a una frase específica, insertar pausas dramáticas o cambiar el tono emocional a mitad de un párrafo.
  • Brecha de calidad multilingüe. Las voces premium en inglés son buenas. Muchos otros idiomas solo tienen voces compactas que suenan planas y robóticas.
  • Pérdida de prosodia en contenido largo. Incluso las voces premium empiezan a sonar monótonas después de 5-10 minutos de lectura continua. El ritmo se aplana, el énfasis desaparece y la escucha se vuelve fatigante.

Para uso personal (escuchar artículos durante un trayecto, corregir notas antes de clase), estos límites no importan. Para cualquier audio que compartas con una audiencia, importan mucho.

Cuando tu iPhone necesita un mejor motor de voz

En el momento en que necesitas audio que exista como un archivo, que suene como un narrador real o que funcione en varios idiomas sin pérdida de calidad, has cruzado la línea de "función de iPhone" a "herramienta de producción".

Fish Audio llena cada vacío que iOS deja abierto y funciona directamente en el navegador de tu iPhone.

Más de 2.000.000 de voces que realmente puedes explorar. La biblioteca TTS de Fish Audio te permite filtrar por idioma, acento, género y tono. ¿Necesitas un narrador calmado y cálido para una aplicación de meditación? ¿Una voz impactante y enérgica para un YouTube Short? La biblioteca está categorizada para casos de uso reales, no solo enumerada alfabéticamente. fish-logo Archivos de audio que realmente puedes usar. Genera y descarga archivos MP3 o WAV directamente en tu iPhone. Suéltalos en iMovie, en un editor de podcasts, en una plataforma de cursos o compártelos como necesites. Sin trucos de grabación de pantalla.

Clonación de voz de 15 segundos desde tu iPhone. Graba una muestra de 15 segundos con el micrófono de tu iPhone, súbela a la herramienta de clonación de voz de Fish Audio y, a partir de ese momento, cada texto que conviertas sonará como tú. Graba la muestra en Notas de voz, súbela y listo.

8 idiomas con calidad constante. El modelo de Fish Audio mantiene una prosodia natural en todo su conjunto de idiomas. Una voz que suena humana en inglés suena igualmente humana en japonés, árabe, portugués y mandarín. Sin caídas repentinas de calidad al cambiar de idioma.

Prosodia que se mantiene durante 20 minutos, no 2. La diferencia entre el TTS de iOS y un motor de IA dedicado es más evidente en contenidos largos. El modelo de Fish Audio mantiene la variación emocional, el ritmo y el énfasis en guiones extensos. Una locución de 15 minutos suena tan natural en el minuto 14 como en el minuto 1.

El flujo de trabajo móvil

  1. Escribe o copia tu texto en tu iPhone (Notas, Google Docs, correo electrónico, cualquier lugar)
  2. Abre Safari y ve a fish.audio/text-to-speech
  3. Pega tu texto
  4. Elige una voz, ajusta la configuración
  5. Genera y descarga el archivo de audio
  6. Úsalo en cualquier lugar: iMovie, aplicaciones de podcast, compártelo vía AirDrop, súbelo a tu plataforma de cursos

Fish Audio ofrece un nivel gratuito para pruebas reales. Los planes de pago comienzan en 11 $ al mes para aproximadamente 15 horas de audio terminado. La página de precios tiene el desglose completo. Compara eso con lo que ofrece iOS de forma gratuita (solo escucha, sin exportación, voces limitadas) y con el talento de voz humano (100-500 $ por minuto terminado), y el cálculo es claro.

Conclusión

Tu iPhone tiene un sistema de texto a voz capaz que Apple oculta tras los ajustes de Accesibilidad que la mayoría de la gente nunca abre. Dos interruptores (Leer selección y Leer pantalla), una descarga de voz premium y el acceso directo de Toque posterior lo convierten en una herramienta legítima para escuchar artículos, corregir borradores y absorber contenido sobre la marcha. Si VoiceOver secuestra tu teléfono, dile a Siri que lo desactive.

Pero el TTS de iOS fue diseñado para leer texto en voz alta en el momento, no para producir audio. En el instante en que necesitas un archivo que puedas compartir, una voz que coincida con tu marca o una calidad que no se desvanezca después de 5 minutos, Fish Audio toma el relevo donde Apple se detiene. El texto que ya estás escribiendo en tu teléfono se convierte en audio que suena como si hubiera sido grabado a propósito. Empieza con el nivel gratuito y pruébalo con lo que estés leyendo ahora mismo.

Preguntas Frecuentes

Ve a Ajustes > Accesibilidad > Contenido leído y activa las opciones 'Leer selección' y 'Leer pantalla'.
En Ajustes > Accesibilidad > Contenido leído > Voces, puedes descargar versiones 'Mejorada' o 'Premium' que ofrecen una calidad de audio superior a las predeterminadas.
No, la función nativa del iPhone solo permite la escucha en directo. Para generar y descargar archivos MP3 o WAV, se recomienda utilizar herramientas como Fish Audio.
La forma más rápida es decirle a Siri: 'Desactiva VoiceOver'. Si Siri no está disponible, recuerda que debes pulsar una vez para seleccionar un elemento y dos veces rápidamente para activarlo.

Crea voces que se sienten reales

Comienza a generar audio de la más alta calidad hoy mismo.

¿Ya tienes una cuenta? Iniciar sesión

Compartir este artículo


Kyle Cui

Kyle CuiX

Kyle is a Founding Engineer at Fish Audio and UC Berkeley Computer Scientist and Physicist. He builds scalable voice systems and grew Fish into the #1 global AI text-to-speech platform. Outside of startups, he has climbed 1345 trees so far around the Bay Area. Find his irresistibly clouty thoughts on X at @kile_sway.

Leer más de Kyle Cui >

Artículos Recientes

Ver todo >