Tutoriel complet sur la synthèse vocale sur iPhone : Comment l'activer, l'utiliser et la désactiver

28 févr. 2026

Tutoriel complet sur la synthèse vocale sur iPhone : Comment l'activer, l'utiliser et la désactiver

Vous êtes dans le métro avec un PDF de 12 pages de votre professeur et il vous reste 20 minutes avant le cours. Vous demandez à Siri de « lire ce document ». Siri lance une recherche sur le Web. Vous essayez « Dis Siri, lis mon écran ». Siri vous répond qu'elle ne peut pas faire ça. Vous ouvrez le PDF, cherchez un bouton de lecture, et ne trouvez rien. Quelque part dans votre téléphone se cache une fonctionnalité qui lit le texte à haute voix, mais Apple l'a enterrée au troisième niveau des réglages d'accessibilité que vous n'avez jamais ouverts : le système intégré de synthèse vocale sur iPhone (iPhone TTS).

Cette expérience se répète des millions de fois par jour sur les 1,2 milliard d'iPhones actifs dans le monde. iOS dispose d'un moteur de synthèse vocale (TTS) intégré vraiment performant, avec des voix au son naturel, un surlignage mot à mot et des contrôles de vitesse. Mais Apple l'a conçu comme une fonction d'accessibilité, et non comme un outil de consommation de contenu, ce qui explique pourquoi il est si difficile à trouver. Une fois que vous connaissez le chemin, la configuration prend 2 minutes. La qualité de la voix de synthèse vocale de l'iPhone vous surprendra.

Votre iPhone dispose de 2 systèmes TTS. Siri n'en fait pas partie.

Première idée reçue à dissiper : Siri peut vous parler, mais elle ne peut pas lire pour vous en utilisant la synthèse vocale sur iPhone (iPhone TTS). Siri génère des réponses à l'aide de son propre modèle vocal, mais elle n'a pas de commande « lire ce texte » ou « lire cet écran » qui fonctionne de manière fiable d'une application à l'autre avec la synthèse vocale iOS.

Les véritables systèmes TTS intégrés à iOS sont :

Système	Ce qu'il fait	Où le trouver	Quand l'utiliser
Énoncer la sélection	Lit le texte surligné à haute voix	Réglages > Accessibilité > Contenu énoncé	Lecture de passages spécifiques, relecture
Énoncer le contenu de l'écran	Lit tout l'écran visible	Réglages > Accessibilité > Contenu énoncé	Articles, e-mails, documents complets
VoiceOver	Lecteur d'écran complet (décrit chaque élément)	Réglages > Accessibilité > VoiceOver	Accessibilité visuelle uniquement

La plupart des gens recherchent Énoncer la sélection ou Énoncer le contenu de l'écran pour la synthèse vocale iPhone. VoiceOver est un système de navigation complet pour les utilisateurs malvoyants qui décrit chaque tapotement, bouton et geste. Activer VoiceOver alors que vous voulez simplement qu'un article soit lu à haute voix via la synthèse vocale iOS rendra votre téléphone presque inutilisable jusqu'à ce que vous trouviez comment le désactiver (ce qui nécessite un schéma de tapotement différent une fois activé).

Ne touchez pas à VoiceOver à moins d'en avoir spécifiquement besoin.

Activer la synthèse vocale : La configuration en 2 minutes

Étape par étape pour iOS 17 et iOS 18

Ouvrez les Réglages
Appuyez sur Accessibilité
Appuyez sur Contenu énoncé
Activez Énoncer la sélection (lit le texte surligné)
Activez Énoncer le contenu de l'écran (lit tout l'écran)
Ajustez le curseur Débit vocal. Par défaut, il est d'environ 180 mots par minute. La plupart des gens trouvent que 200-220 mots/min est une vitesse d'écoute confortable. Expérimentez.
Appuyez sur Voix pour changer la voix par défaut (plus d'infos ci-dessous)

C'est tout. Les deux fonctionnalités sont maintenant actives.

Comment déclencher chacune d'elles

Énoncer la sélection : Dans n'importe quelle application, faites un appui long pour sélectionner du texte. Dans le menu contextuel au-dessus de la sélection, appuyez sur Énoncer. (Si vous ne voyez pas « Énoncer », appuyez sur la flèche droite dans le menu pour le trouver.)

Énoncer le contenu de l'écran : Balayez vers le bas depuis le haut de l'écran avec deux doigts. Un petit contrôleur audio apparaît avec les fonctions lecture/pause, avance, retour, réglage de la vitesse et un bouton de fermeture. Ce contrôleur flotte au-dessus de votre contenu et reste actif jusqu'à ce que vous le fermiez.

Le geste de balayage à deux doigts est celui que la plupart des gens ne découvrent jamais. Il transforme votre iPhone en lecteur de podcast pour n'importe quel texte à l'écran.

Choisir une voix qui ne ressemble pas à un robot de 2012

Apple propose des dizaines de voix dans de nombreuses langues, et l'écart de qualité entre les options par défaut et les options premium est spectaculaire. La plupart des utilisateurs ne changent jamais la voix par défaut, ce qui signifie qu'ils écoutent une voix compacte optimisée pour la taille du fichier plutôt que pour le naturel.

Comment télécharger de meilleures voix

Allez dans Réglages > Accessibilité > Contenu énoncé > Voix
Appuyez sur votre langue (ex: Français)
Vous verrez une liste de noms de voix. Les voix avec une icône de téléchargement ne sont pas encore installées.
Appuyez sur le nom d'une voix pour l'écouter. Appuyez sur l'icône de téléchargement pour l'installer.
Les voix premium sont marquées « Améliorée » ou « Premium ». Leur taille varie de 100 Mo à 500 Mo.

Quelles voix valent vraiment la peine d'être téléchargées

Pour le français, les meilleures options d'Apple au moment d'iOS 18 :

Thomas (Premium) : Très clair et naturel pour le français de France.
Siri Voix 1 / Voix 2 : Les nouvelles voix Siri sont basées sur des réseaux neuronaux et sonnent plus naturellement que les anciennes options, bien qu'elles conservent une qualité « numérique » sur les passages longs.

Pour les autres langues, la qualité varie. L'anglais, le japonais, le mandarin et l'espagnol disposent de voix premium décentes.

Conclusion : passez 5 minutes à télécharger 2 ou 3 voix premium et comparez-les. La différence entre la voix compacte par défaut et un téléchargement premium est la différence entre tolérer le TTS et l'apprécier réellement.

Utiliser la synthèse vocale dans les applications iPhone

Une fois le « Contenu énoncé » activé, il fonctionne dans presque toutes les applications. Mais le terme « fonctionner » signifie des choses différentes selon le contexte.

Safari

Balayez vers le bas avec deux doigts sur n'importe quelle page d'article pour activer Énoncer le contenu de l'écran (synthèse vocale iPhone). La lecture commence au début du contenu visible. Pour une expérience optimale, appuyez d'abord sur l'icône Mode Lecture (l'icône des lignes dans la barre d'adresse). Le mode lecture supprime les publicités, la navigation et le contenu de la barre latérale, de sorte que la voix ne lit que le corps de l'article au lieu d'annoncer « Menu. Accueil. À propos. S'abonner. Bannière de cookies ».

Cette astuce du mode lecture à elle seule réduit de moitié le facteur d'agacement.

Notes

Énoncer la sélection fonctionne sur les notes individuelles. Sélectionnez le texte, appuyez sur Énoncer. Énoncer le contenu de l'écran lit toute la note. Utile pour réviser ses propres écrits à l'oreille. Si une phrase sonne mal à l'oral, elle est généralement mal écrite aussi.

Mail

Sélectionnez le corps d'un e-mail et appuyez sur Énoncer, ou balayez avec deux doigts pour lire l'e-mail complet. Les longs fils d'e-mails fonctionnent, mais peuvent devenir confus car la voix lit tout le fil, y compris les réponses citées. Sélectionnez uniquement le message le plus récent pour de meilleurs résultats.

Livres (Apple Books)

Apple Books possède sa propre synthèse vocale intégrée (synthèse vocale iOS) distincte du Contenu énoncé. Ouvrez un livre, touchez la page, touchez le menu Aa, et cherchez une option « Écouter » ou audio (la disponibilité varie selon le livre et la version d'iOS). La qualité correspond généralement à vos réglages de voix de Contenu énoncé.

Kindle

Énoncer le contenu de l'écran (synthèse vocale iPhone) fonctionne dans l'application Kindle via un balayage à deux doigts. La voix lit la page visible. Vous devrez passer manuellement à la page suivante une fois terminée, ce qui est peu pratique pour les longues sessions de lecture. Il n'y a pas d'intégration de changement de page automatique entre le Contenu énoncé et Kindle.

PDF (dans l'application Fichiers)

Ouvrez un PDF dans l'application Fichiers. Balayez vers le bas avec deux doigts. La voix lit le texte sélectionnable du PDF. Les PDF scannés sans couche de texte OCR ne fonctionneront pas. Si votre PDF est silencieux, c'est probablement une image scannée plutôt qu'un document texte, il ne sera donc pas supporté par la synthèse vocale iOS.

Applications tierces

Énoncer la sélection fonctionne dans la plupart des applications qui affichent du texte : Notion, Google Docs, Slack, WhatsApp, Reddit, Twitter/X. Le balayage à deux doigts (Énoncer le contenu de l'écran) est moins fiable dans les applications tierces car il lit tous les éléments d'interface visibles, pas seulement le contenu. Énoncer la sélection avec une sélection manuelle est généralement plus précis.

4 réglages qui rendent le TTS de l'iPhone vraiment utilisable

La configuration par défaut du Contenu énoncé fonctionne, mais quatre ajustements rapides la rendent nettement meilleure.

1. Surligner le contenu pendant la lecture. Allez dans Réglages > Accessibilité > Contenu énoncé et activez Surligner le contenu. Choisissez de surligner les mots, les phrases ou les deux. Cela vous permet de suivre visuellement pendant l'écoute, ce qui est extrêmement utile pour relire vos propres écrits.

2. Régler correctement votre vitesse. Le débit vocal par défaut est trop lent pour la plupart des auditeurs. Augmentez-le à 1.3x-1.5x (environ 220-270 mots/min). Vous pouvez également ajuster la vitesse en temps réel à l'aide du contrôleur flottant qui apparaît pendant l'énonciation de l'écran.

3. Ajouter des corrections de prononciation. Allez dans Réglages > Accessibilité > Contenu énoncé > Prononciation. Vous pouvez ajouter des règles de prononciation personnalisées pour les mots que la voix déforme systématiquement : noms de marques, termes techniques et noms de personnes. Chaque entrée vous permet de taper le mot puis d'épeler comment il doit être prononcé phonétiquement.

4. Créer un raccourci Toucher le dos de l'appareil. Allez dans Réglages > Accessibilité > Toucher > Toucher le dos de l'appareil. Réglez le double ou triple toucher pour déclencher « Énoncer le contenu de l'écran ». Vous pouvez maintenant lancer le TTS en tapotant deux fois l'arrière de votre iPhone au lieu de faire le geste de balayage à deux doigts, parfois délicat à une main.

Ce raccourci est un petit changement qui donne l'impression que la fonctionnalité a été conçue pour un usage quotidien plutôt que d'être enterrée dans les menus d'accessibilité.

Comment désactiver la synthèse vocale (et arrêter VoiceOver si vous l'avez activé par erreur)

Arrêter une lecture en cours

Appuyez sur le bouton X du contrôleur audio flottant, ou utilisez à nouveau le geste de balayage vers le bas à deux doigts pour désactiver Énoncer le contenu de l'écran. Pour Énoncer la sélection, touchez simplement n'importe où ailleurs sur l'écran.

Désactiver complètement le Contenu énoncé

Allez dans Réglages > Accessibilité > Contenu énoncé
Désactivez Énoncer la sélection
Désactivez Énoncer le contenu de l'écran

Urgence : VoiceOver est activé et votre téléphone dicte tout

C'est le scénario de panique. Vous avez activé VoiceOver par erreur, et maintenant chaque tapotement est commenté, et le geste normal de toucher pour sélectionner ne fonctionne plus. VoiceOver change tout le modèle d'interaction : un simple tapotement lit un élément à haute voix ; un double tapotement l'active.

La solution la plus rapide : Dites à Siri : « Désactive VoiceOver ». Cela fonctionne même si vous ne pouvez pas naviguer sur l'écran.

Si Siri n'est pas disponible :

Appuyez une fois sur Réglages (VoiceOver le lit à haute voix)
Appuyez deux fois sur Réglages (pour l'ouvrir)
Appuyez une fois sur Accessibilité, puis deux fois pour ouvrir
Appuyez une fois sur VoiceOver, puis deux fois pour ouvrir
Appuyez une fois sur le commutateur VoiceOver, puis deux fois pour le désactiver

Si vous avez un Mac : Connectez votre iPhone, ouvrez le Finder (ou iTunes sur les anciens macOS) et gérez les réglages d'accessibilité à partir de là.

Le point clé à retenir : avec VoiceOver activé, tout se fait par un simple tap pour sélectionner et un double tap pour activer. Une fois ce modèle assimilé, vous pouvez naviguer jusqu'au commutateur. Mais demander à Siri est plus rapide.

Les limites : Ce que le TTS de l'iPhone ne peut pas faire

La synthèse vocale intégrée d'Apple sur iPhone est impressionnante pour une fonctionnalité système, mais elle a des limites claires :

Pas d'exportation audio. La voix lit le texte via votre haut-parleur ou vos écouteurs. Il n'y a aucun moyen d'enregistrer l'audio en MP3, WAV ou tout autre fichier utilisable dans une vidéo, un podcast ou une présentation.
Pas de clonage de voix. Vous ne pouvez pas créer une voix qui vous ressemble ou qui correspond à l'identité d'une marque spécifique.
Une voix, une personnalité. Vous ne pouvez pas assigner des voix différentes à différents personnages dans une histoire, à différents interlocuteurs dans une transcription ou à différentes sections d'un document.
Contrôle limité de l'émotion et du rythme. Un curseur de vitesse est le seul réglage. Vous ne pouvez pas accentuer une phrase spécifique, insérer des pauses dramatiques ou changer de ton émotionnel au milieu d'un paragraphe.
Écart de qualité multilingue. Si les voix premium françaises et anglaises sont bonnes, de nombreuses autres langues ne disposent que de voix compactes au son plat et robotique.
Dérive de la prosodie sur le contenu long. Même les voix premium commencent à paraître monotones après 5 à 10 minutes de lecture continue. Le rythme s'aplatit, l'accentuation disparaît et l'écoute devient fatigante.

Pour un usage personnel (écouter des articles pendant un trajet, relire des notes avant un cours), ces limites importent peu. Pour tout audio que vous souhaiteriez partager avec un public, elles comptent énormément.

Quand votre iPhone a besoin d'un meilleur moteur vocal

Dès que vous avez besoin d'un audio sous forme de fichier, qui sonne comme un vrai narrateur, ou qui fonctionne dans plusieurs langues sans perte de qualité, vous franchissez la ligne entre la « fonctionnalité iPhone » et l'« outil de production ».

Fish Audio comble toutes les lacunes laissées par iOS et fonctionne directement dans le navigateur de votre iPhone.

Plus de 2 000 000 de voix que vous pouvez réellement parcourir. La bibliothèque TTS de Fish Audio vous permet de filtrer par langue, accent, sexe et ton. Besoin d'un narrateur calme et chaleureux pour une application de méditation ? D'une voix percutante et énergique pour un YouTube Short ? La bibliothèque est catégorisée pour des cas d'utilisation réels, pas seulement listée par ordre alphabétique. Des fichiers audio que vous pouvez réellement utiliser. Générez et téléchargez des fichiers MP3 ou WAV directement sur votre iPhone. Intégrez-les dans iMovie, un éditeur de podcast, une plateforme de cours, ou partagez-les comme bon vous semble. Pas besoin de bidouillages d'enregistrement d'écran.

Clonage de voix en 15 secondes depuis votre iPhone. Enregistrez un échantillon de 15 secondes avec le micro de votre iPhone, téléchargez-le sur l'outil de clonage de voix de Fish Audio, et chaque texte que vous convertirez à partir de là aura votre voix. Enregistrez l'échantillon dans Dictaphone, téléchargez-le, et c'est fait.

8 langues avec une qualité constante. Le modèle de Fish Audio conserve une prosodie naturelle dans tout son ensemble de langues. Une voix qui sonne humaine en français sonnera tout aussi humaine en japonais, arabe, portugais ou mandarin. Pas de chute brutale de qualité quand vous changez de langue.

Une prosodie qui tient 20 minutes, pas 2. La différence entre le TTS d'iOS et un moteur IA dédié est flagrante sur les contenus longs. Le modèle de Fish Audio conserve les variations émotionnelles, le rythme et l'accentuation sur des scripts étendus. Une voix off de 15 minutes sonne aussi naturellement à la 14ème minute qu'à la première.

Le flux de travail mobile

Écrivez ou copiez votre texte sur votre iPhone (Notes, Google Docs, e-mail, n'importe où)
Ouvrez Safari et allez sur fish.audio/text-to-speech
Collez votre texte
Choisissez une voix, ajustez les réglages
Générez et téléchargez le fichier audio
Utilisez-le n'importe où : iMovie, applications de podcast, partage via AirDrop, téléchargement sur votre plateforme de cours

Fish Audio propose une version gratuite pour tester réellement le service. Les plans payants commencent à 11 $ par mois pour environ 15 heures d'audio finalisé. La page de tarification contient tous les détails. Comparez cela à ce qu'iOS offre gratuitement (écoute seulement, pas d'exportation, voix limitées) et au coût d'un doubleur humain (100 à 500 $ par minute finalisée), et le calcul est vite fait.

Conclusion

Votre iPhone dispose d'un système de synthèse vocale performant qu'Apple cache derrière des réglages d'accessibilité que la plupart des gens n'ouvrent jamais. Deux commutateurs (Énoncer la sélection et Énoncer le contenu de l'écran), le téléchargement d'une voix premium et le raccourci Toucher le dos de l'appareil le transforment en un véritable outil pour écouter des articles, relire des brouillons et absorber du contenu en déplacement. Si VoiceOver prend le contrôle de votre téléphone, dites à Siri de le désactiver.

Mais le TTS d'iOS a été conçu pour lire du texte à haute voix sur le moment, pas pour produire de l'audio. Dès que vous avez besoin d'un fichier partageable, d'une voix qui correspond à votre marque ou d'une qualité qui ne faiblit pas après 5 minutes, Fish Audio prend le relais là où Apple s'arrête. Le texte que vous écrivez déjà sur votre téléphone est transformé en un audio de qualité professionnelle. Commencez avec la version gratuite et testez-la sur ce que vous lisez en ce moment même.

Créez des voix qui semblent réelles

Commencez à générer un son de la plus haute qualité dès aujourd'hui.

Inscrivez-vous gratuitement

Vous avez déjà un compte ? Se connecter

Partager cet article

Kyle Cui

Kyle is a Founding Engineer at Fish Audio and UC Berkeley Computer Scientist and Physicist. He builds scalable voice systems and grew Fish into the #1 global AI text-to-speech platform. Outside of startups, he has climbed 1345 trees so far around the Bay Area. Find his irresistibly clouty thoughts on X at @kile_sway.

Lire plus de Kyle Cui >