Guide complet de la saisie vocale sur Mac : paramètres et utilisation de la dictée macOS

28 févr. 2026

Guide complet de la saisie vocale sur Mac : paramètres et utilisation de la dictée macOS

Huit heures de frappe, 4 000 mots, et vos poignets vous rappellent qu'ils ont des limites. Vous activez la saisie vocale sur Mac (Dictée Mac), vous commencez à parler, et vous voyez les deux premières phrases s'afficher parfaitement. Puis vous vous arrêtez pour réfléchir pendant 30 secondes, et la Dictée Mac s'éteint toute seule. Vous la relancez, parlez plus vite cette fois, et remarquez qu'elle met des majuscules à des mots aléatoires et ignore chaque virgule. Au troisième redémarrage, vous avez passé plus de temps à lutter contre l'outil qu'à taper.

La fonctionnalité de dictée intégrée au Mac est plus performante que ce que la plupart des utilisateurs imaginent, mais son comportement par défaut est contre-intuitif, ses réglages sont répartis sur plusieurs panneaux système, et elle ne met pas en avant ses fonctions les plus utiles. Une personne moyenne tape 40 mots par minute. La saisie vocale sur Mac capture entre 130 et 160 mots par minute. Ce gain de vitesse de 3 à 4 fois est bien réel une fois la configuration optimisée, mais il ne vaut rien si la Dictée continue de s'arrêter automatiquement après environ 30 secondes de silence.

La Dictée Mac en 2026 : deux moteurs, une option déroutante

Apple propose actuellement deux systèmes de dictée dans macOS, et les différences entre eux affectent la précision, la confidentialité et la durée pendant laquelle vous pouvez dicter sans interruption.

Fonctionnalité	Dictée améliorée (Sur l'appareil)	Dictée standard (Basée sur le serveur)
Traitement	Sur votre Mac, pas besoin d'Internet	Serveurs Apple, nécessite Internet
Dictée continue	Oui, pas de limite de temps	S'arrête après des pauses
Confidentialité	L'audio ne quitte jamais votre appareil	Audio envoyé à Apple pour traitement
Précision	Très bonne pour les langues prises en charge	Légèrement meilleure pour les cas complexes
Stockage	1-2 Go à télécharger par langue	Aucun stockage local requis
Disponibilité	macOS Ventura 13+ avec Apple Silicon	Toutes les versions de macOS

Sur les Mac Apple Silicon équipés de macOS Ventura ou d'une version ultérieure, la dictée sur l'appareil est activée par défaut. Elle traite la parole localement via le Neural Engine, elle ne s'interrompt donc pas, ne nécessite pas de Wi-Fi et n'envoie pas votre audio aux serveurs d'Apple.

Sur les anciens Mac Intel, vous êtes limité à la dictée basée sur le serveur, qui nécessite une connexion Internet et a tendance à s'arrêter après de brèves pauses. C'est ce comportement d'arrêt automatique qui frustre la plupart des utilisateurs qui essaient la dictée une fois et abandonnent.

Si vous n'êtes pas sûr de la version que vous utilisez, allez dans Réglages Système > Clavier > Dictée. Si vous voyez la mention « Dictée sur l'appareil », vous utilisez le moteur local.

Configurer la Dictée : la bonne méthode (pas la plus évidente)

La plupart des gens découvrent la Dictée par accident en appuyant sur la touche microphone de leur clavier. La configuration est simple, mais deux réglages peu évidents modifient considérablement l'expérience.

Configuration de base

Ouvrez les Réglages Système (Menu Apple > Réglages Système)
Cliquez sur Clavier dans la barre latérale
Faites défiler jusqu'à Dictée et activez l'option
Choisissez votre Langue (vous pouvez en ajouter plusieurs)
Définissez votre Raccourci (par défaut, il faut appuyer deux fois sur la touche Fn, mais « Appuyer sur Fn » ou un raccourci personnalisé est également possible)
Si on vous le demande, téléchargez le modèle de reconnaissance vocale local pour votre langue

Les deux réglages que la plupart des gens oublient

Ponctuation automatique. Depuis macOS Sonoma, Apple a activé la ponctuation automatique par défaut. La Dictée insère des points, des virgules et des points d'interrogation en fonction de votre débit de parole, sans que vous ayez à dire « point » ou « virgule » à voix haute. Si cela ne fonctionne pas, assurez-vous d'utiliser macOS 14 ou une version ultérieure et que votre langue de dictée est l'anglais, l'espagnol, le français, l'allemand, l'italien, le portugais, le chinois, le coréen ou le japonais (la ponctuation automatique ne supporte pas encore toutes les langues).

Source du microphone. Par défaut, macOS utilise le microphone configuré dans le système. Si la précision est médiocre, le problème est souvent matériel et non logiciel. Allez dans Réglages Système > Son > Entrée et assurez-vous qu'il pointe vers votre meilleur micro. Même un micro USB bon marché, placé près de votre bouche, améliore souvent la précision de la dictée par rapport au micro intégré.

Comment dicter concrètement sur Mac (application par application)

Une fois la Dictée Mac activée, l'activation est la même partout : appuyez sur votre raccourci (par défaut : Fn deux fois), parlez, puis appuyez à nouveau sur le raccourci pour arrêter. Mais le comportement varie légèrement selon les applications.

Pages et TextEdit

L'expérience de dictée la plus fluide sur Mac. Placez votre curseur, activez la Dictée Mac et parlez. Le texte apparaît en temps réel. Vous pouvez dicter en continu tout en alternant entre la frappe et la parole. Sur macOS Sonoma et versions ultérieures, vous n'avez pas besoin d'arrêter la Dictée Mac pour effectuer une correction rapide au clavier.

Notes

Idéal pour le brainstorming et les notes de réunion. Une astuce utile : créez une nouvelle note, lancez la Dictée et utilisez-la comme un bloc-notes vocal. Notes se synchronise avec iCloud, votre texte dicté est donc immédiatement disponible sur votre iPhone et iPad.

Mail

La Dictée Mac fonctionne dans la fenêtre de rédaction. Utile pour les longues réponses aux e-mails où taper devient fastidieux. Un bémol : si vous dictez une URL ou une adresse e-mail, la précision chute considérablement. Épelez-les lettre par lettre ou tapez-les manuellement.

Safari et Chrome (champs de texte)

La dictée fonctionne dans n'importe quel champ de texte Web, y compris Google Docs, Notion, Slack et les zones de texte des réseaux sociaux. Cela dit, les éditeurs de texte Web gèrent parfois l'insertion en temps réel différemment, ce qui peut provoquer des sauts de curseur. Si vous remarquez que le texte apparaît au mauvais endroit, cliquez pour repositionner votre curseur et redémarrez la Dictée.

Terminal

La dictée fonctionne techniquement dans le Terminal, mais ce n'est pas pratique. La syntaxe des commandes, les drapeaux et les chemins de fichiers se prêtent mal à la reconnaissance vocale. Privilégiez la frappe pour le Terminal.

Commandes vocales : transformer la dictée en véritable édition

La plupart des utilisateurs Mac dictent du texte, puis reprennent le clavier et la souris pour tout corriger. C'est perdre la moitié de la valeur ajoutée. macOS prend en charge des commandes vocales pour la ponctuation, le formatage et l'édition de base, éliminant ainsi la majeure partie du nettoyage post-dictée.

Ponctuation (à dire pendant la dictée) :

« Point »
« Virgule »
« Point d'interrogation »
« Point d'exclamation »
« Deux-points » / « Point-virgule »
« Ouvrir les guillemets » ... « Fermer les guillemets »
« Ouvrir la parenthèse » ... « Fermer la parenthèse »
« Tiret » (insère un trait d'union)
« Points de suspension »

Contrôle des lignes et des paragraphes :

« Nouvelle ligne » (passe à la ligne suivante)
« Nouveau paragraphe » (insère un saut de paragraphe)
« Touche Tabulation »

Commandes d'édition :

« Sélectionner le mot précédent » / « Sélectionner le mot suivant »
« Tout sélectionner »
« Supprimer ça » (supprime la dernière phrase dictée)
« Annuler »
« Majuscules activées » ... « Majuscules désactivées » (pour les passages TOUT EN MAJUSCULES)
« Chiffre [nombre] » (force le format numérique, ex : « chiffre 5 » → 5 au lieu de « cinq »)

Voici ce que la plupart des gens ignorent : vous pouvez mélanger la frappe et la dictée en temps réel sur macOS Sonoma et versions ultérieures. Dictez un paragraphe, utilisez votre souris pour cliquer ailleurs, tapez une correction, puis reprenez la dictée. L'ancien comportement « Dictée OU frappe, mais pas les deux » n'existe plus sur les systèmes récents.

Les 5 ennemis de la précision (et comment y remédier)

Si la précision de votre Dictée Mac vous semble inférieure à ce qu'elle devrait être, l'un de ces cinq facteurs est presque toujours en cause.

1. Microphone intégré d'un ordinateur portable dans une pièce bruyante. Le premier ennemi de la précision. Les micros des MacBook sont conçus pour les appels FaceTime, pas pour la dictée continue. Un micro statique USB (15-30 €), placé à 15-20 cm de votre bouche, fera passer la précision d'environ 85 % à plus de 95 % dans un environnement calme.

2. Parler trop vite sans faire de pauses. La dictée traite la parole par segments. Si vous enchaînez les phrases sans pauses naturelles, le modèle perd les limites du contexte et attribue mal les mots. Parlez à un rythme conversationnel avec des pauses de 0,5 seconde entre les phrases. Plus lent que votre débit naturel, mais plus rapide qu'une élocution trop hachée.

3. Accent ou dialecte non standard. Le modèle d'Apple gère bien les principaux accents, mais il peut peiner avec des dialectes régionaux très marqués ou des accents étrangers prononcés. Le traitement sur l'appareil a tendance à être légèrement plus tolérant que celui basé sur le serveur car le modèle analyse le contexte en continu, mais l'écart reste notable pour les locuteurs ayant des schémas d'accentuation moins courants.

4. Bruit audio en arrière-plan. Musique, télévision, autres personnes qui parlent. Même à faible volume, les sons concurrents perturbent le modèle. Utilisez un casque pour votre audio et laissez le canal du micro propre pour votre voix uniquement.

5. Ne pas entraîner le système. macOS apprend de vos habitudes de dictée au fil du temps, mais seulement si vous corrigez les erreurs au clavier (et non en re-dictant par-dessus). Quand la Dictée se trompe sur un mot, cliquez dessus, tapez la correction et continuez. Sur plusieurs jours ou semaines, la précision s'améliorera pour votre vocabulaire et vos habitudes d'élocution spécifiques.

Les limites de la Dictée Mac (et les alternatives à utiliser)

La Dictée Mac est réellement efficace pour son usage prévu : transformer la parole en direct en texte en temps réel, pour un locuteur, un micro et une langue à la fois. Mais elle a des limites strictes que ni les mises à niveau de micro ni l'entraînement ne peuvent corriger.

Pas de transcription de fichiers audio. Vous ne pouvez pas soumettre à la Dictée un MP3, un enregistrement Zoom ou un mémo vocal. Elle ne traite que l'entrée micro en direct. Si vous avez une interview enregistrée, une conférence, un podcast ou une réunion qui nécessite une transcription, la Dictée ne peut pas vous aider.

Pas d'identification des locuteurs. La Dictée ne sait pas qui parle. Si vous transcrivez une interview entre deux personnes en la diffusant via vos haut-parleurs (l'astuce du retour audio), vous obtiendrez un bloc de texte indifférencié sans étiquettes de locuteurs.

Une seule langue par session. Vous pouvez dicter en français ou en anglais, mais pas les deux dans la même session. Changer de langue nécessite d'arrêter la Dictée Mac, de modifier le réglage de langue et de redémarrer la Dictée Mac. Pour les locuteurs bilingues ou les contenus multilingues, c'est un frein majeur au flux de travail.

Pas d'horodatage. La Dictée produit du texte brut. Il n'y a aucun moyen d'obtenir des horodatages pour se référer à l'audio, ce qui est crucial pour les journalistes, les chercheurs ou toute personne ayant besoin de lier une transcription à un moment précis d'un enregistrement.

Plafond de précision avec un audio imparfait. La Dictée suppose une parole claire et directe au micro. Dès que la qualité audio se dégrade, même légèrement (enregistrements téléphoniques, écho, bruit de rue), la précision tombe sous un seuil où corriger la transcription prend plus de temps que de tout retaper de zéro.

De la dictée en direct à la transcription audio complète avec Fish Audio

Lorsque vos besoins dépassent la simple « dictée de vos propres pensées » pour passer à la « transcription d'audio enregistré », un outil de reconnaissance vocale dédié prend le relais exactement là où la Dictée Mac s'arrête.

Le Speech to Text de Fish Audio est conçu pour les scénarios que macOS ne peut pas gérer. Voici ce qui change :

Téléchargez n'importe quel fichier audio. MP3, WAV, M4A, interviews enregistrées, exports Zoom, mémos vocaux, épisodes de podcast. Déposez le fichier, récupérez la transcription. Pas d'astuces de lecture en direct, pas de routage audio complexe, pas d'attente en temps réel. En mode batch, la vitesse de traitement est généralement de 0,3 à 0,5 fois la durée de l'audio (par exemple, un fichier de 10 minutes peut être traité en 3 à 5 minutes), les fichiers plus longs prenant proportionnellement plus de temps.

Une précision qui résiste à l'audio réel. Le modèle de Fish Audio est entraîné sur diverses conditions d'enregistrement, notamment l'audio de qualité téléphonique, l'écho, le bruit de fond et les paroles qui se chevauchent. L'écart de précision entre un enregistrement en studio et une interview dans un café est bien plus réduit qu'avec la Dictée Mac.

Transcription multilingue sans changement de session. Fish Audio propose un service de Speech-to-Text supportant plus de 100 langues et dialectes. Sa FAQ STT mentionne explicitement l'anglais, le mandarin, le cantonais, le japonais et le coréen, et précise que le passage d'une langue à l'autre est géré automatiquement. Si votre enregistrement contient des alternances entre l'anglais et le mandarin ou l'espagnol et le portugais, le modèle gère les transitions linguistiques au sein du même fichier au lieu de nécessiter des sessions distinctes.

Le flux de travail pratique pour les utilisateurs Mac :

Premiers jets en direct et brainstorming : Utilisez la Dictée Mac. C'est gratuit, intégré et excellent pour la dictée en solo dans une pièce calme. Appuyez deux fois sur Fn, parlez, c'est fini.
Transcription d'audio enregistré : Utilisez Fish Audio STT. Téléchargez le fichier, obtenez une transcription propre et collez-la dans votre éditeur de texte sur Mac.
Production audio à partir de texte fini : Utilisez le TTS de Fish Audio avec plus de 2 000 000 de voix, le clonage de voix en 15 secondes et 8 langues.

Cette combinaison couvre l'ensemble du cycle voix-texte-voix. La Dictée Mac gère gratuitement la partie entrée en direct. Fish Audio gère tout ce qui nécessite le traitement de fichiers audio, le support multilingue ou une sortie de qualité professionnelle. Les deux outils se complètent plus qu'ils ne se concurrencent.

Quel est le coût ?

Le forfait gratuit de Fish Audio est suffisamment généreux pour tester des enregistrements réels, pas seulement des extraits. Les plans payants commencent à 11 $ par mois pour 600 000 caractères de sortie TTS, avec l'utilisation STT incluse. Pour comparaison : un service de transcription humaine professionnelle facture entre 1 et 3 $ par minute audio. Une transcription d'entretien de 60 minutes coûterait entre 60 et 180 $ et prendrait 24 à 48 heures. Fish Audio traite le même fichier en moins de 2 minutes. Les tarifs complets sont ici.

Conclusion

La Dictée Mac est la fonctionnalité de productivité la plus sous-utilisée de macOS. Configurez-la correctement (bon microphone, moteur sur l'appareil, ponctuation automatique activée), apprenez dix commandes vocales, et vous rédigerez du contenu à une vitesse 3 à 4 fois supérieure à celle de votre frappe, sans que vos poignets n'en pâtissent. Elle est réellement performante dans son domaine.

Ce qu'elle ne fait pas, c'est transcrire des enregistrements, gérer plusieurs langues dans une session ou traiter un audio qui n'a pas été dicté directement dans le micro de votre Mac. Pour ces besoins, la solution la plus simple est de conserver la Dictée Mac pour la saisie en direct et d'ajouter Fish Audio pour tout le reste : la transcription de fichiers en amont, et la génération de voix professionnelle en aval. Commencez par le forfait gratuit et testez-le sur n'importe quel enregistrement qui attend une transcription dans votre application Mémos vocaux.

Créez des voix qui semblent réelles

Commencez à générer un son de la plus haute qualité dès aujourd'hui.

Inscrivez-vous gratuitement

Vous avez déjà un compte ? Se connecter

Partager cet article

Kyle Cui

Kyle is a Founding Engineer at Fish Audio and UC Berkeley Computer Scientist and Physicist. He builds scalable voice systems and grew Fish into the #1 global AI text-to-speech platform. Outside of startups, he has climbed 1345 trees so far around the Bay Area. Find his irresistibly clouty thoughts on X at @kile_sway.

Lire plus de Kyle Cui >