Как включить функцию «Текст в речь» на Windows, Mac, iPhone, Android и Chromebook

5 мар. 2026 г.

Руководство

Как включить функцию «Текст в речь» на Windows, Mac, iPhone, Android и Chromebook

Все основные операционные системы уже много лет поставляются со встроенной функцией синтеза речи (TTS). Она есть в Windows. Она есть в macOS. Она есть в вашем телефоне. Но, согласно опросам об использовании специальных возможностей, менее 12% пользователей когда-либо включали её. Не потому, что она им не нужна, а потому, что настройки спрятаны глубоко в меню, которые большинство людей никогда не открывают.

Эта функция может читать вслух электронные письма, статьи, документы и целые веб-страницы. Включение занимает меньше минуты на любом устройстве. Но чтобы получить голос, который не заставит вас пожалеть о принятом решении, потребуется чуть больше усилий.

Windows 10 и 11

Windows предлагает две отдельные функции TTS. Экранный диктор (Narrator) — это полноценное средство чтения с экрана, которое озвучивает всё происходящее. Чтение вслух (Read Aloud) — более легкий инструмент, встроенный в конкретные приложения Microsoft.

Включение Экранного диктора

Экранный диктор читает все элементы интерфейса: кнопки, меню, уведомления и основной текст. Чтобы включить его:

Нажмите Win + Ctrl + Enter для мгновенной активации.
Или откройте Параметры > Специальные возможности > Экранный диктор (Windows 11) или Параметры > Специальные возможности > Экранный диктор (Windows 10) и переключите тумблер.

После активации Экранный диктор сразу начнет говорить. Несколько настроек, которые стоит изменить сразу:

Выбор голоса: В настройках Экранного диктора нажмите «Выберите голос», чтобы переключиться между установленными вариантами. Microsoft David и Microsoft Zira — стандартные варианты. Дополнительные голоса можно скачать в этом же меню.
Скорость и тембр: Настройте ползунок скорости речи. Стандартная скорость обычно слишком медленная для комфортного прослушивания. Начните с 60-70% и корректируйте по вкусу.
Подробность: Экранный диктор может озвучивать каждую деталь интерфейса или только самое важное. В разделе «Подробность» уменьшение уровня до 3 или 4 уберет повторяющиеся объявления типа «кнопка» и «флажок» после каждого элемента.

Использование функции «Чтение вслух» в Edge и Word

Для чтения конкретного контента, а не всего интерфейса, Microsoft Edge и Word предлагают функцию «Чтение вслух» с более качественными голосами, чем у Экранного диктора.

В Edge: Откройте любую веб-страницу, нажмите Ctrl + Shift + U или нажмите на меню из трех точек и выберите «Прочесть вслух». Сверху появится панель управления с настройками голоса и скорости.
В Word: Перейдите во вкладку Рецензирование > Чтение вслух. Функция начнет читать документ с того места, где стоит курсор.

При наличии интернет-соединения «Чтение вслух» использует облачные нейронные голоса Microsoft, которые звучат заметно естественнее офлайн-голосов Экранного диктора.

macOS

macOS разделяет TTS на два уровня. «Проговаривание контента» читает текст по запросу. VoiceOver — это полноценное средство чтения для навигации по всему интерфейсу с помощью голоса.

Включение проговаривания контента

Это вариант, который подходит большинству пользователей Mac. Он позволяет читать выделенный текст или весь экран без изменения принципов работы системы.

Откройте Системные настройки > Универсальный доступ > Проговаривание контента.
Включите Проговаривание выбранного текста, чтобы читать любой выделенный фрагмент с помощью горячих клавиш.
Включите Проговаривание экрана, чтобы озвучить всё, что видно на текущем экране.

После включения проговаривания выделенного текста выделите любой фрагмент и нажмите Option + Esc, чтобы услышать его. Появится небольшой контроллер с кнопками воспроизведения, паузы и регулировки скорости.

Что стоит настроить:

Системный голос: Нажмите на выпадающий список, чтобы просмотреть доступные голоса. Варианты с пометкой «Голос Siri» звучат гораздо естественнее устаревших голосов, таких как Alex или Samantha.
Скорость речи: По умолчанию она довольно низкая. Сдвиньте ползунок вправо, пока голос не станет звучать как в живой беседе.
Показывать контроллер: Включите эту опцию, чтобы панель управления речью всегда была под рукой.

Включение VoiceOver

VoiceOver — это полнофункциональное средство чтения экрана в macOS. Оно озвучивает каждый элемент интерфейса и меняет способ навигации. Большинству пользователей VoiceOver не нужен, если только они не полагаются на него по медицинским показаниям.

Нажмите Cmd + F5, чтобы включить или выключить VoiceOver.
Или перейдите в Системные настройки > Универсальный доступ > VoiceOver и переключите тумблер.

VoiceOver требует привыкания. Когда он активен, вы перемещаетесь с помощью клавиатурных сокращений, а не кликов мышью, и система озвучивает каждый элемент в фокусе. Apple предлагает встроенное руководство, доступное в панели настроек VoiceOver.

iPhone и iPad

iOS предлагает несколько вариантов TTS: от чтения одного выделенного предложения до озвучивания всего экрана.

Включение проговаривания выделенного и экрана

Эти две функции покрывают большинство потребностей, не меняя привычный способ управления устройством.

Перейдите в Настройки > Универсальный доступ > Проговаривание контента.
Включите Проговаривание: Добавляет кнопку «Произнести» в меню выделения текста. Выделите любой текст, нажмите «Произнести», и устройство прочитает его.
Включите Экран вслух: Смахните двумя пальцами вниз от верхнего края экрана, чтобы озвучить всю страницу. Появится контроллер воспроизведения с кнопками скорости и пропуска.

Дополнительные опции в этом же меню:

Выделение контента: Включите это, чтобы слова или предложения подсвечивались в реальном времени во время чтения.
Голоса: Нажмите здесь, чтобы загрузить улучшенные или премиум-пакеты голосов для вашего языка. Премиум-голоса занимают больше места, но звучат значительно лучше.
Скорость речи: Регулируется ползунком. Проверяйте её на реальном абзаце текста, а не на тестовой фразе.

Включение VoiceOver

VoiceOver на iOS — это полноценное средство чтения экрана, которое меняет сенсорные жесты. Одинарное касание выбирает объект и озвучивает его. Двойное касание — активирует.

Перейдите в Настройки > Универсальный доступ > VoiceOver и включите его.
Или скажите «Привет, Siri, включи VoiceOver».
Или трижды нажмите боковую кнопку, если вы настроили «Быструю команду» в разделе Настройки > Универсальный доступ > Быстрая команда.

Так как VoiceOver меняет принцип работы касаний и свайпов, он может дезориентировать, если вы включили его случайно. Эти изменения жестов сделаны специально для пользователей, которые ориентируются по звуку, а не визуально.

Android

Функции TTS в Android включают TalkBack для чтения всего экрана, «Озвучивание при нажатии» для чтения по запросу и системный движок TTS, к которому могут обращаться другие приложения.

Включение функции «Озвучивание при нажатии»

Для большинства пользователей «Озвучивание при нажатии» (Select to Speak) — лучший выбор. Оно читает то, на что вы нажмете, не меняя способ управления устройством.

Перейдите в Настройки > Спец. возможности > Озвучивание при нажатии.
Включите функцию.
На экране появится небольшая иконка. Нажмите на неё, а затем на текст или выделите область, которую нужно прочитать.

На устройствах Samsung путь может быть следующим: Настройки > Специальные возможности > Установленные приложения > Озвучивание при нажатии.

Включение TalkBack

TalkBack — это аналог VoiceOver для Android. Он озвучивает каждый элемент и меняет поведение сенсора на модель «выбор, затем активация».

Перейдите в Настройки > Спец. возможности > TalkBack и включите его.
Или зажмите обе кнопки громкости на 3 секунды (на Android 9 и выше), чтобы включить TalkBack.

Как и в случае с VoiceOver, TalkBack меняет жесты:

Одинарное касание выбирает и озвучивает элемент.
Двойное касание активирует его.
Свайп двумя пальцами прокручивает страницу.
Свайп одним пальцем вправо или влево перемещает фокус на следующий или предыдущий элемент.

Настройка движка TTS

Android позволяет выбрать, какой движок TTS будет отвечать за всю речь в системе.

Перейдите в Настройки > Спец. возможности > Синтез речи, или на Samsung: Настройки > Общие настройки > Язык и ввод > Синтез речи.
Выберите предпочитаемый движок. Движок от Google предустановлен на большинстве устройств. Samsung предлагает свою альтернативу.
Нажмите на иконку шестеренки рядом с движком, чтобы скачать дополнительные языковые пакеты.
Используйте ползунки «Скорость речи» и «Тон», чтобы настроить звучание.

Chromebook

В ChromeOS все настройки TTS собраны в одном месте, что упрощает настройку.

Включение «Озвучивания при нажатии»

Перейдите в Настройки > Специальные возможности > Синтез речи.
Включите Озвучивание при нажатии.
Нажмите на иконку функции в системном трее, а затем выделите любой текст на экране.

Включение ChromeVox

ChromeVox — это полноценное средство чтения экрана для ChromeOS.

Нажмите Ctrl + Alt + Z, чтобы включить или выключить ChromeVox.
Или активируйте его в разделе Настройки > Специальные возможности > Синтез речи > ChromeVox.

ChromeVox начнет озвучивание сразу после активации. Он использует движок Google TTS (как и Android) и поддерживает те же языковые пакеты.

В чем встроенные голоса хороши, а в чем — нет

Вы включили TTS. Буквально через 30 секунд прослушивания вы заметите определенную закономерность.

Встроенные голоса хорошо справляются с короткими простыми предложениями. Они правильно произносят обычные слова, делают паузы на точках и сохраняют стабильную скорость. Для чтения уведомления или СМС из двух строк они вполне подходят.

Проблемы начинаются на длинном контенте. Попробуйте прочитать целую статью любым встроенным голосом и обратите внимание на следующие признаки:

Отсутствие акцентов: Каждое предложение звучит одинаково. Важные слова не выделяются. Вопросы не имеют характерного повышения интонации, как у человека.
Странный темп у пунктуации: Точки с запятой, двоеточия и фразы в скобках сбивают большинство движков с толку. Голос либо игнорирует их, либо делает неестественно длинные паузы.
Ошибки произношения: Технические термины, названия брендов и иностранные слова часто коверкаются. Голос выбирает одно произношение и повторяет ошибку каждый раз.
Усталость слушателя: Через 2-3 минуты монотонность начинает утомлять мозг. Это главная причина, по которой люди выключают TTS вскоре после включения.

Это не ошибки. Встроенные движки TTS оптимизированы для малого веса, работы без интернета и универсальной совместимости. Качество звука — это то, чем пришлось пожертвовать.

ИИ-синтез речи меняет правила игры

Если вы включили TTS в надежде слушать статьи, проверять свои тексты на слух или создавать озвучку, и встроенный голос вас разочаровал — проблема не в самой функции. Проблема в движке.

ИИ-платформы, такие как Fish Audio, используют нейронные модели, обученные на человеческой речи. Вместо склеивания фрагментов слогов, эти модели генерируют аудио с нуля, передавая ритм, акценты и тональные нюансы, которые делают речь живой. Разница заметна с первого же предложения.

Вот что предлагает Text to Speech от Fish Audio по сравнению со встроенными средствами:

Стилистическое управление: Более 64 эмоциональных и стилистических настроек, охватывающих практически любые потребности — от радости и печали до гнева и спокойствия.
Естественная просодия: Движок делает акцент на важных словах, смягчает переходы и меняет темп в зависимости от структуры предложения. Вопрос звучит как вопрос. Список — как список. Встроенный TTS читает всё с одинаковым весом.
Поддержка 13 языков с кросс-языковыми возможностями: Переключайтесь между английским, китайским, испанским, японским и другими языками даже внутри одного абзаца без потери качества произношения.
Работа в браузере: Не нужно ничего устанавливать. Перейдите на fish.audio/text-to-speech, вставьте текст, выберите голос и получите готовый аудиофайл.

Клонирование голоса для контента

Для создателей контента, которым нужен один и тот же голос в разных проектах, Fish Audio's Voice Cloning позволяет создать индивидуальную модель всего по 10 секундам записи. Модель изучает тон, ритм и текстуру голоса спикера, а затем применяет эти характеристики к любому тексту.

Практическое применение:

Производство для YouTube и подкастов: Генерируйте закадровый текст стабильным голосом без необходимости записывать каждый сценарий.
Мультиязычный контент: Клонированный голос сохраняет свой характер при генерации речи на разных языках.
Единство бренда: Используйте один и тот же голос в рекламе, руководствах и общении с клиентами без аренды студии для каждого обновления.

API для разработчиков

Fish Audio's API открывает доступ ко всем возможностям TTS и клонирования голоса для программного использования. Время отклика измеряется миллисекундами, есть поддержка потоковой передачи, что позволяет создавать голосовые приложения в реальном времени без задержек.

Подробности о ценах и планах доступны на fish.audio/plan. Для тестирования доступен бесплатный уровень.

Заключение

Включение синтеза речи занимает меньше минуты на любой платформе. Win + Ctrl + Enter в Windows, Option + Esc на Mac, свайп двумя пальцами на iPhone, «Озвучивание при нажатии» на Android, Ctrl + Alt + Z на Chromebook. Эта функция уже есть в вашем устройстве и ждет своего часа.

Более важный вопрос — захотите ли вы оставить её включенной. Встроенные голоса годятся для быстрых задач и базовой доступности, но они не создавались для долгого прослушивания или создания контента. Если стандартный голос заставляет вас нажать кнопку выключения через пару минут, попробуйте TTS от Fish Audio, прежде чем окончательно отказываться от этой идеи. Разница между предустановленным движком и современным ИИ-голосом — это разница между тем, чтобы просто терпеть речь, и тем, чтобы действительно предпочитать её чтению.

Часто задаваемые вопросы

Вы можете использовать сочетание клавиш Win + Ctrl + Enter для запуска Экранного диктора или нажать Ctrl + Shift + U в браузере Microsoft Edge для использования функции «Чтение вслух».

Встроенные голоса часто звучат монотонно и ошибаются в интонациях. ИИ-модели Fish Audio передают естественный ритм, эмоции и правильные логические ударения, что делает прослушивание приятным и менее утомительным.

Да, вы можете использовать Fish Audio через веб-интерфейс на любом мобильном устройстве, просто вставив нужный текст на сайте [fish.audio](https://fish.audio/).

Создавайте голоса, которые звучат естественно

Начните создавать аудио высочайшего качества уже сегодня.

Зарегистрироваться бесплатно

Уже есть аккаунт? Войти

Поделиться этой статьей

Kyle Cui

Kyle is a Founding Engineer at Fish Audio and UC Berkeley Computer Scientist and Physicist. He builds scalable voice systems and grew Fish into the #1 global AI text-to-speech platform. Outside of startups, he has climbed 1345 trees so far around the Bay Area. Find his irresistibly clouty thoughts on X at @kile_sway.

Читать больше от Kyle Cui >