Windows、Mac、iPhone、Android、Chromebookでテキスト読み上げ機能を有効にする方法
2026年3月5日
主要なオペレーティングシステムには、長年にわたりテキスト読み上げ機能が標準搭載されています。Windowsにも、macOSにも、そしてお使いのスマートフォンにも備わっています。しかし、アクセシビリティの使用状況調査によると、実際にこの機能をオンにしたことがあるユーザーは12%未満に過ぎません。これは、ユーザーが機能を求めていないからではなく、設定がほとんどの人が開かないようなメニューの奥深くに埋もれているためです。
この機能を使えば、メール、記事、ドキュメント、さらにはウェブページ全体を音声で読み上げることができます。どのデバイスでも、設定をオンにするのに1分もかかりません。ただし、使って後悔しないような「自然な声」を手に入れるには、もう少し工夫が必要です。
Windows 10 および 11
Windowsには、2つの独立したテキスト読み上げ(TTS)機能があります。「ナレーター」は画面上のすべてを読み上げるフルスクリーンリーダーであり、「音声で読み上げる(Read Aloud)」は特定のMicrosoftアプリに組み込まれたより軽量なツールです。
ナレーターを有効にする
ナレーターは、ボタン、メニュー、通知、本文など、すべてのインターフェース要素を読み上げます。有効にする方法は以下の通りです。
- Win + Ctrl + Enter を押すと即座に起動します。
- または、設定 > アクセシビリティ > ナレーター(Windows 11)または 設定 > コンピューターの簡単操作 > ナレーター(Windows 10)を開き、スイッチをオンにします。
有効になると、ナレーターがすぐに話し始めます。以下の設定をすぐに調整することをお勧めします。
- 音声の選択: ナレーターの設定で「音声を選択する」をクリックし、インストール済みのオプションから切り替えます。デフォルトは「Microsoft Ichiro」や「Microsoft Ayumi」などです。同じメニューから追加の音声をダウンロードすることも可能です。
- 速度とピッチ: 読み上げ速度のスライダーを調整します。デフォルトは快適に聴くには遅すぎることが多いため、60-70%あたりから始めて微調整するのが良いでしょう。
- 詳細度: ナレーターはUIの詳細をすべて読み上げるか、重要な情報のみに絞るかを選択できます。「詳細度」の設定でレベルを3または4に下げると、各要素の後に「ボタン」や「チェックボックス」といった繰り返しの説明を減らすことができます。
EdgeとWordで「音声で読み上げる」を使用する
インターフェース全体ではなく特定のコンテンツを読み上げたい場合、Microsoft EdgeとWordには、ナレーターよりも音質の良い「音声で読み上げる」機能が搭載されています。
- Edgeの場合: ウェブページを開き、Ctrl + Shift + U を押すか、右上の3点メニューから「音声で読み上げる」を選択します。画面上部に再生バーが表示され、音声や速度をコントロールできます。
- Wordの場合: 校閲 > 音声で読み上げる を選択します。カーソルの位置からドキュメントが読み上げられます。
「音声で読み上げる」は、インターネット接続時にMicrosoftのオンライン・ニューラル音声を使用するため、ナレーターのオフライン音声よりも格段に自然に聞こえます。
macOS
macOSでは、TTSが2つの階層に分かれています。「読み上げコンテンツ」はオンデマンドでテキストを読み上げ、「VoiceOver」は音声でインターフェース全体を操作するためのフルスクリーンリーダーです。
読み上げコンテンツを有効にする
ほとんどのMacユーザーに適しているのはこちらのオプションです。Macの操作感を変えることなく、ハイライトしたテキストや画面全体を読み上げます。
- システム設定 > アクセシビリティ > 読み上げコンテンツ を開きます。
- 選択項目を読み上げる をオンにすると、キーボードショートカットでハイライトしたテキストを読み上げられるようになります。
- 画面を読み上げる をオンにすると、現在の画面に表示されている内容をすべて読み上げます。
「選択項目を読み上げる」を有効にした後、テキストをハイライトして Option + Esc を押すと読み上げが始まります。再生、一時停止、速度調整ができる小さなコントローラーが表示されます。
推奨設定:
- システムの声: ドロップダウンをクリックして利用可能な音声を確認します。「Siriの音声」とラベル付けされているオプションは、AlexやSamanthaのような以前の音声よりも大幅に自然です。
- 読み上げ速度: デフォルトはやや遅めです。話し言葉として自然に聞こえるまでスライダーを上げてください。
- コントローラーを表示: これを有効にすると、読み上げ中に常に操作パネルが表示されるようになります。
VoiceOverを有効にする
VoiceOverはmacOSのフルスクリーンリーダーです。すべての要素を読み上げ、ナビゲーション方法も変わります。アクセシビリティ上の理由で必要としない限り、通常は使用しません。
- Cmd + F5 を押してVoiceOverのオン/オフを切り替えます。
- または、システム設定 > アクセシビリティ > VoiceOver で設定します。
VoiceOverには学習が必要です。有効にすると、マウスクリックではなくキーボードショートカットで操作することになり、システムがフォーカスされている各要素を読み上げます。AppleはVoiceOver設定パネル内にチュートリアルを用意しています。
iPhone および iPad
iOSには、ハイライトした1文の読み上げから画面全体のナレーションまで、複数のTTSオプションがあります。
「選択項目の読み上げ」と「画面の読み上げ」を有効にする
これら2つの機能は、デバイスの操作方法を変えずにほとんどの用途をカバーします。
- 設定 > アクセシビリティ > 読み上げコンテンツ に移動します。
- 選択項目の読み上げ をオンにする: テキスト選択メニューに「読み上げ」ボタンが追加されます。テキストをハイライトして「読み上げ」をタップすると、音声が流れます。
- 画面の読み上げ をオンにする: 画面の上から2本の指で下にスワイプすると、ページ全体が読み上げられます。速度、スキップ、一時停止を操作できるコントローラーが表示されます。
同じメニュー内の追加オプション:
- 内容を強調表示: 読み上げに合わせて単語や文章をリアルタイムでハイライトします。
- 声: 言語ごとの拡張またはプレミアム音声パックをダウンロードできます。プレミアム音声は容量が大きいですが、音質は格段に向上します。
- 読み上げ速度: スライダーで調整可能です。プレビュー用の短い文章ではなく、実際の文章でテストすることをお勧めします。
VoiceOverを有効にする
iOSのVoiceOverは、タッチジェスチャが変化するフルスクリーンリーダーです。1回タップで項目を選択して読み上げ、2回タップで実行します。
- 設定 > アクセシビリティ > VoiceOver でオンにします。
- または「Hey Siri、VoiceOverをオンにして」と頼みます。
- または、設定 > アクセシビリティ > ショートカット で設定していれば、サイドボタンをトリプルクリックして起動できます。
VoiceOverはタップやスワイプの仕組みを変えるため、慣れていないと混乱するかもしれません。これらのジェスチャの変更は、視覚情報ではなく音声情報を頼りに操作するユーザー向けに設計されています。
Android
AndroidのTTS機能には、フルスクリーン読み上げ用の「TalkBack」、オンデマンド読み上げ用の「選択して読み上げ」、および他アプリが利用できるシステムレベルのTTSエンジンが含まれます。
「選択して読み上げ」を有効にする
多くのユーザーにとって、「選択して読み上げ」が最も使いやすい機能です。操作方法を変えることなく、タップまたは選択した内容を読み上げます。
- 設定 > アクセシビリティ > 選択して読み上げ に移動します。
- 機能をオンにします。
- 画面上に小さなアイコンが表示されます。それをタップしてから、読み上げたいテキストをタップするか、なぞって選択します。
Samsungデバイスの場合、パスは 設定 > アクセシビリティ > インストール済みのアプリ > 選択して読み上げ となる場合があります。
TalkBackを有効にする
TalkBackはAndroid版のVoiceOverです。すべての要素をナレーションし、タッチ操作を「選択してから実行」モデルに変更します。
- 設定 > アクセシビリティ > TalkBack でオンにします。
- または、Android 9以降では両方の音量ボタンを3秒間長押しして切り替えることができます。
TalkBackを有効にすると、ジェスチャが以下のように変わります:
- 1回タップ: 項目を選択し、内容を読み上げます。
- 2回タップ: 項目を実行します。
- 2本指でスワイプ: ページをスクロールします。
- 1本指で左右にスワイプ: 次または前の項目へ移動します。
TTSエンジンの設定
Androidでは、システム全体の音声出力を担当するTTSエンジンを選択できます。
- 設定 > アクセシビリティ > テキスト読み上げの設定、またはSamsungデバイスでは 設定 > 一般管理 > 言語と入力 > テキスト読み上げ へ移動します。
- 優先するエンジンを選択します。ほとんどのデバイスにはGoogleのテキスト読み上げエンジンがプリインストールされています。Samsungは独自の代替エンジンを提供しています。
- エンジンの隣にある歯車アイコンをタップして、追加の言語パックをダウンロードできます。
- 「読み上げ速度」と「ピッチ」のスライダーを使用してカスタマイズします。
Chromebook
ChromeOSはTTSオプションが1箇所にまとまっているため、他のプラットフォームよりもセットアップが簡単です。
「選択して読み上げ」を有効にする
- 設定 > アクセシビリティ > テキスト読み上げ に移動します。
- 選択して読み上げ をオンにします。
- システムトレイの「選択して読み上げ」アイコンをクリックし、画面上のテキストをドラッグして選択すると読み上げが始まります。
ChromeVoxを有効にする
ChromeVoxはChromeOSのフルスクリーンリーダーです。
- Ctrl + Alt + Z を押してChromeVoxのオン/オフを切り替えます。
- または、設定 > アクセシビリティ > テキスト読み上げ > ChromeVox で有効にします。
ChromeVoxは有効にするとすぐにナレーションを開始します。Androidと同じGoogleのTTSエンジンを使用しており、同じ言語パックと音声オプションをサポートしています。
標準搭載の音声の長所と短所
TTSをオンにして30秒ほど聴いていると、あるパターンに気づくはずです。
標準搭載の音声は、短く単純な文章はうまくこなします。一般的な単語を正しく発音し、句読点で適切に停止し、一定の速度を維持します。通知や2行程度のテキストメッセージを読む分には十分です。
しかし、長いコンテンツになると限界が見えてきます。標準音声で記事全文を読み上げてみると、次のような問題に気づくでしょう。
- 抑揚の欠如: すべての文章が同じように聞こえます。重要な単語が強調されず、疑問文も人間の声のように語尾が上がりません。
- 句読点での不自然な間: セミコロン、コロン、括弧書きなどで多くのエンジンが混乱します。無視されるか、不自然に長い空白が入ります。
- 発音の誤り: 専門用語、ブランド名、外国語などが正しく読み上げられないことがあります。一度間違えると、その単語が出てくるたびに同じ間違いを繰り返します。
- 聞き疲れ: 2〜3分も聴いていると、単調な音質が精神的な負担になってきます。これが、TTSをオンにしてもすぐにオフにしてしまう主な理由です。
これらはバグではありません。標準搭載のTTSエンジンは、ファイルサイズを小さく抑え、オフラインで使用でき、汎用的な互換性を維持するために最適化されています。音質は、そのための妥協点なのです。
AI テキスト読み上げが状況を変える
もし記事を聴いたり、耳で校正したり、ボイスオーバーを作成したりするためにTTSを導入したのに、標準音声の質にがっかりしたなら、問題は「機能」ではなく「エンジン」にあります。
Fish Audio のようなAI音声プラットフォームは、人間の声を学習したニューラルモデルを使用しています。音節の断片をつなぎ合わせるのではなく、ゼロから音声を生成することで、話し声に命を吹き込むリズム、強調、音調の変化を再現します。その違いは、最初の1文を聴けば明らかです。
Fish Audio のテキスト読み上げが、デバイス標準のTTSと一線を画す点は以下の通りです:
- 多彩なスタイル制御: 業界をリードする64種類以上の感情・スタイル制御を備え、喜び、悲しみから怒り、落ち着きまで、ほぼすべての表現ニーズに対応します。
- 自然な韻律(プロソディ): エンジンが重要な単語を強調し、言葉のつなぎ目を滑らかにし、文章構造に基づいて速度を変化させます。疑問文は疑問文らしく、リストはリストらしく聞こえます。標準TTSのようにすべてを均一に読み上げることはありません。
- 13言語とクロスランゲージ対応: 英語、中国語、スペイン語、日本語など、同じ段落内であっても発音が崩れることなく切り替えが可能です。
- ブラウザベースのワークフロー: ソフトウェアのインストールは不要です。fish.audio/text-to-speech にアクセスし、テキストを貼り付けて声を選べば、ダウンロード可能な音声が生成されます。
一貫性を保つための音声クローン
複数のプロジェクトで同じ声を使いたいクリエイター向けに、Fish Audio の音声クローン(Voice Cloning) は、わずか10秒のリファレンス音声からカスタムモデルを作成します。モデルは話し手の声色、リズム、質感を学習し、それを新しいテキストに適用します。
主な活用例:
- YouTubeやポッドキャスト制作: すべてを録音することなく、一貫した声でナレーションを生成できます。
- 多言語コンテンツ: クローンされた音声は、異なる言語で音声を生成する際もそのキャラクターを維持します。
- ブランドボイスの統一: 広告、チュートリアル、顧客対応などで同じ声を使い続けることができ、更新のたびにスタジオを予約する必要がなくなります。
開発者向けAPIアクセス
Fish Audio API は、TTSと音声クローンエンジンの全機能をプログラムから利用できるように公開しています。レスポンスタイムはミリ秒単位で、ストリーミング再生もサポートしているため、リアルタイムの音声アプリケーションでもバッファリングを気にする必要がありません。
料金とプランの詳細は fish.audio/plan でご確認いただけます。テスト用の無料枠も用意されています。
まとめ
どのプラットフォームでも、テキスト読み上げ機能をオンにするのは1分もかかりません。Windowsなら Win + Ctrl + Enter、Macなら Option + Esc、iPhoneなら2本指スワイプ、Androidなら「選択して読み上げ」、Chromebookなら Ctrl + Alt + Z。その機能は、あなたのデバイスですでに待機しています。
より重要なのは、それを「使い続けたい」と思うかどうかです。標準の音声は、クイックな確認や基本的なアクセシビリティには役立ちますが、長時間のリスニングやコンテンツ制作のために設計されたものではありません。もし2分で機能をオフにしたくなったら、諦める前に Fish Audio のTTS を試してみてください。プリインストールされたエンジンと最新のAI音声の差は、「我慢して聴くもの」と「読むよりも快適なもの」ほどの違いがあります。


