iPhoneのテキスト読み上げ(TTS)完全チュートリアル:オン・オフの設定から使い方まで
2026年2月28日
地下鉄の中で、教授から送られてきた12ページのPDFを授業の20分前に読もうとしている場面を想像してください。あなたはSiriに「このドキュメントを読んで」と頼みます。しかし、Siriはウェブ検索の結果を表示するだけです。「Hey Siri、画面を読んで」と試しても、Siriは「それはできません」と答えます。PDFを開いて再生ボタンを探しても、どこにもありません。実は、iPhoneのどこかにテキストを読み上げる機能が隠れています。Appleはそれを「アクセシビリティ」設定の奥深くに埋め込んでおり、多くの人が一度も開いたことがない機能、それが内蔵の**iPhoneテキスト読み上げ(iPhone TTS)**システムです。
このような経験は、世界中で12億台以上使われているiPhoneで、毎日何百万回と繰り返されています。iOSには、自然な響きの音声、単語ごとのハイライト表示、速度調整機能を備えた、非常に有能なテキスト読み上げ(TTS)エンジンが内蔵されています。しかし、Appleはこれをコンテンツ消費ツールとしてではなく、アクセシビリティ機能として設計したため、見つけにくいのが難点です。一度設定の道筋を知ってしまえば、セットアップは2分で終わります。iPhoneのテキスト読み上げ音声の質の高さに、きっと驚くはずです。
iPhoneには2つのTTSシステムがあります。Siriはその一つではありません。
まず誤解を解いておきましょう。Siriはあなたに話しかけることはできますが、iPhoneのテキスト読み上げ(iPhone TTS)を使ってドキュメントを読んでくれるわけではありません。Siriは独自の音声モデルを使って回答を生成しますが、iOSのテキスト読み上げ機能のように、アプリをまたいで「このテキストを読んで」や「この画面を読んで」といったコマンドを確実に実行する機能は持っていません。
iOSに実際に内蔵されているTTSシステムは以下の通りです:
| システム | 機能 | 設定場所 | 使用シーン |
|---|---|---|---|
| 選択項目の読み上げ | 選択したテキストを読み上げる | 設定 > アクセシビリティ > 読み上げコンテンツ | 特定の一節を読む、校正する |
| 画面の読み上げ | 表示されている画面全体を読み上げる | 設定 > アクセシビリティ > 読み上げコンテンツ | 記事、メール、全ドキュメント |
| VoiceOver | フルスクリーンリーダー(全要素を解説) | 設定 > アクセシビリティ > VoiceOver | 視覚サポートが必要な場合のみ |
ほとんどの人が求めているのは、iPhoneテキスト読み上げのための**「選択項目の読み上げ」または「画面の読み上げ」**です。VoiceOverは、タップやボタン、ジェスチャーのすべてをナレーションする、視覚障害者向けのフルナビゲーションシステムです。単に記事を読み上げてほしいだけなのにVoiceOverをオンにしてしまうと、オフにする方法(起動中はタップの仕方が変わります)を理解するまで、スマホがほぼ操作不能になってしまいます。
特に必要がない限り、VoiceOverには触れないでください。
テキスト読み上げをオンにする:2分間のセットアップ
iOS 17およびiOS 18での手順
- 設定を開く
- アクセシビリティをタップ
- 読み上げコンテンツをタップ
- 選択項目の読み上げをオンにする(ハイライトしたテキストを読み上げます)
- 画面の読み上げをオンにする(画面全体を読み上げます)
- 読み上げ速度スライダーを調整する。デフォルトは約180語/分です。多くの人は200〜220 WPM(語/分)が聞き取りやすいと感じます。いろいろ試してみてください。
- 声をタップして、デフォルトの音声を変更する(詳細は後述)
これで準備完了です。両方の機能が有効になりました。
それぞれの起動方法
選択項目の読み上げ: 任意のアプリでテキストを長押しして選択します。選択範囲の上に表示されるメニューで読み上げをタップします。(「読み上げ」が表示されない場合は、メニューの右矢印をタップして探してください。)
画面の読み上げ: 画面の上端から二本の指で下にスワイプします。再生/一時停止、早送り、巻き戻し、速度調整、閉じるボタンが付いた小さなオーディオコントローラーが表示されます。このコントローラーはコンテンツの上に浮かび、閉じるまでアクティブなままになります。
この「二本指スワイプ」のジェスチャーは、多くの人が気づかない機能です。これを使えば、iPhoneが画面上のあらゆるテキストを再生するポッドキャストプレイヤーに早変わりします。
2012年のロボットのような声から卒業する
Appleは多言語にわたって数十種類の音声を提供していますが、デフォルトとプレミアム(高品質)オプションの質の差は劇的です。ほとんどのユーザーはデフォルトのまま使っていますが、それは自然さよりもファイルサイズを優先して最適化された「コンパクト」な音声を聴いていることになります。
より良い音声をダウンロードする方法
- 設定 > アクセシビリティ > 読み上げコンテンツ > 声 に進む
- 言語を選択(例:日本語)
- 音声の名前のリストが表示されます。ダウンロードアイコンが付いているものはまだインストールされていません。
- 名前をタップして試聴し、ダウンロードアイコンをタップしてインストールします。
- 高品質な音声には「拡張」や「プレミアム」というラベルが付いています。サイズは100MBから500MB程度です。
ダウンロードする価値のある音声(英語の場合)
iOS 18時点での、英語の優れた選択肢:
- Zoe (Premium): 温かみのある、会話的なアメリカ英語。Appleが提供する中で最も自然なナレーターに近い音声です。
- Evan (Premium): 明瞭で少しフォーマルなアメリカ英語。ニュース記事やビジネスコンテンツに適しています。
- Siri Voice 2 / Voice 4: 新しいSiriの音声はニューラルネットワークに基づいており、以前のオプションより自然です(長い文章ではまだデジタル的な質感が残りますが)。
日本語の場合、「Kyoko」や「Otoya」の拡張版が安定して聞きやすいでしょう。デフォルトの「コンパクト」版と「拡張/プレミアム」版の差は、TTSを「我慢して聴く」か「楽しんで聴く」かの違いと言っても過言ではありません。
iPhoneアプリでテキスト読み上げを活用する
「読み上げコンテンツ」を有効にすると、ほぼすべてのアプリで動作します。ただし、コンテキストによって使い勝手が異なります。
Safari
記事のページで二本指スワイプをして「画面の読み上げ」を起動します。表示されているコンテンツの冒頭から読み上げが始まります。最も快適に聴くには、まずリーダーモードアイコン(アドレスバーの「あぁ」または行のアイコン)をタップしてください。リーダーモードは広告やナビゲーション、サイドバーを取り除いてくれるので、音声が「メニュー、ホーム、会社概要、購読、クッキーの設定...」などと読み上げるのを防ぎ、記事の本文だけを読んでくれます。
メモ
「選択項目の読み上げ」は個別のメモで機能します。「画面の読み上げ」はメモ全体を読みます。自分の書いた文章を耳で確認するのに便利です。声に出して読んで不自然な箇所は、大抵の場合、文章としても不自然です。
メール
本文を選択して「読み上げ」をタップするか、二本指スワイプで全文を読みます。長いスレッドも読めますが、引用された返信などもすべて読み上げるため混乱することがあります。最新のメッセージだけを選択して読むのがスマートです。
Kindle
Kindleアプリでも二本指スワイプで「画面の読み上げ」が機能します。ただし、表示されているページしか読みません。ページが終わるたびに手動でめくる必要があるため、長時間の読書には少し不便です。
PDF(ファイルアプリ)
ファイルアプリでPDFを開き、二本指スワイプをします。OCR(光学文字認識)が適用されていない、単なる画像としてのスキャンPDFは読み上げられません。
iPhone TTSを実用的にする4つの設定
1. 読み上げている内容を強調表示する: 設定 > アクセシビリティ > 読み上げコンテンツ で「内容を強調表示」をオンにします。単語、文章、またはその両方をハイライトするように設定できます。
2. 速度を適切に設定する: デフォルトは少し遅すぎます。1.3倍〜1.5倍(約220〜270 WPM)に上げると、情報収集の効率が上がります。
3. 読みかたを修正する: 設定 > アクセシビリティ > 読み上げコンテンツ > 読みかた。ブランド名や専門用語、人名など、iPhoneが読み間違える単語を登録できます。
4. 背面タップのショートカットを作成する: 設定 > アクセシビリティ > タッチ > 背面タップ。「画面の読み上げ」をダブルタップまたはトリプルタップに割り当てます。これで、二本指スワイプをしなくてもスマホの背面を叩くだけで読み上げを開始できます。
テキスト読み上げをオフにする方法(および誤ってVoiceOverを起動した場合の対処)
読み上げを停止する
フローティングコントローラーの「X」ボタンをタップするか、再度二本指で下にスワイプしてオフにします。
VoiceOverがオンになり、パニックになった場合
すべての操作がナレーションされ、通常のタップが効かなくなった場合は、Siriに「VoiceOverをオフにして」と伝えてください。 これが最も速い解決策です。
iPhone TTSの限界:できないこと
Appleの内蔵TTSは便利ですが、明確な限界があります:
- 音声の書き出しができない: MP3やWAVとして保存する機能はありません。
- 音声クローンができない: 自分の声や特定のブランドボイスを作ることはできません。
- 感情や間の調整ができない: 速度調整しかできず、強調したりドラマチックな間を置いたりすることは不可能です。
- 長時間のリスニングで疲れる: プレミアム音声でも10分以上聴き続けると、抑揚が平坦になり、聞き疲れが生じます。
iPhoneにより良い音声エンジンが必要なとき
「ファイルとして保存したい」「本物のナレーターのような声が必要」「多言語で高品質を維持したい」といったニーズが生じた時、それはアクセシビリティ機能の枠を超え、「制作ツール」が必要な時です。
Fish Audio は、iOSがカバーできない隙間をすべて埋め、iPhoneのブラウザから直接利用できます。
200万以上の音声ライブラリ。 Fish AudioのTTSライブラリでは、言語、アクセント、性別、トーンでフィルタリングできます。瞑想アプリ用の穏やかな声や、YouTubeショート動画用のエネルギッシュな声など、用途に合わせて選べます。

実際に使える音声ファイル。 生成した音声をMP3やWAVとしてダウンロードし、iMovieやポッドキャスト編集、教育プラットフォームなどで自由に利用できます。
15秒でできる音声クローン。 iPhoneのマイクで15秒間録音し、Fish Audioの音声クローンツールにアップロードするだけで、あなた自身の声でテキストを読み上げることができます。
20分間持続する自然な抑揚。 Fish Audioのモデルは、長文でも感情の変化やペース、強調を維持します。15分間のナレーションでも、最初から最後まで人間が話しているような自然さが持続します。
モバイルでのワークフロー
- iPhoneでテキストを書く、またはコピーする。
- Safariで fish.audio/text-to-speech を開く。
- テキストを貼り付け、音声を選択する。
- 音声を生成してダウンロードする。
- iMovieやSNS、AirDropなどで共有・利用する。
Fish Audioには無料プランもあります。有料プランは月額11ドルからで、約15時間分の音声生成が可能です。詳細は料金ページをご確認ください。
結論
iPhoneには、アクセシビリティ設定の中に非常に優秀なテキスト読み上げシステムが隠されています。設定を少し調整するだけで、移動中の記事消化や校正のための強力な味方になります。
しかし、iOSのTTSはあくまで「その場で聴くため」のものです。共有可能なファイルが必要な場合や、ブランドに合わせた高品質な声が必要な場合は、Fish Audio がAppleの限界の先を引き継ぎます。今スマホで書いているそのテキストを、プロ級のオーディオに変えてみませんか。まずは無料プランで、今読んでいるその文章をテストしてみてください。
