Microsoft Wordで音声入力を使用してドキュメントを作成する方法

2026年3月5日

Microsoft Wordで音声入力を使用してドキュメントを作成する方法

私たちが最も留めておきたい言葉こそ、いつも真っ先に消え去ってしまうものです。思考を整理し、入力を始める前に、次のアイデアはすでに失われています。

話を聞きながら同時にタイピングしようとするとき、脳は実際には両方をこなせていません。2つの作業の間で行き来し、限られた注意力を奪い合っているのです。

すべての言葉を完璧に記録しようとすればするほど、実際に理解できる内容は少なくなっていきます。

重要な会話、学習に費やす年月、そして慌ただしく過ぎ去る人生の中で、たった一度だけ発せられた言葉のうち、どれほど多くの言葉を見逃し続けていくのでしょうか?

最善の解決策は、タイピングの負担を完全に取り除くことです。Microsoft Wordには、聞くことや考えることに集中できるよう、音声入力機能が組み込まれており、執筆作業を代行してくれます。

このガイドでは、Wordで音声文字起こし(Speech-to-text)を使用する方法を順を追って説明します。耳で聞いた内容を、そのままドキュメントとして残せるようにしましょう。

Wordで音声文字起こしを使用する理由

手順に入る前に、Wordで音声文字起こしを使用することがなぜ有益なのかを見ていきましょう。

  • ハンズフリーでの執筆: 身体的な制限がある方や、タイピングよりも話すことを好む方に最適です。
  • 生産性の向上: タイピングの必要がなく、アイデアを素早く書き留めることができるため、長文ドキュメントの作成に最適です。
  • マルチタスク: 他の作業をしながら考えを口述でき、効率が向上します。
  • 音声コマンド: 句読点、書式設定、ナビゲーションを声だけでコントロールできます。

方法1:Microsoft Wordの組み込みディクテーション機能を使用する

Wordで音声入力を行う最も直接的な方法は、Microsoftの組み込み音声文字起こしツールである [ディクテーション] を使用することです。Microsoftによると、ディクテーションはマイクと安定したインターネット接続があれば動作し、マイクが有効なデバイスで Microsoft 365 にサインインしているときに [ディクテーション] ボタンが利用可能になります。基本的なワークフローは、Windows版、Mac版の Word for Microsoft 365、および Web版 Word で共通です。

Wordでのディクテーションの使用方法

  1. Wordで新規または既存のドキュメントを開きます。
  2. [ホーム] タブに移動します。
  3. [ディクテーション] をクリックします。
  4. [ディクテーション] ボタンがオンになり、聞き取りが開始されるまで待ちます。
  5. 話し始めると、言葉がテキストとしてページに表示されます。
  6. 終了したら、もう一度 [ディクテーション] をクリックして停止します。

ブラウザで作業したい場合、Web版 Word も同様の手順で使用できます。Web版 Word でドキュメントを開き、[ホーム] に移動して [ディクテーション] をクリックし、聞き取りが始まるのを待ってから話し始めます。ファイルをすでに OneDrive に保存しており、デスクトップアプリではなくブラウザから作業したい場合に便利です。

ディクテーションでの音声コマンドの使用

ディクテーションは単に音声をテキストに変換するだけではありません。Microsoftは句読点、編集、ナビゲーション、書式設定のための音声コマンドもサポートしています。例えば、「まる」「てん」 と言って句読点を挿入したり、「改行」 と言って次の行に移動したりできます。また、「それを削除」「元に戻す」「それを選択」 といったコマンドや、「太字」「斜体」「箇条書きリストを作成」 などの書式設定コマンドも使用できます。これにより、下書きだけでなく、作業しながらのテキスト修正や整形も可能になります。

方法2:Wordの組み込みトランスクリプトツールを使用する

すでに録音データがある場合、ディクテーションは必ずしも最適なツールではありません。なぜなら、ディクテーションはリアルタイムの音声入力用に設計されているからです。その場合、Microsoftの [トランスクリプト] 機能が良い選択肢となります。Microsoftの説明によると、トランスクリプト機能は Word 内で音声を直接録音してバックグラウンドで文字に起こすか、録音済みのファイルをアップロードしてテキストに変換することができます。

音声をアップロードしてWordで文字起こしする方法

  1. Microsoft Edge または Chrome で Microsoft 365 にサインインします。
  2. Wordを開き、[ホーム] > [ディクテーション] > [トランスクリプト] の順に進みます。
  3. [トランスクリプト] ペインで、[音声のアップロード] を選択します。
  4. ファイルを選択します。Microsoftによると、現在 .wav, .mp4, .m4a, .mp3 形式がサポートされています。
  5. Wordがファイルを処理している間、[トランスクリプト] ペインを開いたままにしておきます。
  6. 文字起こしが完了したら、ペインで内容を確認します。
  7. 文字起こし全文、または特定のセクションをドキュメントに追加します。

また、アップロードまたは録音されたファイルは OneDrive の [Transcribed Files] フォルダに保存され、文字起こしデータは削除しない限りドキュメントに添付されたままになります。文字起こしセクションの編集、話者のラベル付け直し、全文または一部のみの挿入が可能です。現在、Microsoft 365 サブスクライバーは、月に最大300分までアップロードした音声の文字起こしが可能です。

方法3:Windows 音声入力を使用する

Wordの組み込みエンジンを使いたくない場合は、Windowsが提供する別のルートがあります。Microsoftの 音声入力 は Windows 10 および Windows 11 のテキストフィールド全体で機能するため、カーソルが Word ドキュメント内にあれば、Word のディクテーションボタンを使わなくても Windows が代わりに入力してくれます。Microsoftによると、この機能は Azure Speech サービスを活用したオンライン音声認識を使用しています。

Wordで Windows 音声入力を使用する方法

  1. Wordドキュメントを開き、テキストを入力したい場所にカーソルを置きます。
  2. インターネットに接続されており、マイクが動作していることを確認します。
  3. キーボードの Windows + H キーを押します。
  4. 「聞き取り中...」 という表示が出てから話し始めます。
  5. はっきりと話すと、Word のアクティブなテキストフィールドに文字が入力されます。
  6. 停止するには、「聞き取りを停止」 と言うか、音声入力メニューのマイクボタンをクリックします。

Windows 音声入力でも音声コマンドがサポートされています。Microsoftは特に 「それを削除」「それを選択」 といったコマンドを挙げており、入力言語を切り替えることで音声入力の言語を変更することも可能です。Word 独自のツールに頼るよりも、オペレーティングシステムレベルでの操作を好む場合には優れた代替手段となります。

方法4:サードパーティ製のツールを使用する

ライブディクテーションではなく、録音データから始める場合は、Word に直接話しかけるよりもサードパーティの文字起こしツールの方が実用的な場合があります。Fish Audio はその一例です。その音声文字起こしサービスは音声ファイルをアップロードして文字起こし結果を受け取る形式であるため、会議、インタビュー、講義、ポッドキャストなどを Word で編集可能なテキストに変換したい場合に最適です。Fish Audio によると、その音声認識は 英語、中国語(普通話)、広東語、日本語、韓国語 をサポートしており、言語が混在する音声も自動的に処理できます。また、長尺の音声向けに設計されており、MP3, WAV, FLAC, M4A, OGG などの主要なフォーマットに対応しています。 fish-logo

Wordのワークフローで Fish Audio を使用する方法

  1. Fish Audio にアクセスし、アカウントにログインします。
  2. ダッシュボードで [Speech to Text] をクリックします。
  3. 音声ファイルをアップロードします。Fish Audio のガイドでは、クイックスタートフローにおいて MP3, WAV, M4A がリストされています。
  4. [Transcribe] をクリックします。
  5. 文字起こしが完了したら、テキストをコピーします。
  6. Wordドキュメントに貼り付け、そこで編集を行います。

Fish Audio は、Word 内のライブマイクボタンではなく、アップロード優先の文字起こしワークフローとして説明されています。言い換えれば、録音された音声をまずテキストに変換し、そのテキストを Word に移して整理、書式設定、最終編集を行うのに最適です。

結論

話し始めるとすぐにテキストがドキュメント内に表示されるようにしたい場合は、Word組み込みのディクテーション が最も直接的な選択です。すでに録音データがあり、Microsoft のエコシステム内で完結させたい場合は、Wordのトランスクリプト機能 が優れたワークフローとなります。そして、より長い録音データを扱い、アップロードベースの文字起こしツールを求めるのであれば、Fish Audio がより自然な選択肢となるでしょう。

リアルに感じる声を作成する

今日から最高品質のオーディオを生成し始めましょう。

すでにアカウントをお持ちですか? ログイン

この記事を共有する


Kyle Cui

Kyle CuiX

Kyle is a Founding Engineer at Fish Audio and UC Berkeley Computer Scientist and Physicist. He builds scalable voice systems and grew Fish into the #1 global AI text-to-speech platform. Outside of startups, he has climbed 1345 trees so far around the Bay Area. Find his irresistibly clouty thoughts on X at @kile_sway.

Kyle Cuiの他の記事を読む >

最近の記事

すべて表示 >