如何在 Microsoft Word 中使用语音键入听写文档
2026年3月5日
我们最想留住的话语往往消逝得最快。在你组织好思绪、开始动笔之前,下一个灵感可能已经稍纵即逝。
当你尝试边听边打字时,你的大脑并不是真的在同时处理这两件事。它是在两者之间切换,争夺有限的注意力资源。
你越是努力捕捉每一个字,你实际理解的内容就越少。
在重要的对话中,在漫长的求学岁月里,在我们匆忙而短暂的一生中,有多少只说过一次且仅说一次的话语,我们将永远错过?
最好的解决方案是将打字工作完全交出去。Microsoft Word 内置了语音输入功能,让你能够专注于倾听和思考,而由它来负责记录。
本指南将引导你如何在 Word 中使用语音转文本功能,让你耳中所闻皆能化为文档所记。
为什么在 Word 中使用语音转文本
在深入了解具体步骤之前,让我们先探讨一下在 Word 中使用语音转文本的益处:
- 免打字写作:非常适合身体残障人士或任何更喜欢说话而非打字的人。
- 提高效率:无需打字即可快速记录想法,非常适合编写长文档。
- 多任务处理:在处理其他任务时口述想法,提高效率。
- 语音命令:只需语音即可控制标点符号、格式和导航。
方法 1:使用 Microsoft Word 内置的“听写”功能
在 Word 中进行语音键入最直接的方法是使用 听写 (Dictate),这是 Microsoft 内置的语音转文本工具。Microsoft 表示,听写功能需要麦克风和可靠的互联网连接,当你登录已启用麦克风设备的 Microsoft 365 时,“听写”按钮将变为可用。相同的基本工作流程适用于 Windows 版 Word for Microsoft 365、Mac 版 Word for Microsoft 365 以及网页版 Word。
如何在 Word 中使用听写功能
- 在 Word 中打开一个新文档或现有文档。
- 转到 开始 (Home) 选项卡。
- 点击 听写 (Dictate)。
- 等待“听写”按钮开启并开始倾听。
- 开始说话,你的话语将作为文本出现在页面上。
- 完成后,再次点击 听写 (Dictate) 即可停止。
如果你更喜欢在浏览器中工作,网页版 Word 使用相同的基本流程。在网页版 Word 中打开文档,转到 开始,点击 听写,等待 Word 开始倾听,然后开始说话。如果你已将文件存储在 OneDrive 中,并希望通过浏览器而非桌面应用进行工作,那么网页版非常易于使用。
在听写中使用语音命令
听写功能不仅仅是将语音转换为纯文本。Microsoft 还支持标点、编辑、导航和格式化的语音命令。例如,你可以说 “句号” 或 “点” 来插入句号,说 “逗号” 来插入逗号,说 “换行” 来移动到下一行。你还可以使用诸如 “删除那个”、“撤销”、“选择那个” 等命令,以及 “加粗”、“倾斜” 或 “创建项目符号列表” 等格式化命令。这使得听写不仅适用于起草,还适用于随写随改的文本清理和格式化。
方法 2:使用 Word 内置的“转录”工具
如果你已经有了录音,听写功能并不总是最佳工具,因为听写是为实时语音输入设计的。在这种情况下,Microsoft 的 转录 (Transcribe) 功能是更好的内置选择。Microsoft 说明,转录功能既可以直接在 Word 中录制音频并在后台进行转录,也可以让你上传预录的文件并将其转换为文本。
如何在 Word 中上传音频并进行转录
- 在 Microsoft Edge 或 Chrome 浏览器中登录 Microsoft 365。
- 打开 Word 并转到 开始 > 听写 > 转录。
- 在转录窗格中,选择 上传音频。
- 选择你的文件。Microsoft 表示,转录目前支持 .wav, .mp4, .m4a, 和 .mp3 格式。
- 在 Word 处理文件期间,请保持转录窗格处于打开状态。
- 转录就绪后,在窗格中进行查看。
- 将完整转录或选定部分添加到你的文档中。
Microsoft 还表示,上传或录制的文件存储在 OneDrive 的 Transcribed Files 文件夹中,除非你将其删除,否则转录内容将一直附在文档上。你可以编辑转录部分、重新标注发言人,并将整个转录或仅选定部分插入文档。Microsoft 目前允许 Microsoft 365 订阅者每月转录最多 300 分钟的上传音频。
方法 3:使用 Windows 语音键入
如果你不想使用 Word 内置的听写引擎,Windows 提供了另一种途径。Microsoft 的 语音键入 (Voice typing) 可在 Windows 10 和 Windows 11 的文本字段中运行,因此只要你的光标位于 Word 文档内,即使你不使用 Word 的“听写”按钮,Windows 也可以为你键入。Microsoft 表示此功能使用由 Azure Speech 服务提供支持的在线语音识别。
如何在 Word 中使用 Windows 语音键入
- 打开 Word 文档,将光标放在你想要输入文本的位置。
- 确保你已连接到互联网且麦克风工作正常。
- 按键盘上的 Windows + H。
- 等待 “正在聆听...” 提示出现后再开始说话。
- 清晰地说话,Windows 将在 Word 的活动文本字段中键入内容。
- 要停止,请说 “停止聆听” 或点击语音键入菜单中的麦克风按钮。
Windows 在你听写时也支持语音命令。Microsoft 特别提到了 “删除那个” 和 “选择那个” 等命令,并且它支持通过更改当前输入语言来切换语音键入语言。如果你喜欢在操作系统层面工作,而不是依赖 Word 自身的语音工具,那么这是一个很好的替代方案。
方法 4:使用第三方工具
如果你的起点是录音而非实时听写,第三方转录工具可能比直接对 Word 说话更实用。Fish Audio 就是一个例子。其语音转文本 (Speech to Text) 服务围绕上传音频并获取转录结果而构建,因此当你想要将会议、访谈、讲座或播客转换为 Word 可编辑文本时,它最为合适。Fish Audio 表示其语音识别支持 英语、中文普通话、粤语、日语和韩语,并且可以自动处理带有语码转换(如中英夹杂)的多语言音频。它还表示该工具专为长音频设计,支持包括 MP3、WAV、FLAC、M4A 和 OGG 在内的主要格式。

如何将 Fish Audio 用于 Word 工作流
- 访问 Fish Audio 并登录你的账户。
- 在你的仪表板中,点击 语音转文本 (Speech to Text)。
- 上传你的音频文件。Fish Audio 的网页指南在快速入门流程中列出了 MP3, WAV, 和 M4A。
- 点击 转录。
- 转录就绪后,复制文本。
- 将其粘贴到你的 Word 文档中并在那里进行编辑。
Fish Audio 将此描述为“上传优先”的转录工作流,而不是 Word 内部的实时麦克风按钮。换句话说,它最适合先将录音转换为文本,然后再将该文本移动到 Word 中进行清理、格式化和最终编辑。
结论
如果你想通过说话立即看到文本出现在文档中,Word 内置的“听写”功能是最直接的选择。如果你已经有了录音并想留在 Microsoft 生态系统中,Word 中的“转录”功能是更好的内置工作流。而如果你正在处理较长的录音并想要一个基于上传的转录工具,Fish Audio 会是更自然的选择。
