iPhone 语音转文字教程:开启与关闭语音输入
2026年2月28日
当你双手沾满面粉,而孩子的学校刚刚发来关于接送变动的短信,你只有 30 秒的时间回复。你用指关节敲击 iPhone 键盘上的麦克风图标,但毫无反应。你又敲了一次,依然没反应。你在牛仔裤上擦干一只手,正常解锁手机,第三次点击麦克风图标,结果只看到一个“听写功能不可用”的弹窗一闪而过。在“设置”中的某个地方有一个你从未注意到的开关,而 Apple 在上次 iOS 更新中移动了它的位置。
对于一个自 2011 年起就成为 iOS 一部分的特性来说,这种情况发生的频率远超预期。iPhone 的“听写”功能在正常工作时确实非常快——通常比打字快 2-3 倍。然而,Apple 将其开启/关闭开关隐藏在一个并不明显的位置,并在不同的 iOS 版本之间移动它,且从未明确解释为什么麦克风图标有时出现在键盘上,有时又会消失。一旦你知道去哪里找,修复它只需约 60 秒。
键盘上的麦克风图标:为何会消失以及如何找到它
在深入设置之前,了解麦克风图标消失或停止工作的原因会很有帮助。
iPhone 键盘上的麦克风图标由“设置”中一个名为听写的开关控制。当“听写”功能关闭时,麦克风图标要么从键盘上彻底消失,要么变成灰色且无响应。Apple 并不会显示错误信息来解释这一点。图标只是静静地消失,大多数用户会认为出了故障,而没有意识到它只是被禁用了。
以下是“听写”功能可能在你不知情的情况下被关闭的三个常见原因:
- iOS 更新。重大的 iOS 更新偶尔会重置“听写”设置。自 Apple 更改语音数据处理方式以来(尤其是 iOS 17 及更高版本转向设备端处理后),这种情况发生得更加频繁。
- 屏幕使用时间或 MDM 限制。如果你或雇主启用了“屏幕使用时间”限制,则可能在“内容和隐私访问限制”下禁用了“听写”功能。在公司管理的设备上,它通常默认被禁用。
- 拒绝了隐私提示。当 iOS 第一次询问你是否要启用“听写”时,如果你选择“不允许”,该功能将保持关闭状态,直到你在“设置”中手动重新启用。你不会再次看到该提示。
如何开启听写:各版本 iOS 逐步指南
该开关的位置在不同的 iOS 版本中有所变化,这就是为什么两年前的在线指令经常指向错误的菜单。
iOS 18 (当前版本)
- 打开设置
- 点击通用
- 点击键盘
- 向下滚动到听写并将其开启
- 如果弹出提示,确认你想要启用“听写”
iOS 17
路径与 iOS 18 相同:
- 设置 > 通用 > 键盘
- 开启启用听写
- 可能会有一个弹窗询问你是否愿意与 Apple 共享音频以帮助改进听写。选择任一选项均可——选择“以后再说”仍能完全启用“听写”功能。
iOS 16 及更早版本
- 设置 > 通用 > 键盘
- 开启启用听写
该路径自 iOS 16 以来一直保持一致;但在 iOS 15 及更早版本中,该开关偶尔位于设置 > Siri 与搜索下。如果你使用的是旧设备且在“键盘”下找不到它,请查看该位置。
确保其正常工作
启用“听写”后,打开任何带有文本框的 App(如信息、备忘录或 Safari)。点击文本框调出键盘。你应该会在键盘底部看到一个麦克风图标——在没有主屏幕按钮的 iPhone 上位于空格键下方,在旧机型上位于空格键旁边。点击它。如果出现波形脉动且手机开始捕捉你的语音,说明设置成功。
如何高效使用对话式语音 AI 进行听写:不只是点击麦克风
启用“听写”只是第一步。有效利用它才是大多数人尚未发掘其 70% 价值的地方。以下是它在实践中的运行方式。
开始与停止
点击键盘上的麦克风图标即可开始。自然地说话,你的文字几乎会瞬间出现在文本框中。若要停止,请再次点击麦克风图标、点击键盘图标或直接开始打字。在 iOS 17 及更高版本中,你可以无缝地在打字和听写之间切换,无需关闭“听写”功能。
这种无缝切换是相比旧版 iOS 的重大升级,在旧版本中,启用“听写”会用波形显示取代整个键盘。现在键盘保持可见,允许你在听写的同时进行纠错。
大多数人不知道的第二种启动听写的方法
在运行 iOS 17 及更高版本的 iPhone 上,你还可以通过长按键盘右下角的麦克风图标(或某些键盘布局中的左下角)来启用“听写”。这会打开一个略有不同的界面,停止按钮的点击区域更大。
在带有主屏幕按钮的 iPhone 上,你也可以长按主屏幕按钮触发 Siri 并说“输入 [你的信息]”,尽管这种方法比直接听写更慢且不太可靠。
在特定 App 中使用听写
信息: 点击文本框,点击麦克风图标,然后说话。“听写”最适合短消息。对于较长的文本,请说出完整的句子并自然停顿。在 iOS 17 及更高版本中,支持的语言(英语、西班牙语、法语、德语、日语、中文、韩语、葡萄牙语和意大利语)会自动插入标点符号。
备忘录: 打开一个备忘录,点击放置光标,然后点击麦克风。这是免提捕捉想法的实用方法。“备忘录”通过 iCloud 同步,你在 iPhone 上听写的任何内容都会立即出现在你的 Mac 和 iPad 上。
邮件: “听写”可在撰写窗口内工作。你可以在会议间隙走动时通过语音回复邮件。“听写”能很好地处理对话语言,但在处理邮件特有元素(如地址、URL 以及抄送/密送字段)时比较吃力。这些元素建议手动输入。
Safari 和网页表单: “听写”适用于任何网站的任何文本框。点击字段,点击麦克风,然后说话。在打字感觉较慢时,它在搜索栏和登录表单中特别有用。
WhatsApp, Slack, Telegram: “听写”在所有使用标准 iOS 键盘的第三方社交 App 中均可工作。如果你安装了第三方键盘(如 Gboard 或 SwiftKey),麦克风图标和“听写”的工作方式可能会略有不同。
可将编辑时间减半的语音指令
大多数 iPhone 用户在听写完一段信息后,还要花 2-3 分钟点来点去以修复标点和格式。事实上,iOS 支持语音指令,可以在你说话时处理大部分格式和标点。
标点符号(说话时说出这些词):
- “句号”
- “逗号”
- “问号”
- “感叹号”
- “冒号” / “分号”
- “破折号”
- “省略号”
- “引号” ... “结束引号”
- “左括号” ... “右括号”
格式化:
- “换行”(移动到下一行)
- “新段落”(插入段落分隔符)
- “大写”(使下一个单词首字母大写,主要用于英文输入)
- “全部大写开启” ... “全部大写关闭”
- “无空格”(删除下一个单词前的空格,对输入电子邮件地址特别有用)
特殊字符:
- “艾特符号” → @
- “井号” → #
- “和符号” → &
- “百分号” → %
- “美元符号” → $
- “笑脸表情” → 插入表情符号(iOS 16 及更高版本)
有一点需要注意:iOS 17 及更高版本的自动标点功能在添加句号、逗号和问号方面表现出色,即使你不说出来也能识别。尽管如此,它并非完美无缺。对于标点符号至关重要的重要信息(如工作邮件和正式文本),明确听写标点符号比依赖自动检测能产生更整洁的结果。
设备端 vs. 基于服务器的听写:幕后发生了什么
从 iOS 17 开始,在配备 A12 芯片或更高版本的 iPhone(iPhone XS 及更新机型)上,“听写”默认在设备端处理语音。这种转变非常重要,原因有三:
隐私。 你的音频保留在手机上。在旧设备或较早的 iOS 版本中,音频会被发送到 Apple 的服务器进行处理。设备端处理可确保听写的医疗笔记、财务细节和个人信息保持在本地。
速度。 设备端处理消除了服务器往返时间,这意味着文字会随着你的说话而即时出现,几乎没有延迟,即使在飞行模式下也是如此。
离线访问。 你可以在没有互联网连接的情况下进行听写,这是最显著的改进。在地铁隧道、飞机上或没有移动信号的地区,听写现在依然可用。相比之下,在基于服务器的设备上,没有网络连接意味着“听写”不可用。
要检查你使用的是哪个版本:切换到飞行模式并尝试听写。如果文字仍然出现,则你运行的是设备端处理。如果听写在断网时失败,则你使用的是基于服务器的版本。唯一的解决方法是升级到较新的设备或 iOS 版本。
多语言听写(无需重新启动)
iOS 支持 60 多种语言的听写,在 iOS 17 及更高版本中,只要你的键盘配置正确,这项对话式语音 AI 功能允许你在同一次会话中切换多种语言。
如何添加听写语言
- 前往设置 > 通用 > 键盘 > 键盘
- 点击添加新键盘
- 选择你想要的语言
- 返回设置 > 通用 > 键盘 > 听写,确认该语言出现在“听写语言”下
会话中途切换语言
在 iOS 17 及更高版本中,如果你安装了多种键盘语言,“听写”将自动检测你正在说的语言。作为 Apple 内置对话式语音 AI 能力的一部分,你可以用英语开始一个句子,中途切换到西班牙语,系统通常能跟上。在这个句子里,“通常”一词很重要。自动检测在语言发音差异明显时(例如英语和日语)效果最好,但在发音相似的语言对(如西班牙语和葡萄牙语)上则不那么可靠。
为了获得最准确的结果,请在听写不同语言之前手动切换键盘语言。只需点击一下(键盘上的地球图标),即可消除系统猜测。
如何禁用听写(以及你可能想要这样做的原因)
若要关闭“听写”,只需反向操作相同的步骤:
- 设置 > 通用 > 键盘
- 关闭听写
- 出现提示时确认
禁用的原因
- 误触激活。 如果你在打字时经常误点麦克风图标,并在安静的会议中触发听写,将其关闭可以防止误触。
- 共享设备的隐私。 如果孩子或家人使用你的手机,禁用“听写”可以防止他们通过语音输入进行搜索或发送你希望他们手动输入的各种信息。
- 公司政策。 一些组织要求在处理敏感数据的设备上禁用“听写”,尤其是音频在外部服务器上处理的旧款设备。
通过屏幕使用时间禁用听写(家长控制)
防止“听写”被重新启用:
- 设置 > 屏幕使用时间 > 内容和隐私访问限制
- 开启内容和隐私访问限制
- 点击允许的 App(取决于你的 iOS 版本,也可能是允许的内容)
- 找到 Siri 与听写 并将其禁用
此操作会锁定“听写”开关,确保在没有“屏幕使用时间”密码的情况下无法将其重新打开。
iPhone 听写的局限性
iOS 听写非常适合实时、单人的语音输入。然而,即使具备 Apple 内置的对话式语音 AI 能力,它也会遇到五个明显的限制,这些限制会影响有更高需求的用户。
无法转录音频文件。 “听写”仅处理实时麦克风输入;换句话说,你无法转录现有的录音。如果你在“语音备忘录”中录制了会议,在其他 App 中录制了讲座,或在手机上进行了采访,iOS 内部无法上传该文件并将其转换为文本,因为没有“上传音频并转录”的选项。
噪杂环境下的准确度下降。 iPhone 的麦克风阵列是为电话设计的,而不是为了在拥挤的咖啡馆、多风的街道或移动的汽车内进行听写。背景噪音可能会使准确度降至 85% 以下,导致你花在纠错上的时间比直接打字还要多。
没有说话人识别。 “听写”产生的是连续的文本流,无法区分说话者。如果你尝试转录两人通话或多人对话,输出结果将是一个无法区分的文本块。
没有时间戳。 输出仅为纯文本。没有办法将句子追溯到原始音频中的特定时刻,这对于记者、研究人员或任何需要引用原始音频的人来说是一个严重的限制。
短篇偏向。 虽然 iOS 17 及更高版本支持没有严格时间限制的持续听写,但该功能针对信息和短笔记进行了优化。在一次会话中听写一份 2000 字的文档在技术上是可行的,但在实践中并不可靠。准确度往往会随着会话的延长而下降,段落中间的一个识别错误就可能打乱整个听写流程。
当 iPhone 听写不够用时:使用 Fish Audio 进行专业转录
分界线非常清晰:如果你是在实时对着手机说话并生成短信或简短笔记,iPhone “听写”是正确的工具。但是,如果你需要转录录音、处理带有噪音的音频、识别多位发言者或大规模处理内容,你就已经超出了 iOS 的设计处理范围——即使它内置了对话式语音 AI 功能。
这正是 Fish Audio 的语音转文字 (STT) 解决方案大显身手的地方。
上传 iPhone 上的任何录音。 语音备忘录、Zoom 录像、采访文件、播客剧集。点击上传,选择文件,即可接收转录文本。无需实时播放,也无需复杂的变通设置。支持长达 60 分钟的录音(每文件上限 60 分钟)。在批量模式下,处理速度通常为音频时长的 ~0.3–0.5 倍(因此 60 分钟的音频大约需要 18–30 分钟),具体取决于负载。
专为真实环境打造的准确度。 Fish Audio 的模型在多样的音频环境中训练:电话质量录音、房间回声、背景噪音、带口音的语音以及交谈中的打断。安静房间与嘈杂咖啡馆之间的准确度差距比 iPhone “听写”所能达到的要小得多。
8 种语言,质量始终如一。 Fish Audio 的 STT 引擎与其 TTS 引擎支持相同的语言范围,在多种语言中都能提供可靠的准确度,而不仅仅是英语或少数几个顶级市场。
iPhone 上的完整语音工作流:
- 快捷短信和简短笔记:使用 iPhone “听写”。它是内置的、免费的,且专为单人输入设计,是简单对话式语音 AI 交互的理想选择。
- 转录录音:使用 Fish Audio STT。从 iPhone 上传,获取整洁准确的文本。
- 将完成的文本转换为音频:使用 Fish Audio TTS,拥有 2,000,000+ 种声音,支持 15 秒声音克隆,并支持 8 种语言。
这些共同构成了一个完整的语音工作流:语音转文字用于捕捉想法,文字转语音用于创作内容。iPhone “听写”处理日常输入,而 Fish Audio 则支持超出“备忘录”App 需求的所有功能。
费用说明
Fish Audio 的免费层级允许你使用真实录音测试平台。付费方案起价为每月 11 美元,包含 600,000 字符的 TTS 和 STT 使用量。相比之下,专业转录服务每分钟音频收费 1-3 美元,且需要 24-48 小时的交付周期。Fish Audio 只需不到 2 分钟就能在你的手机上处理完同一个文件。完整的价格详情请点击此处。

结论
iPhone “听写”只需一个开关即可成为你手机上最有用的功能之一。你可以在设置 > 通用 > 键盘 > 听写下找到它。启用它只需 60 秒,它可以以两到三倍于你打字的速度将语音转换为文字。学习五个用于标点和格式的语音指令,你就能显著减少听写后的编辑时间。如果你出于隐私或家长控制需要将其锁定,屏幕使用时间限制提供了一个受密码保护的切断开关。
然而,iOS “听写”主要设计用于日常对话式语音 AI 场景中的实时、休闲和单人输入。一旦你需要转录录音、应对噪杂音频或创作超出短信范畴的内容,Fish Audio 就会介入以填补这一空白。保留“听写”用于快速的日常输入,同时添加 Fish Audio 来处理更高级的需求,你的 iPhone 就能完美覆盖语音转文字的两端需求。从免费层级开始,上传那段一直躺在“语音备忘录”里的录音吧。
