中文文字转语音:好用的工具与正确用法

2026/06/05

大多数"文字转语音"测评,作者只喂过英文。可中文完全是另一道题。一个普通话音色得读对声调、得在多音字里挑对那个读音、得在没有空格提示的一整片汉字里切对词——还有几乎所有人都做不好的那一项:句子读到一半冒出英文时能干净地切过去,比如"用 ChatGPT 写了个 prompt"。我中文读得很多:通勤路上刷微信读书、午饭时看知乎长答案、偶尔啃一篇半中半英的 arXiv 论文。所以我花了两周,把自己真实的阅读丢进那些号称能读中文的工具里跑了一遍。下面是真正经得起用的,以及每一款在哪儿掉链子——都说实话。

中文 TTS 难在哪(以及该听什么)

讲工具之前,先说清楚一个能用的普通话音色和一个机器人音色差在哪,你才知道自己在评判什么:

  • 声调与韵律。 差的引擎每句话都用同一个平板的音高,而中文里声调本身就是意义,听久了非常累。好音色有自然的句子起伏,像一个人在念,而不是地铁报站。
  • 多音字。 行是 xíng 还是 háng,重是 zhòng 还是 chóng,还是 hái 还是 huán。弱引擎按词频瞎猜,碰到不常见的读音常年读错。好一点的神经网络音色会看上下文,对的概率高得多。
  • 分词。 中文没空格,引擎得自己判断词在哪儿断。断错了,要么停顿很别扭,要么一口气连读不停。
  • 中英混读。 这才是 2026 年真正的酷刑测试。真实的中文写作里全是英文——品牌名、技术词、你的 KPI、跑个 demo。大多数工具要么把英文字母一个一个用中文腔念出来("C-H-A-T"),要么每次切换都卡一下。能流畅处理这一项的,才是值得留下的那几个。

试任何工具,都粘一段带一两个多音字的中英混合文字进去,听一耳朵就行。十五秒你就有数了。

CastReader——原地朗读中文页面(而且免费)

利益关系先说清楚:CastReader 是我们团队做的,你自行掂量。但它之所以存在,正是为了解决其他所有方案都让我头疼的那件事——可达性。大多数中文 TTS 工具就是一个让你往里粘文字的框。CastReader 是一款免费可用的阅读器(Chrome/Edge 插件,外加原生 Mac 和 iOS/安卓 App),它读的是你屏幕上已经打开的东西,原地直读,不用复制粘贴。无需注册、没有会到期的试用期——自然的神经网络普通话音色,免费。想要 premium 超真实语音、更多收听时长和 AI 文档分析,可以升级 CastReader Pro。

我读中文时之所以会用它,关键在于它能读我真正在用的那些 App:它能在浏览器阅读器里直接朗读微信读书,也能读知乎长答案——就是那种三千字、你根本不想往下滚的回答。因为它能读任意网页,那些西方工具懒得管的国内站点——豆瓣、简书、浏览器里打开的公众号文章——统统都能读。它还能把 ClaudeChatGPTGemini 的长对话从头读到尾,这点很重要,因为很多中文 AI 对话恰恰就是那种半中半英、专门把弱引擎搞崩的混读。它还能把 PDF 变成有声书、把 EPUB 转成音频,离线随身听。

在上面那两道难题上它表现不错:中英切换很顺(不会把英文缩写一个字母一个字母拼出来),多音字在上下文里也读得稳。语速随你调——普通话 1.4 倍是我走路时的节奏。

什么时候别用它: 当你需要为已发布的视频制作并导出一段品牌旁白的 MP3——那是创作者工具的活儿,不是阅读的活儿。但只要是想把中文阅读清单真正听完,它就是我一直开着的那个。从 Chrome 应用商店、App Store、Google Play 安装,或者直接用 Mac App

微软 Edge"朗读"——你电脑里早就装着的最好的免费中文音色

这是大多数人忽略、却真的很能打的一个。Edge 自带的朗读(Ctrl+Shift+U)用的是微软的神经网络中文音色——晓晓和云希是其中的标杆——它们是你能免费用到的最自然的普通话音色之一,零安装,还带逐词高亮。要是你只想"做饭时把这篇文章听了",它真的很难被打败。

Edge 还给了一长串地区音色,所以你想要普通话、粤语还是台湾国语,都能挑。晓晓的声调和韵律是真的舒服。

它的边界在哪: 它只读普通网页。PDF、像微信读书这种需要登录的阅读器框、动态 App 内容,它都靠不住,而且只活在 Edge 里。但作为读纯文章的免费底座,它非常出色——而且它底层的 Azure 音色,正是很多付费工具悄悄转手卖给你的那批。

浏览器/系统自带(免费,设备里现成的)

别小看你手里已经有的东西:

  • macOS 能在系统设置 → 辅助功能 → 朗读内容里读选中的中文。自带的婷婷(普通话)和粤语音色都还行,完全离线、永久免费。读一段很好,读一份 40 页的报告就笨重了——它是基于选中文字的,没有真正的播放队列。
  • Chrome 可以靠调用 Web Speech API 的插件读页面,但音质完全取决于你系统装了哪个中文音色,所以不同机器差别很大。
  • iOS / 安卓 都自带"朗读屏幕"/"选择朗读",有普通话音色——救急可以,但不能跨 App 接力,控制也有限。

这些读一句话很完美,读长篇就累人。一旦你要读一整本书或一个需要登录的 App,就该上专门的阅读器了。

"中文配音生成器"类工具(以及什么时候是杀鸡用牛刀)

还有一整类是给创作者用的,专门导出打磨好的普通话音频——比如短视频配音。中文确实强的几个大牌:

  • 微软 Azure TTS——Edge 那些音色的底层引擎。按量付费(标准神经档大约 15 美元 / 100 万字符,每月有免费额度)。如果你懂技术、想直接用 API 调那批晓晓/云希音色,它性价比最高。
  • ElevenLabs——多语种音色极强,中文也包含在内,支持情感和声音克隆。免费档有上限(每月约 1 万额度);付费从约 5 美元/月(Starter)和 22 美元/月(Creator)起。最适合做有表现力的、角色化的旁白。
  • SpeechifyNaturalReader 都支持中文,但它们的免费档是演示性质——Speechify 把好音色掐着给,NaturalReader 把高级神经音色限制在大约每天 20 分钟(付费约 20.90 美元/月起)。逐项对比可看我们的 Speechify 替代品NaturalReader 替代品

当你要制作音频去发布时,这些是对的工具;当你只是想点东西时,它们就是杀鸡用牛刀——你花在粘文字、管导出上的时间,比省下的还多。想更深入了解这类引擎能做什么,可以看我们的 AI 配音生成器指南。

怎么把中文 TTS 真正用进日常

几个让中文听读对我真正坚持下来、而不是试一次就丢的习惯:

  1. 音色选一次就别再换。 中性普通话,晓晓(Edge/Azure)或 CastReader 的默认神经音色都稳妥。别在工具之间反复横跳——长时间听,靠的就是一致性。
  2. 起步比你以为的要慢。 普通话每个音节信息量很大;我英文听 1.8 倍,中文只听 1.3–1.4 倍。用一周时间慢慢往上加。
  3. 按内容类型喂对方式。 微信读书知乎就原地直读,别去复制粘贴一篇三千字的回答。论文或报告,就把 PDF 转成有声书,方便随时暂停续读。
  4. 拿它对付难啃的内容。 我一直把面向学生的文字转语音放手边,因为边听边跟读,对密集材料的记忆是真有帮助——文言文、法律条文,那些你本来要反复读三遍的东西。
  5. 用你自己的文字测中英混读。 如果你写的中文里夹很多英文,定下来之前,先把你自己的一段真实文字粘进任何工具试一下。演示用的段落永远是精挑细选的。

只要不是纯文章——需要登录的 App、PDF、AI 对话——一个专门的免费文字转语音阅读器,能帮你省掉那种会把习惯磨没的反复复制粘贴。

常见问题

最自然的免费中文 TTS 音色是哪个?

微软的神经网络音色——晓晓和云希——是免费能用到的最自然的,在 Edge 的朗读里直接有,Azure 免费档也能调。CastReader 同样用神经网络普通话音色,免费可用、无需注册,好处是它原地读页面,而不是逼你粘文字。

文字转语音能读中英混合吗?

有的能,但大多数读得不漂亮。弱引擎会把英文缩写一个字母一个字母拼出来,或者每次切换都卡顿。一定用你自己的一段混读文字测(带上"你的 KPI、跑个 demo"那种)——听十五秒,一切都清楚了。

能朗读微信读书或知乎吗?

能,前提是用一个在页面本身上工作、而不是粘贴框式的阅读器。CastReader 能在浏览器里直接读微信读书知乎,包括长篇回答,不用复制粘贴。

中文 TTS 能读对多音字吗?

现代神经网络引擎会看上下文,读对行、重、还这类字的概率比老式规则引擎高得多,但没有一个是完美的——碰到生僻人名或不常见的搭配,偶尔还是会读错。音色越好,出错越少。

有没有免费、不带试用期的选择?

有。Edge 朗读和系统自带音色,读纯文本永久免费。CastReader 在 Chrome/Edge、Mac、iOS、安卓上免费可用——无需注册、没有会到期的试用——而且能原地朗读中文 App 和页面;想要 premium 超真实语音、更多收听时长和 AI 文档分析,可以升级 CastReader Pro。有问题发邮件:support@castreader.ai

CastReader 团队

Try CastReader free — read anything aloud, anywhere

Free Chrome extension + iOS + Android + Mac. No login. Generous free tier, optional Pro. Works on Kindle, PDF, Google Docs, websites — 40+ languages.

Any website· Kindle / WeChat / Notion· PDF / EPUB / DOCX· 40+ languages

★★★★★ 4.7 · Free to start · No login · Optional Pro

中文文字转语音:好用的工具与正确用法 | CastReader