AI 技术在飞速发展,比如美颜换脸、 文字识别 、 语音识别 、 移除图片背景 、自动驾驶等等都在 生活 的各个方面起到了应用。而「 语音合成 TTS 」方面,如今实用性也已非常惊人了。
像 腾讯云 、 阿里云 、百度云等都推出 文字转语音 在线服务 API,但合成的人声大多时候都很容易听出“机器人味”。而 微软 的 Azure TTS 文本转语音服务 效果就比较让人惊叹了!它拥有多种 声音 和情感风格,能像真人一样朗读出抑扬顿挫,使得合成的人声非常逼真自然,不妨来看看……
微软自然语音转换 - 像真人般将文本朗读出来并保存成音频
「 微软文本转语音 」 Azure Text to Speech 是一个能将文字转换成真人般自然朗读的云服务,相比同类 TTS 强大之处在于,它借助 AI 神经网络技术,让合成的语音拥有媲美真人的表现力,实现人声语调与情感匹配,朗读时能表现出高兴、悲伤、新闻广播、客服、恐惧、耳语等情感。
加上语速、语调、发音、停顿都可以由用户调节,实际生成的语音非常自然逼真!完全不再像机器人了!因此 微软文本转语音 技术 几乎能应用在任何场景。 新版的 Edge 浏览器 的朗读功能就是基于此 技术 而来。可惜此服务是付费的,你还懂 编程 才能用上它,这似乎离普通用户很远?
别急!其实, 微软 提供了一个免费的 在线 DEMO 演示 ,可以让用户随便输入文字实现在线试听 (但字数有限制,且试听无法保存)。于是,高手们纷纷各显神通,给我们带来了几款如 微软语音合成助手 、 Edge-TTS-record 、 微软 TTS 下载按钮脚本插件 等免费工具,可以帮助你将一大段文字转换成音频导出 mp3 或录制成 wav 保存下来,用于其他地方。
微软 TTS 朗读效果预览:
我们先来听几段 微软文本转语音 的效果吧,相信你一定能听出来,它真的比目前大多数 TTS 同行要优秀很多,情感表现力简直满分!开心、严肃不同场景可以用不同的调调,就连讲个鬼故事也都能讲出害怕的感觉。
其实如今在 哔哩哔哩 、抖音、快手里好多 视频 的配音,都有使用了这个微软语音库来生成,人的声音听起来很自然,不特意地去留意,基本都分辨不出来是用机器合成的。
微软语音合成助手免费版 (Windows)
「 微软语音合成助手 」是一款完全免费的文字转语音的 Windows 电脑版软件,它绿色免安装,而且体积小巧,打开就能使用 (需联网),软件界面非常简洁,上手即会使用。
它完全借助了微软的 Azure TTS 服务来将文字合成并生成语音,支持在线试听,也可以保存成 mp3 音频文件,效果非常接近真人朗读!不仅真实自然,而且也能设置它的情感风格、语速、停顿、音量等等。
微软语音合成助手可以支持导入 TXT、SRT 字幕、 PDF 多种格式的文档文件,甚至还能支持 JPG、PNG 截图里的 文字识别 并导入成文本内容。并且重点是,此软件使用了分段下载合并的方式解决了一次只能转换 2500 个字数限制的问题。
软件支持保存导出编辑内容,支持 翻译 ,自动排版,自动标点,文本替换,敏感词提醒,敏感词替换,SSML 多人语音混编等多种功能,还可以实现 批量 转换。
浏览器插件:微软 TTS 下载音频按钮(油猴脚本)
前面说到, 微软 TTS 本身提供了文字转语音的 在线演示的网页版 ,可以让用户在 浏览器 上输入或粘贴文本,转换成语音进行试听,但官网上并不提供下载功能。因此,有开发者制作了这么一个「 微软 TTS 下载音频按钮 」插件,可以让你将试听的语音 下载 保存成 MP3 音频。
这款浏览器 插件 是完全免费的,它是以 UserScript (油猴脚本) 的形式提供的,比如 Chrome 、 Edge 等浏览器安装了 Tempermonkey 插件 后就能安装此类脚本。安装成功并启用的话,微软 TTS 的网页上除了试听按钮以外,还会如上图一样,增加一个「 下载音频 」的按钮。
所以,如果你使用 Mac 、 Linux 或者不希望下载第三方软件,那么使用此脚本也可以在浏览器里搞定文本转音频。
Edge-TTS-record 开源录制工具
这款 开源 免费的「 edge-TTS-record 」工具,是一款可以录制 Microsoft Edge 浏览器 的语音合成(TTS)语音并输出为 .wav 音频的 Windows 版工具。另外,网上也有一款名为「 Read Aloud by asup 」的工具与此程序几乎一样,暂不知道是否同一作者。
由于 Edge 浏览器 也是使用了 微软 Azure TTS 的技术,因此它拥有了同样的逼真自然的声音引擎,包括了晓晓、云杨等人物声音。不过相比前两者,此工具的实现方法是需要将试听的声音进行“录音”而来的,因此录制时间较长,同时过程中也可能受到系统其他软件声音的影响。
aspeak - 命令行文字转语音工具:
对于有特殊需求的朋友,还有一款
命令行
版的微软 TTS 语音合成工具
aspeak
,这是用
Python
编写的基于 Azure 语音合成的命令行程序,安装简单,还可以跨平台使用。
#安装 aspeak
pip install --upgrade aspeak
# 最简单的例子:
aspeak -t "异次元软件世界,你好呀!" -l zh-CN
#导入 .txt 文件,并转换成 .wav 音频保存
aspeak -f input.txt -l zh-CN -o ouput.wav
更多具体的参数,比如怎样指定语音,大家可以看 aspeak 的 官方文档 。至于此工具的的实际应用例子嘛,就得看大家发挥想象力和二次 开发 的能力了。
总结:
不管你是 视频 UP 主、自媒体还是 办公 人士,借助微软 Azure TTS 的 语音合成引擎 来不仅能录制一些旁白、朗读稿子 电子书 、给视频配音等,也能自娱自乐,给生活和工作都带来方便与乐趣。
上面的几款工具都是免费的,感兴趣和有需要的朋友都可以下载使用。当然了,微软这个 TTS 云服务接口本来是需要付费的,而这些免费工具都是基于 微软的免费 Demo 演示 开发而来,哪一天要是被关掉了,可能就无法使用了。所以,免费有限,大家且用且珍惜吧……
相关文件下载地址
官方网站:
访问
软件性质:免费/开源
相关链接:
人工智能相关
|
微软相关
|
视频相关
|
素材相关
|
语音相关
解压密码:
www.iplaysoft.com
下载微软语音合成助手 (Win) | Edge-TTS-record (Win) | 微软 TTS 下载按钮 (浏览器脚本)