本文使用“署名-非商业性使用-相同方式共享 4.0 国际(CC BY-NC-SA 4.0)”进行许可。
商业转载请联系站长获得授权,非商业转载请注明本文出处及文章链接。 如果您再混合、转换或者基于本作品进行创作,您必须基于相同的协议分发您贡献的作品。
Caution
目前原本用的这个免费试用接口用不了了,现在有两种替代选择:
如果没有 Azure 账号,可以看看我之前写的用 Edge 的大声朗读接口做的,爱阅听书 微软TTS Vercel部署教程(Edge 大声朗读)
如果愿意折腾下注册个 Azure,可以试试直接用 Azure 的官方 API,好处是每个月可以免费合成 50 万字符,同一个账号可以在不同区开好几个免费层,实际可以有好几个 50 万,而且到限额自动停,不会莫名其妙扣费。见本文 使用官方 API:创建资源、导入软件 标题下的内容。
Edge 大声朗读 API | Azure 官方 API | |
---|---|---|
优点 | - 不用 Azure 账号 | - 稳定的访问和使用 - 完整的功能 |
缺点 | - 较为严格的请求频率限制 - 只可用部分声音(只有 14 个中文的) - 无声音风格等高级功能 | - 需要注册一个账号 - 每月 50 万字符的免费额度 |
链接 🔗 | 听书 ms ra Vercel版 | 使用官方 API:创建资源、导入软件 |
我重新整合了一下本文,主要介绍下第二个选择;如果对已经失效的方法感兴趣可以看看 原文章 这一标题下的内容。
Tip
也可以直接前往 帮助:Azure 创建资源 - TTS Importer 查看创建资源的详细步骤
简单来讲,就是注册好一个 Azure 账号,然后按以下步骤操作:
创建资源:
搜索语音然后创建它:
填好表之后点“审阅并创建”即可。
在新页面选择“转到资源”,就在“概述”页面就能看到密钥和区域 southeastasia
了。(这张图和上张图不是截的同一个 tts 项目)
复制好区域(region)和密钥(key),打开我写的这个导入器,就可以把它导入到各个阅读软件里听书了。(目前支持阅读、爱阅记、源阅读;爱阅书香需要手动导入)
微软 TTS 导入器 https://tts-importer.yfi.moe
如果有其他软件的用户看到这篇文章,同时你用的阅读软件支持自定义语音源,请联系我,如果能加上的话我尽量加上。
对于 爱阅书香
用户,由于不支持自定义的导入,所以只能手动一个一个输入;而这个其实挺多要输入的(不然我也不会做导入工具了),改天做个一图流;方便的方法可能是下一个爱阅记然后导入;把爱阅记里的配置一个一个复制到爱阅书香里。
Important
已经失效!接口被微软干掉了。
原项目地址:x-dr/tts - GitHub
本文使用的是我小改之后的 yy4382/azure-tts ,改了前端和 cf_workers.js。
由于是直接调用的一个(不知道那里找到的)试用接口,搭建特别方便,同时还提供了 demo,不像搭建也能直接用。
而且这个接口是全功能的,意味着可以使用诸如语调之类的高级功能,这是 Edge 的大声朗读接口没有的。
实际上这个项目是将我们的 GET 请求转换为向微软试用接口的 POST 请求,所以理论上只要客户端支持 GET 请求的自定义语音源就都可以用。
爱阅、阅读、源阅读我测试可用,其他支持自定义语音源的,只要支持使用 GET 发送请求应该都行。
先进入网页 https://ttsdemo.yfi.moe,选出自己喜欢的组合。
在下面的图中,可以看出每个选项标题对应一个参数名(括号中的英文,比如 voice),这是配置的时候要用到的;而每个选项都有一个复制按钮,按下会复制选中的参数值(比如按声音右侧的复制就会复制目前所选声音到剪贴板)。
在网页上选好想要的组合,在装有阅读的手机上点击“一键导入阅读”即可。
网页设置的“语速”不会生效,由听书时的滑块控制
在网页上选好想要的组合,点击“复制源阅读导入链接”,然后打开源阅读,我的 -> 语音管理 -> 右上角 -> 网络导入。
网页设置的“语速”不会生效,由听书时的滑块控制
由于我没找到爱阅的网络导入功能,只能手动配。
注意这部分的配置都是大小写敏感的,不要打错了
打开爱阅书香,进入设置 ->听书 ->自定义语音库 ->创建
/audio
,最终填进去的应该形如 https://一些字母.vercel.app/audio
,或者 https://tts.*****.workers.dev/audio
。记得点右上角的保存text
,内容填%@voice
,内容填声音(网页上按复制按钮会自动添加到剪贴板,形如 zh-CN-Xiaoxiao
)。voiceStyle
,内容填声音风格。有些语音没有这一选项,可以不添加这个参数,也可以空着。如果乱填会被忽略。pitch
,内容填音调。网页上给了 6 个可选项,但是实际上是可以无级调节的,详见文末的附。rate
,内容填语速。实际上爱阅有自己的语音加速功能,这个相当于设定了一个基准,一般来说爱阅自己的语速调整范围就够大了,不用加这个参数。本文使用“署名-非商业性使用-相同方式共享 4.0 国际(CC BY-NC-SA 4.0)”进行许可。
商业转载请联系站长获得授权,非商业转载请注明本文出处及文章链接。 如果您再混合、转换或者基于本作品进行创作,您必须基于相同的协议分发您贡献的作品。