更方便地导入微软 TTS 听书:阅读、爱阅书香、源阅读(Azure 官方/试用接口)

Tip

阅读本文前,可以先看一看我的 听书方法整理汇总 哦🤗

如果您使用爱阅记,可以在爱阅的 QQ 群/频道里找到可以直接导入的文件

Caution

目前原本用的这个免费试用接口用不了了,现在有两种替代选择:

  1. Edge 大声朗读:非官方公共 API。 官方介绍 | 使用教程
  2. Azure 文本转语音:官方公共 API,有免费额度。官方介绍 | 使用教程

如何选择?

Edge 大声朗读

如果没有 Azure 账号,可以看看我之前写的用 Edge 的大声朗读接口做的,爱阅听书 微软TTS Vercel部署教程(Edge 大声朗读)

Azure 文本转语音

如果愿意折腾下注册个 Azure,可以试试直接用 Azure 的官方 API,好处是每个月可以免费合成 50 万字符,同一个账号可以在不同区开好几个免费层,实际可以有好几个 50 万,而且到限额自动停,不会莫名其妙扣费。见本文 使用官方 API:创建资源、导入软件 标题下的内容。

优缺点对比

Edge 大声朗读 APIAzure 官方 API
优点- 不用 Azure 账号- 稳定的访问和使用
- 完整的功能
缺点- 较为严格的请求频率限制
- 只可用部分声音(只有 14 个中文的)
- 无声音风格等高级功能
- 需要注册一个账号
- 每月50万字符的免费额度
链接 🔗微软TTS听书语音 Vercel部署使用官方 API:创建资源、导入软件

我重新整合了一下本文,主要介绍下第二个选择;如果对已经失效的方法感兴趣可以看看 原文章 这一标题下的内容。

使用官方 API:创建资源、导入软件

Tip

也可以直接前往 帮助:Azure 创建资源 - TTS Importer 查看创建资源的详细步骤

创建资源

简单来讲,就是注册好一个 Azure 账号,然后按以下步骤操作:

创建资源:

image

搜索语音然后创建它:

image

填好表之后点“审阅并创建”即可。

image

在新页面选择“转到资源”,就在“概述”页面就能看到密钥和区域 southeastasia 了。(这张图和上张图不是截的同一个 tts 项目)

image

导入

复制好区域(region)和密钥(key),打开我写的这个导入器,就可以把它导入到各个阅读软件里听书了。(目前支持阅读、爱阅记、源阅读;爱阅书香需要手动导入)

微软 TTS 导入器 https://tts-importer.yfi.moe

如果有其他软件的用户看到这篇文章,同时你用的阅读软件支持自定义语音源,请联系我,如果能加上的话我尽量加上。

对于 爱阅书香 用户,由于不支持自定义的导入,所以只能手动一个一个输入;而这个其实挺多要输入的(不然我也不会做导入工具了),改天做个一图流;方便的方法可能是下一个爱阅记然后导入;把爱阅记里的配置一个一个复制到爱阅书香里。

展开原文章

原文章

Important

已经失效!接口被微软干掉了。

原项目地址:x-dr/tts - GitHub

本文使用的是我小改之后的 yy4382/azure-tts ,改了前端和 cf_workers.js。

由于是直接调用的一个(不知道那里找到的)试用接口,搭建特别方便,同时还提供了 demo,不像搭建也能直接用。

而且这个接口是全功能的,意味着可以使用诸如语调之类的高级功能,这是 Edge 的大声朗读接口没有的。

实际上这个项目是将我们的 GET 请求转换为向微软试用接口的 POST 请求,所以理论上只要客户端支持 GET 请求的自定义语音源就都可以用。

配置

爱阅、阅读、源阅读我测试可用,其他支持自定义语音源的,只要支持使用 GET 发送请求应该都行。

先进入网页 https://ttsdemo.yfi.moe,选出自己喜欢的组合。

在下面的图中,可以看出每个选项标题对应一个参数名(括号中的英文,比如 voice),这是配置的时候要用到的;而每个选项都有一个复制按钮,按下会复制选中的参数值(比如按声音右侧的复制就会复制目前所选声音到剪贴板)。

image

阅读

在网页上选好想要的组合,在装有阅读的手机上点击“一键导入阅读”即可。

网页设置的“语速”不会生效,由听书时的滑块控制

源阅读

在网页上选好想要的组合,点击“复制源阅读导入链接”,然后打开源阅读,我的 -> 语音管理 -> 右上角 -> 网络导入。

网页设置的“语速”不会生效,由听书时的滑块控制

爱阅书香

由于我没找到爱阅的网络导入功能,只能手动配。

注意这部分的配置都是大小写敏感的,不要打错了

打开爱阅书香,进入设置 ->听书 ->自定义语音库 ->创建

  • 名称:任意
  • 合成字数:建议 200
  • 请求方式:GET
  • 地址:第一步里获取的网址,后边加上 /audio,最终填进去的应该形如 https://一些字母.vercel.app/audio,或者 https://tts.*****.workers.dev/audio。记得点右上角的保存
  • 参数 ->添加 ->请输入请求参数:text,内容填%@
  • 参数 ->添加 ->请输入请求参数:voice,内容填声音(网页上按复制按钮会自动添加到剪贴板,形如 zh-CN-Xiaoxiao)。
  • (可选)参数 ->添加 ->请输入请求参数:voiceStyle,内容填声音风格。有些语音没有这一选项,可以不添加这个参数,也可以空着。如果乱填会被忽略。
  • (可选)参数 ->添加 ->请输入请求参数:pitch,内容填音调。网页上给了 6 个可选项,但是实际上是可以无级调节的,详见文末的附。
  • (不建议加)参数 ->添加 ->请输入请求参数:rate,内容填语速。实际上爱阅有自己的语音加速功能,这个相当于设定了一个基准,一般来说爱阅自己的语速调整范围就够大了,不用加这个参数。
  • 解析字段 ->添加 ->请输入解析字段与规则:playData,内容填 ResponseData image

本文使用“署名-非商业性使用-相同方式共享 4.0 国际(CC BY-NC-SA 4.0)”进行许可。

商业转载请联系站长获得授权,非商业转载请注明本文出处及文章链接。 如果您再混合、转换或者基于本作品进行创作,您必须基于相同的协议分发您贡献的作品。

评论
  • 按正序
  • 按倒序
  • 按热度
Powered by Waline v3.3.0
2023-2024 Yunfi. | Source Code RSS | Site Map Powered by Astro. See all Credits.