32 条回复  ·  3651 次点击
dzdh 小成 2025-8-29 16:11:00
阿里音色克隆免费的吧.
yianing 小成 2025-8-29 16:26:45
minimax 一个音色 10 块钱,合成声音的话 4 元/1w 汉字
TQQQ 初学 2025-8-29 17:26:02
StyleTTS+Vocos ,开源的非自回归模型,可以直接部署在 cpu 服务器上,4090 上训练大概要一周左右。但是年头有点久了,效果比不上 cosyvoice/indextts 这些
bigtear 小成 2025-8-29 17:35:03
微调 Kokoro TTS 吧,满足你的需求,速度快,可自定义音色(微调音色 pt 文件)
Huelse 小成 2025-8-29 17:40:19
自己调模型 https://github.com/benjaminwan/ChineseTtsTflite
tcper 小成 2025-8-29 17:48:00
自己搭完就会发现还是云服务便宜
looveh 初学 2025-8-29 18:38:13
怎么没有 index-tts
looveh 初学 2025-8-29 18:41:35
@looveh RTX 3090 实测 120 字不到 20s
pipi32167 初学 2025-8-29 18:47:42
同推荐 minimax ,效果可以的。价格也不贵。
pipi32167 初学 2025-8-29 18:51:42
@bigtear 之前 Kokoro 放出来的中文一言难尽。。。不过能微调 Kokoro 的话确实又快又好。
返回顶部