需求是:

  1. 自动断句
  2. 能在指定的语言中识别,知道切换语言
  3. 最好别太贵,按次/时间付费就行,场景不多
  4. 最好能识别专业领域的词汇,或者让我写几个关键词进去
  5. iOS 端

用了讯飞同传,Felo 。

讯飞同传似乎不会自动识别不同语言,只会识别指定的语言,而且不会断句,一旦出现中英同时说的情况就混乱了;

Felo 29r/120min 还行,不知道有没有更好的替代。

举报· 207 次点击
登录 注册 站外分享
1 条回复  
wangyaominde 小成 16 小时前
感觉可以手搓一个纯离线的,用 stt 做识别,大模型做翻译,cosyvoice 做声音复制
返回顶部