有没有能识别多人声音的 AI 工具呢

iceriver99 · 昨天 01:51 · 1340 次点击

就是我现在有一个视频,这个视频中有三个人在对话,我想通过语音识别来分别识别出这三个人都谁说了哪句话,并且把它导出成文本标记出来。然后方便我去做翻译。。。

举报· 1340 次点击
登录 注册 站外分享
12 条回复  
jiobanma 初学 昨天 09:25
阿里的通义听悟
dzdh 小成 昨天 09:19
阿里的语音识别 API 可。
evan1 小成 昨天 09:19
@evan1 没注意是已有视频。这样的话可以看看转录行不行。
evan1 小成 昨天 09:17
@evan1 是会议还是直播忘记了。 当时看到这个功能大受震撼。
evan1 小成 昨天 09:16
钉钉会议可以实现,用过一两次。识别准确率估计 80%-90%左右。
mfy 初学 昨天 09:10
sherpa-onnx ,FunASR 这两个都可以。测试下来,感觉 sherpa-onnx 识别的准确度稍高一些;使用上 FunASR 简单一些。
JayZXu 小成 昨天 08:24
飞书个人版的妙记 直接上传视频,会自动生成字幕而且匹配发音人 可能会识别出多个发音人,改下标注就行了 而且还能切换各种语言翻译的结果
gpt5 小成 昨天 08:22
我记得当年学 svm 的时候,老师给过一个例子,用 1 行 matlab 代码(非工具箱)就实现了区分不同人的声音。
NOneKnowYeah 小成 昨天 08:20
通义听悟
12下一页
返回顶部