有没有能识别多人声音的 AI 工具呢

iceriver99 · 昨天 01:51 · 1343 次点击

就是我现在有一个视频,这个视频中有三个人在对话,我想通过语音识别来分别识别出这三个人都谁说了哪句话,并且把它导出成文本标记出来。然后方便我去做翻译。。。

举报· 1343 次点击
登录 注册 站外分享
12 条回复  
kirieievk 小成 昨天 02:36
关注!
Perry 小成 昨天 03:06
有很多 Podcast 生产力工具支持这样的,Perplexity 搜下试试看?
vopin 初学 昨天 07:01
同样需求,一年多前调查的时候暂时没找到一步到位的工具。whisper 虽然很厉害了但是分辩人不行,一些经典机器学习方法也不完美。 现在不知道怎样了
NOneKnowYeah 小成 昨天 08:20
通义听悟
gpt5 小成 昨天 08:22
我记得当年学 svm 的时候,老师给过一个例子,用 1 行 matlab 代码(非工具箱)就实现了区分不同人的声音。
JayZXu 小成 昨天 08:24
飞书个人版的妙记 直接上传视频,会自动生成字幕而且匹配发音人 可能会识别出多个发音人,改下标注就行了 而且还能切换各种语言翻译的结果
mfy 初学 昨天 09:10
sherpa-onnx ,FunASR 这两个都可以。测试下来,感觉 sherpa-onnx 识别的准确度稍高一些;使用上 FunASR 简单一些。
evan1 小成 昨天 09:16
钉钉会议可以实现,用过一两次。识别准确率估计 80%-90%左右。
evan1 小成 昨天 09:17
@evan1 是会议还是直播忘记了。 当时看到这个功能大受震撼。
12下一页
返回顶部