有没有能识别多人声音的 AI 工具呢

iceriver99 · 17 小时前 · 1339 次点击

就是我现在有一个视频,这个视频中有三个人在对话,我想通过语音识别来分别识别出这三个人都谁说了哪句话,并且把它导出成文本标记出来。然后方便我去做翻译。。。

举报· 1339 次点击
登录 注册 站外分享
12 条回复  
kirieievk 小成 17 小时前
关注!
Perry 小成 16 小时前
有很多 Podcast 生产力工具支持这样的,Perplexity 搜下试试看?
vopin 初学 12 小时前
同样需求,一年多前调查的时候暂时没找到一步到位的工具。whisper 虽然很厉害了但是分辩人不行,一些经典机器学习方法也不完美。 现在不知道怎样了
NOneKnowYeah 小成 11 小时前
通义听悟
gpt5 小成 11 小时前
我记得当年学 svm 的时候,老师给过一个例子,用 1 行 matlab 代码(非工具箱)就实现了区分不同人的声音。
JayZXu 小成 11 小时前
飞书个人版的妙记 直接上传视频,会自动生成字幕而且匹配发音人 可能会识别出多个发音人,改下标注就行了 而且还能切换各种语言翻译的结果
mfy 初学 10 小时前
sherpa-onnx ,FunASR 这两个都可以。测试下来,感觉 sherpa-onnx 识别的准确度稍高一些;使用上 FunASR 简单一些。
evan1 小成 10 小时前
钉钉会议可以实现,用过一两次。识别准确率估计 80%-90%左右。
evan1 小成 10 小时前
@evan1 是会议还是直播忘记了。 当时看到这个功能大受震撼。
12下一页
返回顶部