我想找一个工具,可以尽量区分对话中不同人物,根据人物进行音频分割。如果做不到这种层次,简单区分男女声进行分离的也可以。
举报· 1137 次点击
登录 注册 站外分享
10 条回复  
wweerrgtc 小成 前天 10:02
语音转文字的工具, 都可以区分是谁在说话
fengci 小成 前天 10:03
一些公司的成品,有会议记录功能,都有看到这个功能。
Frankcox 楼主 小成 前天 10:04
@wweerrgtc Whisper 命令行直接运行可以进行区分吗?我之前用 whisper 只语音转文字过,没试过区分。
fengci 小成 前天 10:04
@fengci 好像最近发布的手机 支持 AI 的 都支持好像。
Frankcox 楼主 小成 前天 10:12
@fengci #4 我主要还是想运行在 PC 上,同时执行其他代码逻辑
raydied 小成 前天 10:36
模仿飞书或腾讯会议吗?一般用声纹识别的方案。
Frankcox 楼主 小成 前天 10:48
@raydied 不是商业或者公司方面,单纯个人玩的项目,所以想找些本地能跑的开源方案。
cyp0633 小成 前天 10:55
whisper.cpp 应该支持 NER ,但应该是需要搭配特定模型的,然后还有这篇文章 https://arxiv.org/abs/2409.08107 或许也相关
sighforever 小成 前天 11:02
阿里出的 funasr 工具包
12下一页
返回顶部