寻找飞书妙记(语音转文本)平替?

jiaqiliu · 2024-11-12 22:21:28 · 630 次点击

飞书妙记的免费版开始限制 ASR 的时长了(每月 300 分钟)。有没有其他免费的替代品?或者本地部署的也可以。

https://imgur.com/a/AzL3e7i

举报· 630 次点击
登录 注册 站外分享
4 条回复  
simonsww 初学 2024-11-13 01:43:17
同找,妙记日常用的还挺多
cyp0633 小成 2024-11-13 00:26:44
实现随便你,但是搭配的模型可以试试 belle-large-v3-punct ,在 whisper 基础上微调过效果好多了
jiaqiliu 楼主 初学 2024-11-13 00:13:26
自己简单研究了下,有几个工具,都是离线方案: https://github.com/CheshireCC/faster-whisper-GUI faster-whisper 的 GUI ,bug 有点多,任务经常卡死,弃 https://github.com/chidiwilliams/buzz 也是一些 asr 引擎的 GUI ,比 faster-whisper 稳定,但是在我电脑上无法正常调用 GPU ,弃 https://github.com/SubtitleEdit/subtitleedit 主要是一个字母编辑软件,但是其中可以调用自选的底层引擎进行 ASR ,可以正常使用 GPU ,缺点是 ASR 没有进度条,其他还不错目前用的这个。笔记本 4060 ,用 largev3 模型处理一个 90 分钟的视频耗时 15 分钟。
wkla 小成 2024-11-12 22:31:45
openai whisper. 阿里达摩院 funasr.
返回顶部