# 前言

最近上了个网课,由于是直播课,没有字幕,感觉不太爽,调研了一下 目前没有基于本地 whisper 的实时字幕软件.. 于是自己手搓了一个~ 欢迎 star

传送门: https://github.com/Relsoul/whisper-win-gui

# 支持功能
- 实时语音识别
- 实时语音识别结果展示
- 实时语音识别结果 websocket 推送
- 系统音频监听(windows)
- 网页 video websocket 推送及字幕功能


研究网页捕捉 audio 流花了一点点时间~ audiocontext 获取的有点点问题~ 改捕捉 video 流 filter audio 了~

对 gui 开发不太熟~ 本来想用 webview 的,但是又没透明效果 还好有 flet~


更多简介 github 已经列出来了~ 这里就不再重复列出了,希望能帮到有需要的人
举报· 41 次点击
登录 注册 站外分享
3 条回复  
lekai63 小成 2024-9-21 00:15:45
楼主 你这项目 拿来看 av 应该不错
fonlan 小成 2024-9-21 00:20:39
star 为敬,希望能支持对识别出的语音实时翻译,跟老外开会比较有用
ruobingm 小成 2024-9-21 14:18:30
@lekai63 一下眼界就开阔了~
返回顶部