GitHub 仓库: https://github.com/Orenoid/BabelDuck
在线 Demo:BabelDuck
嫌太长不看的朋友可以直接体验下,应用内置了一个简单的教程,来说明为什么更合适刚入门英语口语练习的人。
( P.S. 目前还是 MVP 版本,易用性方面后续会继续打磨,有问题可以提 issue )
一些截图

这个应用尝试解决什么痛点?
虽然 GitHub 上已经有不少开源的对话练习应用了,但我之前在尝试用它们练习的时候,遇到了一个问题:
我口语太菜了,很多时候上来就直接卡壳,嘴巴一张半天嘣不出几个词,或者磕磕巴巴地说完了但也不知道这么表达对不对,尝试过在 prompt 里让 AI 帮忙分析和纠正我的问题,但很多时候对话一长,AI 就老忘了这事儿,或者开始说车轱辘话,不好使。
结果就是练习过程特别不流畅,还经常得停下来切出去查东西,体验非常糟糕。
所以我决定开发一个功能定位略有不同的 AI 口语应用,在 BabelDuck 引入了快捷指令的功能,由另外一个 AI 专门负责协助你的口语表达,直接翻译、语法纠正、表达润色之类的都能做,而且如果对它提供的结果有疑问的话,还可以开启子对话,进一步讨论语法表达问题,并且不影响当前对话。
更重要的是,你可以完全根据自身需求自定义指令,比如:
- 模拟面试中遇到不会或者不知道英语咋回答的,直接让 AI 示范回答一遍
- 假如你的英文水平还行,但偶尔有些术语想不起来,可以夹杂一两个中文单词,然后让 AI 替换成英文
- 让 AI 为你提供一组等效的表达,扩充词汇、短语积累
- ……
应用还有哪些功能
除了上面介绍的,常规的 AI ChatBot 应用的功能也是有的,例如对话管理、语音输入、语音输出、LLM 服务切换等等。
目前尚处于 MVP 阶段,有些功能还需要打磨,后续会继续完善。
未来规划
接下来打算更新的功能(不一定按这个顺序):
- 对话模板
类似于其他 ChatBot 的 Copilot ,但是可配置程度更高,除了 system prompt ,可以预设一段前置对话,可以给每个模板设置使用不同的模型、语音、音色、快捷指令等等。
- 接入更多 LLM/TTS/STT 服务
因为是 MVP 版,目前其实只内置支持了一小部分平台,后面继续接入更多服务,比如 Azure STT, Google Gemini 等等
- 复述练习模式
让用户可以在 AI 给出修改后的回复后,练习复述,增强记忆效果
- 语音回放
现在只是单纯地把语音转成文本,后续会把音频存起来,支持回放自己的语音(如果有合适的模型,没准还可以做发音分析和纠正)
- 支持多模态语音
目前的对话实现都是基于 TTS 和 STT ,目前已经陆续有一些开源或闭源模型支持端到端语音消息了,会尝试接入这类模型。
- 实时语音模式
就是 OpenAI 推出的那个 Realtime API ,这个优先级不高的原因是:1.太贵了,目前估计没太多人会用; 2.口语能流畅到跟 AI 实时对话的大佬,可能看不上我这个产品。所以,会接入这个模式,但优先级暂时靠后,视用户反馈而定。
- 更多指令类型
- 插件系统
其他
这里得道个歉,标题里的“开源”其实是不太严谨的说法,这个项目的 License 其实是限制商业用途的(所以不符合严格意义上的开源定义),但个人可以免费使用和修改,99% 的人应该都不受影响。
总的来讲源代码是开放的,只是不符合狭义上的开源定义,为了挑选这个 License 还花了一些时间去调研,回头另外开贴讲下,之前在站内搜索也有看到有人在找这种 License 。
|