在用 whisper 把自己录制的一些视频提取出字幕方便快速看, 他竟然有一个 prompt 的功能, 如果用默认的 tiny 模型, 结果是繁体中文的,因为 openAI 是这么训练的, 但是如果在 prompt 里加入"对话为简体中文", 结果就给你转成简体中文了. 如果我在 prompt 里加入"主题是代码开发" 那里面一些乘除之类的文字也会写对.
还测试了一下模型问题,tiny 问题太多,好多文字是同音的但是不正确, medium 好很多, large 速度慢很多有些错误竟然比 tiny 还离谱, "零元购"给出的是"0 元够",感觉是训练词库里缺了?
whisper 这算不算是一个小语言模型了, 给出 prompt 后,他竟然会根据指令去调整给出的结果, 好像还能自动翻译,这真的惊到我了 |
|