16 条回复  ·  1801 次点击
imliuruiqi 初学 2025-9-25 15:06:43
非要本地的话也有一些量化后的小模型,但效果可能需要你自己实验一下 相关研究可以顺着 huggingface 的 smollm 去找: https://huggingface.co/blog/smollm
Tink 初学 2025-9-25 16:12:43
@maokg #3 单纯指令的话,看一下机芯智能的离线语音模块 su03t ,还有天问的 asr 系列,都可以满足。我在家里的智能家居控制用的都是这些
skallz 小成 2025-9-25 16:12:51
我觉得你这个方案就想错了,应该是做一个语音识别,然后根据关键词,去做对应的操作,而不是接入 llm 大模型。。。
me15000 小成 2025-9-25 16:22:16
@coefu 到处都能看到这个喷子,你到底懂不懂啊,不懂别瞎逼逼行不行
humminwang 初学 2025-9-25 16:33:33
gemma 3 270m 可以试试 500 多 MB 内存即可
wheat0r 小成 2025-9-25 17:16:42
我理解这个 OP 的这个逻辑,人是很复杂的,很多时候用户并不会给出指定的指令,确实需要端侧具有一定的思考能力。 比如用户可能并不会说“播放歌曲千万次的问”,而是说“给老子整个刘欢那个 ask 啥的歌”
op351 小成 2025-9-26 09:11:35
@wheat0r 我想了想 离网做了这个也没啥用 因为音乐软件还是要联网搜索,然后播放 哈哈
12
返回顶部