32 条回复  ·  3853 次点击
yidinghe 小成 2025-1-28 16:06:23
本地跑 deepseek 蒸馏的 qwen7b 模型,问“女儿将 38 分改为 88 分令父亲崩溃”的逻辑推理问题,答不出来。 这也能让我观察到当超出能力上限时大模型的表现,其思考过程就是一堆的车轱辘话,“但更有可能的是……”翻来覆去的生成,实际上并没有更进一步的推理,
ccxxjjjjjj 初学 2025-1-28 16:06:34
deepseek 只有网页端的时候就在用了,回复的深度和广度是我感觉是目前国产大模型中唯一能和 chatgpt 掰掰手腕的。claude 老给我封号,gpt 打算再用一个月试试,都打算停掉 plus 订阅了
ccxxjjjjjj 初学 2025-1-28 16:08:07
R1 刚上的时候就去测试使用了,速度比 O1 快得多。目前应该是用户太多,速度上明显下降了不少。
1234
返回顶部