飞社-令人惊奇的创意工作者社区-问与答请问这次“Deepseek 吊打 OpenAI”的真实性如何？

yidinghe

本地跑 deepseek 蒸馏的 qwen7b 模型，问“女儿将 38 分改为 88 分令父亲崩溃”的逻辑推理问题，答不出来。这也能让我观察到当超出能力上限时大模型的表现，其思考过程就是一堆的车轱辘话，“但更有可能的是……”翻来覆去的生成，实际上并没有更进一步的推理，

ccxxjjjjjj

deepseek 只有网页端的时候就在用了，回复的深度和广度是我感觉是目前国产大模型中唯一能和 chatgpt 掰掰手腕的。claude 老给我封号，gpt 打算再用一个月试试，都打算停掉 plus 订阅了

ccxxjjjjjj

R1 刚上的时候就去测试使用了，速度比 O1 快得多。目前应该是用户太多，速度上明显下降了不少。