|
R1 可以理解为。在极其有限的成本下,跑出了较为优秀的效果。但是从性价比上来说,最优秀的模型的训练成本比他高了 N 倍,并没有多出 n 倍的领先优势。
我本地和官网都做了不少测试,和其他网上的测试者观点差不多一致。就是存在很大的波动性。因为目前他是靠高质量数据冷启动的,所以一旦触及到什么鬼知道的情况,就波动很大。
还有就是 R1 是纯文本小参数推理,O1 可是多模态大参数推理。说的“夸张”一点。O1 的常识。R1 可能需要推理出来。而且 O1 还能识图,这个是更复杂的融合。
所以我相信但凡用过 R1 的人都能发现,R1 极其的啰嗦。O1 的思考时间就短很多。
举个简单的例子,我昨天试的。一个小学数学题。o1 mini 思考 1 秒,结束给答案。deepseek 思考几分钟,反复质疑自己十五次。虽然答案是对的。但是可见其诡异的波动。
至于什么英伟达大跌完全我看是一波做空+媒体协助。。。deepseek 之前才几个人知道,几个人用。。现在这波用户挤入他没有算力。。一切都是扯淡。 |