18 条回复  ·  1961 次点击
RandyLuo 小成 昨天 13:27
https://livebench.ai/
chengyiqun 初学 昨天 13:37
claude 上下文 200k token deepseek 64K token 这还比啥编程领域, 长上下文明显更有优势
AoEiuV020JP 小成 昨天 13:39
我们在意的是在 AI 编辑器领域哪个模型配合编辑器最能实现用户想要的效果和代码,用脚投票而不是某种跑分,
InkStone 小成 昨天 13:47
不仅写代码。我实测下来很多任务 claude 3.7 的表现都很好,包括但不仅限于特定领域的文本生成,SVG 绘图生成,复杂任务理解和操作等等。
HUZHUANGZHUANG 小成 昨天 13:50
我不关心什么跑分,我只关心谁用的顺手
Promtheus 小成 昨天 14:24
懂了 claude 3.7 最强
seven777 初学 昨天 14:38
数学和推理 Grok3 目前最强, 代码 Claude3.7 最强. 可以反驳,但我不接受. "竞赛制编程"有什么明显的不同和特点?
iflint 小成 昨天 14:59
@enchilada2020 这么牛🐂
zekeluii 小成 昨天 14:59
寫代碼確實是 Claude 3.7 最強
12
返回顶部