飞社-令人惊奇的创意工作者社区-程序员GLM v4.6 + Claude Code 可用性极差，被那些软广狠狠坑了一把

TheOutgoing · 2025-12-10 20:34:02

降智很厉害，相比一个月前已经是弱智了

ksedz · 2025-12-10 21:09:42

我遇到的问题是它面对复杂的问题总想“简化”，不解决

dcatfly · 2025-12-10 21:15:42

GLM 黑五推广给返消费的 40%，所以最近超多他的软广

iyaozhen · 2025-12-10 21:17:33

@crytis 公司内在用的 kimi-k2 doubao-code deepseek-3.2 都还行 Claude 不让用没办法

jzx8270056 · 2025-12-10 21:21:39

尤其是在遇到一些问题，当你对他提出质疑的时候，他会瞬间的认错。然后，你让他认真一点，他所有的态度都会表达的很谦虚，听你指挥，然后能力不咋地

freefcw · 2025-12-10 21:52:54

glm 和 m2 大概半斤八两，但是没有 m2 的稳定，m2 的量其实也不少。。。反正我是不会再考虑 glm 了。。。kimi 算是国内效果最好的了，就是量确实有点捉急

shawnvan · 2025-12-10 22:14:02

确实一般，开的年包，加了 openspeckit ，很多时候写出匪夷所思的实现，或者一个任务明明没干完，居然就跳过到下一步了，constitution 限制都限制不住，感觉并没有好好打磨

sunny352787 · 2025-12-10 22:51:23

纯废物，还和 sonnet4.5 比呢，haiku3.5 都比不上

kaichen · 2025-12-10 23:02:16

如果买得起正品，肯定不要浪费时间去使用所谓低价平替。

kindjeff · 2025-12-10 23:24:56

国产几个 benchmark 分高的都试过，minimax m2 / kimi-k2-thinking / glm-4.6 ，都不太行。同一个 agent 同样的环境和提示词，用 minimax m2 跑了一刀乐没跑出结果；用 sonnet 4.5 一句就解决问题