76 条回复  ·  7971 次点击
TheOutgoing 初学 6 天前
降智很厉害,相比一个月前已经是弱智了
ksedz 小成 6 天前
我遇到的问题是它面对复杂的问题总想“简化”,不解决
dcatfly 初学 6 天前
GLM 黑五推广给返消费的 40%,所以最近超多他的软广
iyaozhen 初学 6 天前
@crytis 公司内在用的 kimi-k2 doubao-code deepseek-3.2 都还行 Claude 不让用 没办法
jzx8270056 初学 6 天前
尤其是在遇到一些问题,当你对他提出质疑的时候,他会瞬间的认错。然后,你让他认真一点,他所有的态度都会表达的很谦虚,听你指挥,然后能力不咋地
freefcw 小成 6 天前
glm 和 m2 大概半斤八两,但是没有 m2 的稳定,m2 的量其实也不少。。。反正我是不会再考虑 glm 了。。。kimi 算是国内效果最好的了,就是量确实有点捉急
shawnvan 初学 6 天前
确实一般,开的年包,加了 openspeckit ,很多时候写出匪夷所思的实现,或者一个任务明明没干完,居然就跳过到下一步了,constitution 限制都限制不住,感觉并没有好好打磨
sunny352787 小成 6 天前
纯废物,还和 sonnet4.5 比呢,haiku3.5 都比不上
kaichen 小成 6 天前
如果买得起正品,肯定不要浪费时间去使用所谓低价平替。
kindjeff 小成 6 天前
国产几个 benchmark 分高的都试过,minimax m2 / kimi-k2-thinking / glm-4.6 ,都不太行。 同一个 agent 同样的环境和提示词,用 minimax m2 跑了一刀乐没跑出结果;用 sonnet 4.5 一句就解决问题
返回顶部