想咨询一下各位最近使用的这几个模型体感哪个更强呢?

Agent 场景,主要是 tool using/vibe coding

入围的:

  • Claude Opus 4.6
  • Claude Sonnet 4.6
  • GLM 5
  • Kimi k2.5
  • MiniMax M2.5
  • Gemini 3
  • Chatgpt 5.2

如果还有推荐的也可以写(比如 chatgpt )

由于 prompt 其实和模型是较为绑定的(这个很类似当年针对某个芯片版本写的汇编优化,当芯片/编译器版本换了,方法也就失灵了),所以希望选择一个半年内持续使用的模型。希望了解一下大家目前在 tool using/vibe coding 哪个更方便?

公司生产场景,部署在美东

目前在 openrouter 平台,有什么更好的平台也推荐。

参考:

举报· 1237 次点击
登录 注册 站外分享
11 条回复  
yusf 初学 昨天 22:03
Claude + Chatgpt 家的,自己模型还是要配自家的工具才厉害
SingeeKing 小成 昨天 22:06
我的选择 - 日常 GPT-5.3-Codex (xhigh) - 疑难杂症 GPT-5.2 (xhigh) - 超级疑难杂症 GPT-5.2 Pro
iamnotcodinggod 初学 昨天 22:12
Claude code default 就行了,让它灵活在 opus 和 sonnet 之间切换,碰不到 5 小时限制。如果纯用 Opus ,大概一个半小时就会碰到。 碰到了就转 Codex 5.2 最高 reasoning effort.
maolon 小成 昨天 22:19
这个都不用问的, 全自主 agent 和超长程任务(> 15hr 持续执行)用 gpt 系列( 5.2 high/xhigh and/or 5.3 codex high/xhigh ), copilot 模式(你和 agent 合作写)用 claude 的 sonnet 4.6 + opus 4.6, 另外建议搭配各家自己的套餐使用(也就是 codex 用 gpt 订阅,cc 用 claude 订阅),以及 opus 价格非常高,注意使用限制
Bad0Guy 小成 昨天 22:32
我直接在 cli 里让 Gemini/codex/cc 通过 mcp 分工,只用 sonnet/opus 的话额度烧得很快,而且不一定能一次就达到你要的效果
doraemonki 小成 昨天 22:35
@Bad0Guy 老哥 mcp 用的啥
mogutouer 小成 昨天 23:23
Opus 断层领先,这一点疑问也没有
gpt5 小成 7 小时前
@maolon 全自主 agent 和超长程任务 用的啥方案啊?
issakchill 小成 7 小时前
GLM 5 Kimi k2.5 MiniMax M2.5 Chatgpt 5.3 这几个都用过 Chatgpt 5.3 比其余 3 个好太多
12下一页
返回顶部