Claude VS GLM VS Kimi VS MiniMax VS Gemini 2026 年半年内 Vibe Coding 谁更强？

想咨询一下各位最近使用的这几个模型体感哪个更强呢？

Agent 场景，主要是 tool using/vibe coding

入围的：

Claude Opus 4.6
Claude Sonnet 4.6
GLM 5
Kimi k2.5
MiniMax M2.5
Gemini 3
Chatgpt 5.2

如果还有推荐的也可以写（比如 chatgpt ）

由于 prompt 其实和模型是较为绑定的（这个很类似当年针对某个芯片版本写的汇编优化，当芯片/编译器版本换了，方法也就失灵了），所以希望选择一个半年内持续使用的模型。希望了解一下大家目前在 tool using/vibe coding 哪个更方便？

公司生产场景，部署在美东

目前在 openrouter 平台，有什么更好的平台也推荐。

参考：

https://openrouter.ai/rankings?programming-language=JavaScript#programming-languages

yusf

Claude + Chatgpt 家的，自己模型还是要配自家的工具才厉害

SingeeKing

我的选择 - 日常 GPT-5.3-Codex (xhigh) - 疑难杂症 GPT-5.2 (xhigh) - 超级疑难杂症 GPT-5.2 Pro

iamnotcodinggod

Claude code default 就行了，让它灵活在 opus 和 sonnet 之间切换，碰不到 5 小时限制。如果纯用 Opus ，大概一个半小时就会碰到。碰到了就转 Codex 5.2 最高 reasoning effort.

maolon

这个都不用问的，全自主 agent 和超长程任务（> 15hr 持续执行）用 gpt 系列（ 5.2 high/xhigh and/or 5.3 codex high/xhigh ）, copilot 模式（你和 agent 合作写）用 claude 的 sonnet 4.6 + opus 4.6, 另外建议搭配各家自己的套餐使用（也就是 codex 用 gpt 订阅，cc 用 claude 订阅），以及 opus 价格非常高，注意使用限制

Bad0Guy

我直接在 cli 里让 Gemini/codex/cc 通过 mcp 分工，只用 sonnet/opus 的话额度烧得很快，而且不一定能一次就达到你要的效果

doraemonki

@Bad0Guy 老哥 mcp 用的啥

mogutouer

Opus 断层领先，这一点疑问也没有

gpt5

@maolon 全自主 agent 和超长程任务用的啥方案啊？

issakchill

GLM 5 Kimi k2.5 MiniMax M2.5 Chatgpt 5.3 这几个都用过 Chatgpt 5.3 比其余 3 个好太多