设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
kimi K2 Thinking 都这样的玩的话,如何作为参考依据呢 ...
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
开网吧是不是个好生意
›
失业的程序员们都在干啥?
›
半夜扰民怎么办,已经严重影响休息了
›
最近对小米的产品比较排斥
›
同志们,技术问题来了,大家讨论下, jwt
今日热议主题
(远程 可兼职) 硅谷 GenAI 创业团队招前端
好像没人讨论拼多多高管和市监局稽查队打架
AI 漫剧就是 2026 年的风口,所以我用手搓
分享一个我自己上班写代码偷懒的工作流 [前
openai 验证遇到 We were unable to verify
现在 coding 除了 cursor 和 cc 以外哪一家
出 88 会员的优酷和饿了么 11 月 07 到期,
做了一个上班摸鱼的可以低调的玩耍的微信公
你们跟 AI 在一个话题里聊天能聊多少内容?
请教大家一下 stripe 有办法降低手续费么,
显示全部
|
最新评论
17 条回复
·
1879 次点击
11#
Leoking222
初学
2025-11-10 14:00:38
国内:跑分没输过,实战没赢过
12#
Leoking222
初学
2025-11-10 14:01:24
@jasonjie2015 国产所有的模型都在对比 Claude ,但其实他们都只达到了 Claude sonnet 3.7 的水平 🤣
13#
maolon
小成
2025-11-10 14:39:57
首先所有榜单都只能是参考,每个人的用法天差地别,其次这些榜单每一个都是有侧重点的 另外还有一个很简单的判断方法,什么时候 claude 和 openai 开始对标国产模型了,那他们就真超越了。 谁对标谁就用被对标的那个, simple as that
14#
fbu11
初学
2025-11-10 15:00:23
跟国内还是国外没关系,GPT5 也一样,每个大模型的跑分榜单模式都是这样的,他们上榜说是吊打 XXX 模型,都是有特定条件的
15#
lance07
初学
2025-11-10 15:41:46
都这样,gpt 之前还测评作弊。差距有但不是在这里
16#
snw
小成
2025-11-10 15:44:17
试过用免费版的 K2 Thinking 模式找些数据,结果思维陷入死循环了: > 一会儿说我在网上找到了一个数据 a ,但很难找到其他数据,也许我应该去官方信源找数据。 > 过了十来分钟,又说我在网上找到了一个数据 a (和上面一样),但很难找到其他数据,也许我应该去官方报告找数据 > ...... 如此循环了将近十次,然后直接清空了前面所有思考过程,输出空白。旁边提示可以试试付费版投入更多算力😂
17#
snw
小成
2025-11-10 15:48:01
@snw 又看了下,是提示“深度研究额度已用尽”。 反正看试用版这表现我是不敢付费的,看起来额度被死循环耗尽了。
18#
zhangeric
小成
2025-11-10 16:11:45
楼主就是把外国人想的太好了啊.
1
2
/ 2 页
浏览过的版块
分享发现
职场话题
返回顶部