文心一言比 chatgpt 差的不是一星半点

pauluswanggang · 2024-11-9 12:40:52 · 383 次点击
昨天心血来潮想试试文心一言的体验怎么样,随便问了一个问题:香港的面积多大?结果回答完问题来了一句香港是中国的领土等等,我问我只是问个面积为什么要加最后一句啊,回答说要强调之类云云的(忘了截图了)。一个地理问题生生弄成了政治题。我换成 chatgpt 后,人家老老实实的问什么回答什么,即使后来问了一个关于钓鱼岛的问题,哪个国家的理由更合理一些也回答的不偏不倚。一比较发现,弄文心一言这帮人的格局不是一般的小。
举报· 383 次点击
登录 注册 站外分享
29 条回复  
walkbox 初学 2024-11-9 15:17:11
百毒 扭头就跑
googlefans 小成 2024-11-9 15:16:07
百度 AI 如果搞不好 基本就离玩玩不远了
zmqking 初学 2024-11-9 14:56:34
@pauluswanggang 你说的 ByteDance 吗?😄
lambdaX999 小成 2024-11-9 14:04:32
你去问下魏则西为什么死的
PositionZero 小成 2024-11-9 14:04:10
OP 试试豆包的回复,审查更严 https://i.imgur.com/a/fCykohb.jpg
niubee1 小成 2024-11-9 13:59:10
你去 chatgpt 上问问关于犹太人的问题试试
paradoxs 小成 2024-11-9 13:58:28
chatgpt 回答中国法律的问题,还是差的很远。 https://imgur.com/AGtYejf 这个题目的答案是 AC 。 大家可以去试下国内的 AI ,回答的情况好很多。 题目高清图: https://imgur.com/xNfhK8z
Liftman 小成 2024-11-9 13:58:23
chatgpt 的模型的调试目标是,准确,专业,逻辑推理。 文心一言的调试目标是,绝对不要犯错。 基本上国际上的基准测试都是数学,编码,物理化为主。。 文心一言的测试是,历年中文讽刺梗。 而且你们想想。。百度做搜索,ai ,自动驾驶,都是最早的。 但是现在百度。搜索=shit 。ai=shit 。自动驾驶=?。 所以这个公司干啥啥不行不是没原因的。又不是起步晚。 但是反观国产模型几个开源的,其实做的还不错的。虽然很多是靠基准刷的。拟合一点。但是好歹有努力的。
zhangeric 小成 2024-11-9 13:53:57
建议楼主问一下 chatgpt 涉及到美国的政治问题嘛,至少这样才公平啊
NoOneNoBody 小成 2024-11-9 13:48:47
这贴子也是瞬间分出两个方向,都一样 😂
123下一页
返回顶部