文心一言比 chatgpt 差的不是一星半点

pauluswanggang · 2024-11-9 12:40:52 · 380 次点击
昨天心血来潮想试试文心一言的体验怎么样,随便问了一个问题:香港的面积多大?结果回答完问题来了一句香港是中国的领土等等,我问我只是问个面积为什么要加最后一句啊,回答说要强调之类云云的(忘了截图了)。一个地理问题生生弄成了政治题。我换成 chatgpt 后,人家老老实实的问什么回答什么,即使后来问了一个关于钓鱼岛的问题,哪个国家的理由更合理一些也回答的不偏不倚。一比较发现,弄文心一言这帮人的格局不是一般的小。
举报· 380 次点击
登录 注册 站外分享
29 条回复  
NotLongNil 小成 2024-11-9 12:57:10
你连原因都没搞明白啊……是百度的人希望做成这样的吗?在中国哪个 AI 上线前不用经过一轮政治考试,你问的这些问题的答案哪个不是在上线前就被审过一次,得骂对人啊
zuosiruan 初学 2024-11-9 13:05:05
一楼已经说的很好了。格局小的不是文心一言。
ztm0929 小成 2024-11-9 13:05:17
@NotLongNil 虽然确实要审查,但是百度的技术力确实不如人也是事实。你站在中国大陆以外的视角问 ChatGPT 它总能尽可能中立。 回到问题本身,从训练效率的角度来讲就是百度图快偷懒而已…(它们也许暂时不愿意在安全策略方面花精力,才会出现这种完全无关的回答
laikick 小成 2024-11-9 13:19:21
文明洼地是这样的
jaio1 小成 2024-11-9 13:32:30
百度一下:三好学生是哪三好
NoOneNoBody 小成 2024-11-9 13:48:47
这贴子也是瞬间分出两个方向,都一样 😂
zhangeric 小成 2024-11-9 13:53:57
建议楼主问一下 chatgpt 涉及到美国的政治问题嘛,至少这样才公平啊
Liftman 小成 2024-11-9 13:58:23
chatgpt 的模型的调试目标是,准确,专业,逻辑推理。 文心一言的调试目标是,绝对不要犯错。 基本上国际上的基准测试都是数学,编码,物理化为主。。 文心一言的测试是,历年中文讽刺梗。 而且你们想想。。百度做搜索,ai ,自动驾驶,都是最早的。 但是现在百度。搜索=shit 。ai=shit 。自动驾驶=?。 所以这个公司干啥啥不行不是没原因的。又不是起步晚。 但是反观国产模型几个开源的,其实做的还不错的。虽然很多是靠基准刷的。拟合一点。但是好歹有努力的。
paradoxs 小成 2024-11-9 13:58:28
chatgpt 回答中国法律的问题,还是差的很远。 https://imgur.com/AGtYejf 这个题目的答案是 AC 。 大家可以去试下国内的 AI ,回答的情况好很多。 题目高清图: https://imgur.com/xNfhK8z
123下一页
返回顶部