作为大模型重度使用患者,最大的感受是,目前大模型的准确度是一个非常大的问题。

大模型基座就不多说了,日常主要用来创作,但是对于其中涉及到的数据,还是需要人工核查,因为你不确定它说的是不是真的。

即便是 cursor 这样工程化很成熟的产品,在项目大了以后,也会乱改代码。

最明显的特征是新做一个需求,会把旧的需求改到不可用,于是不得不好好 review cursor 改的代码,但是一不留神,旧功能就坏了。

最近有被深深折磨到。

准确度问题解决之前,大模型最大的场景还是创意性工作(写作、绘图等)。

准确度问题怎么解决呢?或许可以通过工程手段来做一层校验,或许只能交给大模型基座去解决。

应该是有解决办法的,可能就在不久之后。

什么时候准确度问题算是解决了呢?

可能是敢让大模型直接刷卡帮你买东西的时候。

毕竟所有人在钱上的准确度,应该是最敏感的。

举报· 106 次点击
登录 注册 站外分享
快来抢沙发
0 条回复  
返回顶部