作为大模型重度使用患者,最大的感受是,目前大模型的准确度是一个非常大的问题。
大模型基座就不多说了,日常主要用来创作,但是对于其中涉及到的数据,还是需要人工核查,因为你不确定它说的是不是真的。
即便是 cursor 这样工程化很成熟的产品,在项目大了以后,也会乱改代码。
最明显的特征是新做一个需求,会把旧的需求改到不可用,于是不得不好好 review cursor 改的代码,但是一不留神,旧功能就坏了。
最近有被深深折磨到。
准确度问题解决之前,大模型最大的场景还是创意性工作(写作、绘图等)。
准确度问题怎么解决呢?或许可以通过工程手段来做一层校验,或许只能交给大模型基座去解决。
应该是有解决办法的,可能就在不久之后。
什么时候准确度问题算是解决了呢?
可能是敢让大模型直接刷卡帮你买东西的时候。
毕竟所有人在钱上的准确度,应该是最敏感的。
|