作为大模型重度使用患者，最大的感受是，目前大模型的准确度是一个非常大的问题

作为大模型重度使用患者，最大的感受是，目前大模型的准确度是一个非常大的问题。

大模型基座就不多说了，日常主要用来创作，但是对于其中涉及到的数据，还是需要人工核查，因为你不确定它说的是不是真的。

即便是 cursor 这样工程化很成熟的产品，在项目大了以后，也会乱改代码。

最明显的特征是新做一个需求，会把旧的需求改到不可用，于是不得不好好 review cursor 改的代码，但是一不留神，旧功能就坏了。

最近有被深深折磨到。

准确度问题解决之前，大模型最大的场景还是创意性工作（写作、绘图等）。

准确度问题怎么解决呢？或许可以通过工程手段来做一层校验，或许只能交给大模型基座去解决。

应该是有解决办法的，可能就在不久之后。

什么时候准确度问题算是解决了呢？

可能是敢让大模型直接刷卡帮你买东西的时候。

毕竟所有人在钱上的准确度，应该是最敏感的。