有没有知道拍照,然后实现做数学题开源方案,这块应该技术上怎么实现

举报· 827 次点击
登录 注册 站外分享
7 条回复  
xiexiping 小成 昨天 17:26
@evan1 确实很多领域市场上都有比较成熟的产品了,但是还是有很多小公司做的小产品能从中吃到一小块蛋糕,我以前公司的产品就是这个思路,只是集成一下市场上现有的 SDK 提供的功能,做一个简单的产品,赚不了大钱但是能凭借比较简单的功能和低成本,能有一部分用户,所以我才有了这个想法,哈哈
evan1 小成 昨天 17:17
@xiexiping #5 这个没有具体研究过。 理论上接入其它模型最方便,说的直接一点就是直接去套壳。 找个开源模型然后再找些题库、公式数据集训练一下也可以,但是太麻烦了而且效果不一定好。 自己做一个拍照解题应用是可以,但是 google 搜一下"拍照解题"可以看到已经有很多类似产品了。如果只是自己研究的话可以搞搞,想要靠这个实现收入的话我觉得有点困难。
xiexiping 小成 昨天 17:04
@evan1 有现成的解决方案用来集成吗? OCR 好像 bat 都有,解题的模型就不太清楚了,这样是不是可以自己做一个拍照解题应用了
evan1 小成 昨天 16:56
理论上应该是先拍照,然后 OCR 识别内容,然后把内容塞给大模型,然后输出大模型的结果。
ansemz 小成 昨天 16:53
deepseek 的 vl 模型应该可以
gitxuzan 楼主 小成 昨天 16:13
收费的也行吧,就是主要是专门解方程式这方面
FlytoSirius 小成 昨天 15:55
同样感兴趣
返回顶部