设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
这样是否可以保证 OCR 识别率接近百分之 100 ...
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
长话短说 大家觉得花三十万结婚,存款花完
›
求职半个月,感觉快撑不住了,想听听大家的
›
ChatGPT, Claude, Gemini 会员三选一 应该
›
离线听书 App 上架 Google Play,寻找封闭测
›
重度苹果用户投华做了两面派
今日热议主题
请推荐一下 2025 年值得下载的电影
大家上 Reddit 都看什么
在 FSHEX 究竟用什么标题大家才有兴趣点进
请教 Macbook air 的购买选择
和团队小伙伴做了个 app,叫 taskoo, AI
小米这个 MiMo-V2-Flash 好像有点东西
[求职] 3 年 Rust/7 年 Go 想找一份远程 We
有大佬遇到过 GPT 统计异常的情况吗?
整理了 4100+ 条 Kaggle Gemini 3 竞赛的 W
突然马甲邮箱收到一个就业问卷
显示全部
|
最新评论
30 条回复
·
3279 次点击
21#
InkAndBanner
小成
2025-9-22 11:49:43
@dem0ns #18 抱歉 没有 我们是阿里系的 优先用 qwen
22#
AutumnVerse
初学
2025-9-22 11:49:44
这不就是多源对比纠错吗? 完整方案应该是这样的,3 个源 ocr 对比,如果有 2 个源一样,就直接取用,3 个全都不一样,丢给大模型或人工纠错。 纠错结果丢给 ocr 模型二次训练
23#
MIUIOS
初学
2025-9-22 11:50:24
我遇到你这个问题,我的做法是 OCR 出来后丢给 llm 大模型去修复
24#
malusama
小成
2025-9-22 11:52:19
直接 ocr 丢给 LLM 修复呗。 你这样一致的能有多少,准确率上去了不得看看能召回多少吗? 你这都没有多少是输出一致的吧
25#
AutumnVerse
初学
2025-9-22 11:53:14
@Julaoshi 不可能,机器学习网络参数是固定的,无论你什么尺寸,前向传播前都会 resize 成固定尺寸 你觉得识别率高了仅仅是插针拉伸裁剪之类的算法导致识别结果不一样了而已,从算法原理上放大不可能影响识别率
26#
Insolitude
初学
2025-9-22 12:16:16
调用过 Google 的 ai ocr 的接口,效果感觉还不如本地的 ocr ,,可能手写体 ai 会更好点。让 llm 优化传统 ocr 的结果,感觉是个不错的思路。目前我用的本地 ocr 主要就中文的标点会识别成英文标点的问题,发给 llm 很容易解决。
27#
syscall
初学
2025-9-22 13:47:17
@Julaoshi 模型目标尺寸训练时定死了. 即使是动态 shape, 但同样的设置下模型接收的输入尺寸就是一样的.
28#
8355
小成
2025-9-22 13:58:51
@Suinn #2 那如果是这样的话,大模型产生幻觉了导致大模型返回的错误值,此时安业务逻辑无法识别了那怎么处理?
29#
canteon
初学
2025-9-22 14:03:17
人工校对
30#
tusj
初学
2025-9-22 14:09:23
先 OCR 识别生成文本结果,再大模型对文本纠正一下低级错误。这样组合怎样?
下一页 »
1
2
3
4
/ 4 页
下一页
浏览过的版块
休闲
iPhone
分享发现
生活
职场话题
问与答
宽带症候群
酷工作
返回顶部