设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
影视
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
问与答
›
如何精确地做扫描件 pdf 文本可搜索嵌入 ...
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
现在经济这么差的么
›
EcoPaste - 免费开源剪贴板神器,斩获 2.4k
›
大家怎么看待 cg 这件事情
›
是去是留?
›
观贴《各位对小区野猫什么态度》有感
今日热议主题
iOS 油管 app 如何过滤掉广告呢?
这段话是否正确?「取余这个运算,只有 Pyt
有啥离线笔记推荐
2024.12.27 日本 Fly 上海,帮带日版 iPhon
有什么爬虫快速入门的教程?
请各位大力推荐性价比显示器。macmini 显示
最近 Signal 火了,没想到这么多人用
出点路由器、交换机、挂灯、显示器、机箱
红米 K80 感觉配置是真的拉满啊
在 Samsung Galaxy SM-P205 上启用电信 VoL
如何精确地做扫描件 pdf 文本可搜索嵌入
Censhuang
· 2024-10-25 22:05:49 · 75 次点击
abbyy 直接处理图片,直接把图片的文字替换了,图片清晰度大幅度下降
abbyy 直接处理 pdf ,结果文件出现问题(一张纸上结果图片非常小且不能复制)
Adobe 中文识别效果不佳
有何免费的方案去把扫描 pdf 做 ocr 并嵌入(可直接在 pdf 查看里搜索,比如 edge 的 pdf 打开后可以复制)
想要 pdf 文件显示的是高清晰度的图片且可以复制/搜索文字
最好同时支持中文/英文/数学公式这类的 OCR
举报
·
75 次点击
登录
注册
站外分享
微信扫一扫
QQ分享
微博分享
豆瓣分享
复制链接
显示全部
|
最新评论
4 条回复
沙发
mgrddsj
小成
2024-10-25 22:09:55
Abbyy 的默认设置确实不是特别好,你试试把 Abbyy 里面压缩相关的设置都关掉(印象中有好多个地方需要关),效果会好很多。
板凳
Liftman
小成
2024-10-25 22:45:52
Wondershare PDFelement
地板
iX8NEGGn
小成
2024-10-26 04:58:18
你电脑性能好,就上最近流行的哪些 AI OCR ,否则其他软件对 ABBYY 来说还真没一个能打的,不过它 OCR 后导出文件默认会压缩,不开压缩文件会特别大,原来几百兆的 PDF 会膨胀到几 GB ,我之前电子化纸制书时就遇到了。
解决办法就是,把 ABBYY OCR 后导出的带文本层的压缩的 PDF 用 pymupdf 提取成纯文本层的 PDF ,接着继续用 pymupdf 把原来的高清图片 PDF 和纯文本层的 PDF 叠加,得到一个既高清又带文本层的 PDF 。
返回顶部