用 Java 的 PDFBox 提取出 电子 f 票(铁路电子客票)上的 f 票标题、购买方名称、f 票号码等信息

原因是 f 票 pdf 里有个盖章,这个盖章和 电子 f 票(铁路电子客票) 这几个字在视觉上是重叠在一起的,导致直接根据区域提取文本会提取出错乱的文字

但是我发现直接用浏览器打开 pdf ,选中的文字时候,可以正确选中 电子 f 票(铁路电子客票) 这几个字

我问 ai 这个盖章是什么,它一会说是 PDImage ,一会说是 PDFORM ,给出了两个提取代码跑下来都是错的

我直接问怎么处理盖章,它给我发了一段 python 调 opencv 的纯视觉方案。。

还有上次用 poi 处理 excel ,想让图片变成嵌入到单元格,我特意转成英文版 excel 找到 excel 图片嵌入到单元格操作的原文去问也没用,回答都是错的

缩写是因为提示:发布这个内容需要你已经注册满 2025 天

举报· 430 次点击
登录 注册 站外分享
3 条回复  
edgar51774 初学 2025-1-8 12:27:46
让他写一个,然后参考
TWorldIsNButThis 楼主 小成 2025-1-8 13:45:25
@edgar51774 写的都没法用啊
estk 初学 2025-1-8 14:10:10
4o 不行,要 o1
返回顶部