pdf 的格式很多很杂,有的标题是居中的,有的是左对齐的,如何将这些繁杂的 pdf 进行切割?
(尝试过使用 itext5 ,但是对左对齐的标题格式不太好处理。)
举报· 55 次点击
登录 注册 站外分享
4 条回复  
functionABC 小成 2024-8-23 16:03:39
要切割成啥样子呀?
justNoBody 小成 2024-8-23 17:59:06
能不能发一个具体的材料,然后你想办法脱敏一下,我挺感兴趣的。
SoloKing 小成 2024-8-23 19:18:15
借楼,我也有需求,PDF 或者 Word 的内容提取出来之后,按章节段落切分,有什么好的方法吗?
mythabc 小成 2024-8-23 19:32:41
1. 版式识别
2. 多模态大模型
返回顶部