用 chatAi 生成了需求,大概就是这样。代码也给我生成了,我太懒了太忙了,来找有时间的小伙伴。


**酬劳**:500 元  
**项目周期**:尽快完成  
**优先语言**:Java (其他语言亦可考虑)

## 项目描述

我需要开发一款 Windows 应用程序,用于自动处理存放在指定文件夹中的中国高速费发票( PDF 格式)。该软件将实现文件识别、重命名、分类整理以及每日通行费总金额的统计,从而简化每月报销流程,节省时间。

## 主要功能需求

1. **文件处理**
   - **输入文件夹**:用户指定一个包含发票 PDF 文件的文件夹。
   - **文件识别**:
     - 识别每个 PDF 文件中的“通行日期”。
     - 提取每个 PDF 文件中的“通行费”金额。

2. **文件重命名与分类**
   - **重命名**:将每个 PDF 文件重命名为其识别出的“通行日期”(格式如 `YYYY-MM-DD.pdf`)。
   - **分类存放**:
     - 根据“通行日期”将 PDF 文件分类存放到对应的子文件夹中(如 `2024-04-25` 文件夹)。
     - 处理同一天多张发票的情况,自动在文件名中添加序号(如 `2024-04-25_1.pdf`)。

3. **数据汇总**
   - **每日通行费总金额计算**:统计每个“通行日期”对应的所有发票中的“通行费”总金额。
   - **汇总输出**:将统计结果导出为 Excel 或 CSV 文件,方便查看和上传到公司系统。

4. **用户界面(可选)**
   - 提供图形用户界面( GUI ),用户可以:
     - 选择输入和输出文件夹。
     - 查看处理进度和日志。
     - 启动处理任务。

5. **错误处理与日志记录**
   - 记录无法识别或处理的文件,便于后续手动检查。
   - 提供错误提示,帮助用户理解处理过程中出现的问题。

## 技术要求

- **编程语言**:优先考虑 Java ,其他语言(如 Python )亦可考虑。
- **主要功能模块**:
  - **PDF 解析**:
    - 使用合适的 PDF 解析库提取文本内容(如 Apache PDFBox )。
    - 对于扫描件 PDF ,集成 OCR 工具进行文字识别(如 Tess4J )。
  - **数据提取**:
    - 使用正则表达式或字符串处理技术,从提取的文本中解析“通行日期”和“通行费”。
  - **文件操作**:
    - 实现文件重命名和分类存放。
    - 处理文件名冲突,确保文件名唯一。
  - **数据汇总与导出**:
    - 使用 Apache POI 生成 Excel 汇总文件,或生成 CSV 格式文件。
  - **用户界面(可选)**:
    - 使用 Java Swing 或 JavaFX 创建友好的 GUI ,提升用户体验。
  - **打包与部署**:
    - 将程序打包为 Windows 可执行文件(.exe ),便于在未安装 Java 环境的机器上运行。

## 交付内容

- 完整的 Windows 可执行文件(.exe )。
- 源代码
举报· 490 次点击
登录 注册 站外分享
36 条回复  
donaldturinglee 小成 2024-10-6 15:15:59
OCR 就得好好喝上一壶了,留给有需要的人
tool2dx 初学 2024-10-6 15:17:55
@donaldturinglee 官方下载的 pdf 又不是 jpg ,感觉不用识别,能直接提取。
Abbeyok 小成 2024-10-6 15:18:56
至少 4 位数,才有人接
shizhibuyu2023 初学 2024-10-6 15:24:12
上闲鱼找兼职的大学生碰碰运气吧,在这里加个零起步
ruobingm 小成 2024-10-6 15:25:43
500 元真大 https://i.imgur.com/agAJ0Rd.png
neoblackcap 小成 2024-10-6 15:28:32
只要有接触过 PDF 的人就知道,PDF 解析并不是一个简单的活。连就连大厂的 PDF 支撑很多都是外购的解决方案。
如果你硬要用 OCR 的方案的话,可能百度的飞桨 OCR 效果还行。
TimG 小成 2024-10-6 15:31:52
赞同楼上,刚做过两个 PDF 相关的项目,现在看到 PDF 就反胃......本来没有 PDF 一路畅通,需求加上 PDF 四处掉坑
googlefans 小成 2024-10-6 15:41:15
ai 自己生成
dbskcnc 小成 2024-10-6 15:41:58
@dengjunwen 不用代码的话倒可以一谈
1234下一页
返回顶部