单个汉字左或右倾斜无法识别或错误识别,列出用过的方案:
1. 阿里云 腾讯云 百度云 API 接口方式 OCR
2. Tesseract-OCR 原生或自训练数据集
3. 百度 paddlepaddle PP-OCRv4
4. python dataset 自训练数据集
--
以上方案汉字右倾斜识别成功率较高,左倾斜识别较差。
自训练数据集:通过将单一汉字图片旋转不同角度打标签方式训练,本身汉字图片较小,也许是这个原因无法训练出正确的数据集。
--
目前方案:
灰度二值化后将图片顺逆向分别+- 2 度旋转 20 次,得到生成后的 40 张图片,手搓 Hough 直线检测算法,筛选出投票得分最多的图片,最后通过 paddlepaddle PP-OCRv4 进行识别,成功率 70%,4h8g 耗时 4-6 秒。
--
求助大神:
目前是否有专门针对倾斜汉字 OCR 的场景模型,通过打标签训练数据集的也行。 |