个人需求是搜索相册或图片中的文字,部署官方 immich 使用的 CLIP 模型 XLM-Roberta-Large-Vit-B-16Plus ,搜索结果真就随缘,查看 Issues 有说不支持 ocr 或者效果很差,看到一个 pr 用 PaddleOCR 实现 ocr ,但是被官方关闭了,后画了个饼说是未来会出插件系统,然鹅两年过去了。。
看了提 pr 作者的仓库 https://github.com/jasongwq/immich/tree/feature/ocr ,因个人小白,尝试克隆本地后./install.sh,失败,docker 目录 docker compose -f docker-compose.dev.yml up -d --build 依旧失败,网络全局科学。
虽然 mtphotos 效果不错,但是习惯 immich 和群晖 photos 界面,再看 mt 界面总感觉别扭,加上免费优先,只能作为最后的选择。
有无大佬指点下,或者有无更好的选择。 |
|