设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
影视
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
问与答
›
关于 Rag 本地知识库落地的问题求助
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
杭州余杭某小公司:劳动合同到期前,公司 h
›
🎁 去年这时候在 v 站战战兢兢发布了剪贴板
›
字节跳动将(田某)告上法庭,要求赔偿 800
›
我与喜欢的有男朋友的女同事的最后故事:决
›
还有 6 年生命,却提前感觉所剩无几了
今日热议主题
ios18 ibook app 如何快捷添加书签?
请问: 有没有不需电池,但插上电源就能工作
远程到 Linux 机器上,除了 VNC 还有什么好
用户从 App 点开订阅页面自动推送一封从官
[求助] 有没有推特改名历史网站或者 api 接
什么 dns 服务商支持自解析?
iOS 微信如何设置能在接受通知时「只震动,
租房,但合租对象是前同事
macos 软件在这些网站下载靠谱吗?
[第 1 章] 租房,但合租对象是前同事
关于 Rag 本地知识库落地的问题求助
Suinn
· 2024-9-21 14:42:37 · 42 次点击
背景:交易数据分析,一份交易单等价为一个文件
目前在做 rag 落地相关的探索,尝试了 Dify ,FastGPT ,最后选择了 AnythingLLM ,单文件场景下效果很好。但是多文件场景下立马就不行了,比如我问它编号为 A 单的总金额,由于我上传了大约几百份文件,而每单的编号都在正文开头,总金额都在文末,怀疑是这个原因导致没法很好的进行上下文关联。
一份文件的字数毕竟多,chunk 没法开到太大,因此想问问有没有大佬知道这种情况怎么处理毕竟好
举报
·
42 次点击
登录
注册
站外分享
微信扫一扫
QQ分享
微博分享
豆瓣分享
复制链接
显示全部
|
最新评论
1 条回复
沙发
mumu9
小成
2024-9-21 16:39:50
不太清楚你的“交易单”具体包含哪些信息。从你的描述看,更需要的是知识图谱。交易编号作为一个实体,金额和其他文件内容属于实体信息。对 Query 部分进行 NER 后,根据实体进行检索。
如果非用 RAG 不可,对文件内容进行内容压缩后作为 chunk 可能是更有效的方法。
返回顶部