设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
影视
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
问与答
›
关于 Rag 本地知识库落地的问题求助
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
社保缴纳基数引发的讨论,表示理解不了
›
车牌摇到号了,无奈手头不宽裕,纠结是买二
›
去马来西亚做计算机靠谱吗?
›
最终还是对开发者下手了🤣
›
我老婆跟我观点完全不一样了。。。。
今日热议主题
975 出 E 卡 5000
老婆批了 6000 预算,选择新显卡还是 oppo
model3 还是 modely
厦门,王卡宽带 1000M, 40 一个月算贵吗?
忍无可忍!苹果手机怎么样屏蔽贷款电话,车
有没有从事医疗行业的大佬,报告模板设计器
给兄弟们分享一下 找对象的心得
中科大源 wget 报错
关于系统休眠->唤醒速度
家人们,这个值得买吗, n100 板 u
关于 Rag 本地知识库落地的问题求助
Suinn
· 2024-9-21 14:42:37 · 41 次点击
背景:交易数据分析,一份交易单等价为一个文件
目前在做 rag 落地相关的探索,尝试了 Dify ,FastGPT ,最后选择了 AnythingLLM ,单文件场景下效果很好。但是多文件场景下立马就不行了,比如我问它编号为 A 单的总金额,由于我上传了大约几百份文件,而每单的编号都在正文开头,总金额都在文末,怀疑是这个原因导致没法很好的进行上下文关联。
一份文件的字数毕竟多,chunk 没法开到太大,因此想问问有没有大佬知道这种情况怎么处理毕竟好
举报
·
41 次点击
登录
注册
站外分享
微信扫一扫
QQ分享
微博分享
豆瓣分享
复制链接
显示全部
|
最新评论
1 条回复
沙发
mumu9
小成
2024-9-21 16:39:50
不太清楚你的“交易单”具体包含哪些信息。从你的描述看,更需要的是知识图谱。交易编号作为一个实体,金额和其他文件内容属于实体信息。对 Query 部分进行 NER 后,根据实体进行检索。
如果非用 RAG 不可,对文件内容进行内容压缩后作为 chunk 可能是更有效的方法。
返回顶部