88 条回复  ·  1260 次点击
kneo 小成 2024-3-17 16:35:46
不是很确定这东西是不是真的有用。文本搜索就能直接搜出来的标准答案,它会自己重新编一个似是而非的。
ffgrinder 小成 2024-3-17 23:03:42
@tommyshelbyfshex 我也想请教一下除了余弦之外有什么比较好的实践吗
MasonXu 小成 2024-3-18 13:50:10
@kneo 对作者提供的这个不保证结果。但是我做过一个类似的,通过将原始的素材向量化作为初始的数据。用户搜索的时候,也向量化处理并与上一步已经转换为向量的内容做相似度匹配查询。高于特定的比例,例如 0.8 就取原始的答案输出,否则提示找不到,不会自己编写胡扯的
muchenlou 小成 2024-3-20 14:07:32
@MasonXu 大佬你好,这个有类似的开源项目吗?
lointo 小成 2024-3-20 23:15:11
有适合代码转向量的向量模型吗
ren2881971 小成 2024-3-21 08:59:55
适合国内脑瘫老板,他们总是想私有化部署美,其名曰保护他们企业那点没人关注的数据。
retrocode 小成 2024-3-21 11:13:58
@ren2881971 这一拳可以啊, 这会咋没人说保护隐私了
beyondex 小成 2024-3-21 11:53:59

基于 LangChain 的开源 GPT 向量 + 知识数据库,帮助个人或企业实现自己的专属 AI 问答助手

代码向量化?需要做相似代码片段搜索吗?
Liftman 小成 2024-3-21 20:04:44

基于 LangChain 的开源 GPT 向量 + 知识数据库,帮助个人或企业实现自己的专属 AI 问答助手

这种实际上的效果。。并不理想。试过类似的。。。而且大部分人连半吊子都不是。很难真的实现效果理想
ohazyi 小成 2024-3-22 15:12:41

基于 LangChain 的开源 GPT 向量 + 知识数据库,帮助个人或企业实现自己的专属 AI 问答助手

有对比过不同的向量数据库 /  语言模型的效果/性能优劣吗? 比如你说的 m3 bge 什么的
返回顶部