飞社-令人惊奇的创意工作者社区-分享创造基于 LangChain 的开源 GPT 向量 + 知识数据库，帮助个人或企业实现自己的专属 AI 问答助手

kneo

不是很确定这东西是不是真的有用。文本搜索就能直接搜出来的标准答案，它会自己重新编一个似是而非的。

ffgrinder

@tommyshelbyfshex 我也想请教一下除了余弦之外有什么比较好的实践吗

MasonXu

@kneo 对作者提供的这个不保证结果。但是我做过一个类似的，通过将原始的素材向量化作为初始的数据。用户搜索的时候，也向量化处理并与上一步已经转换为向量的内容做相似度匹配查询。高于特定的比例，例如 0.8 就取原始的答案输出，否则提示找不到，不会自己编写胡扯的

muchenlou

@MasonXu 大佬你好，这个有类似的开源项目吗？

lointo

有适合代码转向量的向量模型吗

ren2881971

适合国内脑瘫老板，他们总是想私有化部署美，其名曰保护他们企业那点没人关注的数据。

retrocode

@ren2881971 这一拳可以啊, 这会咋没人说保护隐私了

beyondex

代码向量化？需要做相似代码片段搜索吗？

Liftman

这种实际上的效果。。并不理想。试过类似的。。。而且大部分人连半吊子都不是。很难真的实现效果理想

ohazyi

有对比过不同的向量数据库 / 语言模型的效果/性能优劣吗？比如你说的 m3 bge 什么的

基于 LangChain 的开源 GPT 向量 + 知识数据库，帮助个人或企业实现自己的专属 AI 问答助手