设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
问与答
›
有没有熟悉大模型开发的, help!
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
我的人生好像有点坏掉了,请大家给点建议
›
长话短说 大家觉得花三十万结婚,存款花完
›
关于在大城市留不下来这件事,大家都是怎样
›
域名不用了记得要及时注销备案
›
如果你现在中了大乐透一等奖,你会?
今日热议主题
搜狗输入法怎么不上架 Google Play 市场了
iPhone 微信疯狂被杀后台有遇到过吗?
很火的人生 K 线图提示词免费生成,免费体
12 月被裁了, 年底不好找工作啊
米哈游企业数据组招前端
大家有没有喝完咖啡犯困的
现在还有卖 skinny 的没?
在小鸡上部署 frp 会增加被封的风险吗?
求推荐:电子体温计
阿里巴巴 CosyVoice3-0.5b 开源了! 现邀请
显示全部
|
最新评论
24 条回复
·
2681 次点击
11#
mohuani
初学
2025-5-27 10:01:01
@zhh2271 他应该是在逗你玩
12#
KongKong369
初学
2025-5-27 10:01:16
@hefish 这兄弟在和你扯呢。
13#
Mzs
小成
2025-5-27 10:04:34
1. 远远没到训练的程度 2. 知识库的质量先保证好 3. https://dify.ai 4. 多多调试提示词
14#
love060701
小成
2025-5-27 10:08:08
1 、如果上下文不长,直接把你们公司常用的文档当系统 prompt 写进去,需要使用上下文比较长的模型,DeepSeek 不行因为上下文太短,可以找 128K 上下文版本的 Qwen 。 2 、微调模型,基于某个版本的模型做额外的训练,推荐基于 70B 版本的模型做训练,微调好像只能基于密集模型,MoE 模型的微调比较困难。DeepSeek R1 也不行的,只能使用 DeepSeek 蒸馏出的模型。 3 、RAG ,就是外挂知识库,数据标准化->向量化,LLM 回答问题时把知识库作为上下文,可以使用 DeepSeek R1 作为 LLM ,有 Dify 、n8n 之类的开源实现,不过你们公司有那么多资源部署自己的 DeepSeek R1 么?
15#
chanlk
小成
2025-5-27 10:08:56
这是想弄一个知识库吧 https://i.imgur.com/MAyk5GN.png
16#
zhh2271
楼主
初学
2025-5-27 10:10:51
@renmu 是这样,主管叫我先基于一个商业工具开发一个大模型出来,后续再把这个迁移到我们的软件,商业工具的文档是非常丰富的。然后迁移的话也只需要实现我们部门的一个模块就好了,暂时不需要管其它部门
17#
zhh2271
楼主
初学
2025-5-27 10:12:38
@love060701 显卡是有的,A100 应该有挺多的,就是不知道会不会给我用
18#
zhh2271
楼主
初学
2025-5-27 10:14:16
@love060701 这个生成脚本、规则文件的我感觉很难弄,像一些代码什么的,我感觉文档问答的话是不是用 RAG 就行了,但是这种脚本生成应该要怎么做啊
19#
Felixchen1062
初学
2025-5-27 10:18:05
从微调做起可以看看 unsloth, llmfactory, 如果想做 rag, workflow 之类的可以看看 dify, langchain,llamaindex 平台 , 固定行业脚本编写可能需要你有一些 prompt 经验, 以上内容拿去 gemini research,让他给你介绍一遍
20#
zhh2271
楼主
初学
2025-5-27 10:18:23
@love060701 1 这个应该不行,EDA 相关的文档很多
下一页 »
1
2
3
/ 3 页
下一页
浏览过的版块
京东
返回顶部