设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
节点
飞墙
Follow
明白贴
工算小助手
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
问与答
›
有没有熟悉大模型开发的, help!
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
问问各位过来人,想问下是否要继续?
›
使用公司提供的 AI 套餐来做个人项目,会有
›
Mac 上 有 Navicat 的替代品吗?
›
过年给老丈人多少红包合适?
›
2025 父亲走了, 很怀念他
今日热议主题
AI 繁荣的幻象:从“正态分布”到“权力幂
今天过年,家里电视好像坏了,家人非要叫维
表妹高三专业文科 400 分 让她自学 ai 技能
deepseek v4 预计今晚发布
你们今年赚了多少个,存了多少个,有多少个
领喜马拉雅马年红包
百度网盘拼车,差两个人年付 34。
没有相声没有小品了,已经到了和“旧”时代
MaxAPI 企业级 Claude Code API 新春特惠 1
[🐎马年送码] 别光顾着写代码,也给相亲对
显示全部
|
最新评论
24 条回复
·
2707 次点击
11#
mohuani
初学
2025-5-27 10:01:01
@zhh2271 他应该是在逗你玩
12#
KongKong369
初学
2025-5-27 10:01:16
@hefish 这兄弟在和你扯呢。
13#
Mzs
小成
2025-5-27 10:04:34
1. 远远没到训练的程度 2. 知识库的质量先保证好 3. https://dify.ai 4. 多多调试提示词
14#
love060701
小成
2025-5-27 10:08:08
1 、如果上下文不长,直接把你们公司常用的文档当系统 prompt 写进去,需要使用上下文比较长的模型,DeepSeek 不行因为上下文太短,可以找 128K 上下文版本的 Qwen 。 2 、微调模型,基于某个版本的模型做额外的训练,推荐基于 70B 版本的模型做训练,微调好像只能基于密集模型,MoE 模型的微调比较困难。DeepSeek R1 也不行的,只能使用 DeepSeek 蒸馏出的模型。 3 、RAG ,就是外挂知识库,数据标准化->向量化,LLM 回答问题时把知识库作为上下文,可以使用 DeepSeek R1 作为 LLM ,有 Dify 、n8n 之类的开源实现,不过你们公司有那么多资源部署自己的 DeepSeek R1 么?
15#
chanlk
小成
2025-5-27 10:08:56
这是想弄一个知识库吧 https://i.imgur.com/MAyk5GN.png
16#
zhh2271
楼主
初学
2025-5-27 10:10:51
@renmu 是这样,主管叫我先基于一个商业工具开发一个大模型出来,后续再把这个迁移到我们的软件,商业工具的文档是非常丰富的。然后迁移的话也只需要实现我们部门的一个模块就好了,暂时不需要管其它部门
17#
zhh2271
楼主
初学
2025-5-27 10:12:38
@love060701 显卡是有的,A100 应该有挺多的,就是不知道会不会给我用
18#
zhh2271
楼主
初学
2025-5-27 10:14:16
@love060701 这个生成脚本、规则文件的我感觉很难弄,像一些代码什么的,我感觉文档问答的话是不是用 RAG 就行了,但是这种脚本生成应该要怎么做啊
19#
Felixchen1062
初学
2025-5-27 10:18:05
从微调做起可以看看 unsloth, llmfactory, 如果想做 rag, workflow 之类的可以看看 dify, langchain,llamaindex 平台 , 固定行业脚本编写可能需要你有一些 prompt 经验, 以上内容拿去 gemini research,让他给你介绍一遍
20#
zhh2271
楼主
初学
2025-5-27 10:18:23
@love060701 1 这个应该不行,EDA 相关的文档很多
下一页 »
1
2
3
/ 3 页
下一页
返回顶部