设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
影视
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
问与答
›
llama-3-sqlcoder-8b 微调效果不好,求助
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
社保缴纳基数引发的讨论,表示理解不了
›
车牌摇到号了,无奈手头不宽裕,纠结是买二
›
去马来西亚做计算机靠谱吗?
›
最终还是对开发者下手了🤣
›
公司开始主动补缴社保了,是有什么大雷么?
今日热议主题
记一次 Windows 与 chrome 的不兼容,看两
做了一款在线制作字幕拼图工具
不要和中资外包大企业 HR 合作,除非准备好
20241125 午夜俱乐部
睡前想到换车的费用,睡不着了
1365U 木板迷你主机玩具,售价 666
关于 Mac mini M4 外置机械硬盘的休眠问题
原来野猫,其实才是真正的入侵物种在破坏我
装饰器能不能装饰类的所有方法
出鼠标迈从 g3 800mh
llama-3-sqlcoder-8b 微调效果不好,求助
cowcomic
· 2024-9-30 09:19:10 · 41 次点击
使用 LoRA 进行微调
大约 1W 条微调数据,大概是四个维度各十几种排列组合来的
学习率:1e-6
训练轮数:10
学习率调节器:Inverse Square Root
学习的参数大概是这么多
trainable params: 20971520 || all params: 8051232768 || trainable%: 0.2605
图像看着倒还不错
https://i.imgur.com/IEFZKz7.png
但实际生成的 SQL 效果不升反降
求助这可能是什么原因啊?
举报
·
41 次点击
登录
注册
站外分享
微信扫一扫
QQ分享
微博分享
豆瓣分享
复制链接
显示全部
|
最新评论
1 条回复
沙发
chaucerling
小成
2024-9-30 09:27:58
轮数太多过拟合了吧,取 1000 的 checkpoint 试试效果
返回顶部