llama-3-sqlcoder-8b 微调效果不好,求助

cowcomic · 2024-9-30 09:19:10 · 41 次点击
使用 LoRA 进行微调

大约 1W 条微调数据,大概是四个维度各十几种排列组合来的

学习率:1e-6
训练轮数:10
学习率调节器:Inverse Square Root

学习的参数大概是这么多
trainable params: 20971520 || all params: 8051232768 || trainable%: 0.2605

图像看着倒还不错
https://i.imgur.com/IEFZKz7.png

但实际生成的 SQL 效果不升反降

求助这可能是什么原因啊?
举报· 41 次点击
登录 注册 站外分享
1 条回复  
chaucerling 小成 2024-9-30 09:27:58
轮数太多过拟合了吧,取 1000 的 checkpoint 试试效果
返回顶部