设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
人人影库
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
为什么 LLM 模型不能按语言拆分,英文问题就只用英文语 ...
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
牛马突然没有班上,多少还是有点焦虑
›
油桃 TV: 电视端浏览器免费观看电视直播和
›
一个月苹果 16 使用体验,糟糕得让人窒息
›
有没会看中医病历或药方的大佬,麻烦进进~
›
offer 怎么选啊
今日热议主题
推荐一个免费数独游戏, https://2024-game
咨询一下各位 geeks,关于 NAS 利用率的问
[爬虫] 爬取 NBA 球队最近的一场比赛数据
都已经 2025 年了,为什么 Java Boy 还是不
信用卡羊毛交流。
如何使用 AU Lab 免费将输入音频播放到扬声
请问大家关于 go 和 vue 的问题.
都已经 2025 年了,为什么 JavaBoy 还是不
[旅行 APP 产品诞生日记] 8day/100days
NAS 有双 2.5G 网口, PC 有一块双光口的万
为什么 LLM 模型不能按语言拆分,英文问题就只用英文语料训练出来的模型、日文问题就只用日文语料训练出来的模型,这样不是可以大幅减少参数量?
drymonfidelia
· 2025-2-1 19:46:10 · 1769 次点击
RT
举报
·
1769 次点击
登录
注册
站外分享
微信扫一扫
QQ分享
微博分享
豆瓣分享
复制链接
显示全部
|
最新评论
16 条回复
沙发
dji38838c
小成
2025-2-1 19:48:52
太低估别人了。 觉得连这么简单的东西都没有尝试过 没有什么用的
板凳
drymonfidelia
楼主
小成
2025-2-1 19:49:34
@dji38838c 我知道别人尝试过了,我的问题是为什么没有什么用?
地板
dalaoshu25
初学
2025-2-1 19:56:38
除了英文,其他语言没什么信息量吧。特别是汉语语料,全是垃圾。
5#
chingyat
小成
2025-2-1 20:10:04
其他语言的语料加起来也不到英语的零头吧
6#
user8341
初学
2025-2-1 20:12:29
这样做连基本的翻译功能都没有了。
7#
fcten
小成
2025-2-1 20:24:33
楼主可知道语言模型最初的目的是为了翻译…… 其次,这样做并不能大幅减少参数量,道理就和你掌握一门新语言并不需要从 1+1=2 开始学习一样。大量的知识是与语言无关的。 再其次,清洗训练数据会花费大量的时间。而且更小的训练集 = 更差的模型。
8#
drymonfidelia
楼主
小成
2025-2-1 20:25:01
@user8341 LLM 翻译虽然很通顺但不准确,以前用 GPT 翻译经常把意思改了
9#
neteroster
小成
2025-2-1 20:30:06
因为模型能在语言间泛化,不仅包括人类语言,也包括编程语言。而且训练多种语言之后可以承担很多跨语言任务。 #7 > LLM 翻译虽然很通顺但不准确,以前用 GPT 翻译经常把意思改了 当前 SOTA 模型在常见语言互译上已经可以做到相当高的精度,特别是在上下文充足的情况下,已经不是传统的翻译模型可以企及的了。
10#
windyboy
小成
2025-2-1 20:40:39
基本都是英语材料训练的 语言翻译只是一个副产品
下一页 »
1
2
/ 2 页
下一页
返回顶部