设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
为什么 LLM 模型不能按语言拆分,英文问题就只用英文语 ...
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
开网吧是不是个好生意
›
失业的程序员们都在干啥?
›
半夜扰民怎么办,已经严重影响休息了
›
最近对小米的产品比较排斥
›
同志们,技术问题来了,大家讨论下, jwt
今日热议主题
分享一个我在开发的 Coding Agent: Ripper
(远程 可兼职) 硅谷 GenAI 创业团队招前端
好像没人讨论拼多多高管和市监局稽查队打架
AI 漫剧就是 2026 年的风口,所以我用手搓
分享一个我自己上班写代码偷懒的工作流 [前
openai 验证遇到 We were unable to verify
现在 coding 除了 cursor 和 cc 以外哪一家
出 88 会员的优酷和饿了么 11 月 07 到期,
做了一个上班摸鱼的可以低调的玩耍的微信公
你们跟 AI 在一个话题里聊天能聊多少内容?
显示全部
|
最新评论
16 条回复
·
1880 次点击
11#
user8341
初学
2025-2-1 21:40:13
@windyboy 你这是自己的猜测,还是实际参与了,还是有确切的数据? 据我所知 24 年 5 月发布的 DeepSeek-V2 的训练数据中文比英文还多 12%
12#
fun201108
初学
2025-2-1 21:58:14
从使用角度来看,与语言无关,加“翻译”两个字就能相同问题,英文问英文答,英文问中文答,中文问中文答,中文问英文答
13#
windyboy
小成
2025-2-1 22:38:55
@user8341 deepseek 不是用别人的模型来训练的吗?
14#
TimePPT
小成
2025-2-1 22:40:31
有研究表明,预训练时使用多语言语料是有助于智能提升,且多语言在底层是 Align 的。
15#
daweii
小成
2025-2-1 23:01:59
一个特别有意思的事情是人类不同的语言的结构都是特别相似的,特别是名词。毕竟我们都生活在同一个地球上,看着同一个太阳。 一个更有意思的应用就是之前的无对齐语料翻译。方法就是比如说用中文的语料训练一个模型,然后用英语训练一个模型,然后用其中的阿拉伯数字 1 ,2 ,3……9 建立两个语言模型的联系。 话说回来,现在基本上都是英语数据为主,其他数据都只是个添头。但是一个添头得数据就能多让模型处理一个语言,所以说对训练来说往往是利大于弊。
16#
cnt2ex
小成
2025-2-1 23:33:26
因为 LLM 的意思是 LARGE language model ,不仅仅是 language model 。突出的就是要大模型,大数据集。 弄成小模型小数据集效果反而不会那么好。
17#
yoghurtguy
初学
2025-2-1 23:58:45
翻译只占参数量的一小部分,只需要告诉他苹果是 Apple ,不需要再用中文告诉他苹果是圆圆的,通常红色的,上面有个把的水果
1
2
/ 2 页
浏览过的版块
技术
分享创造
Apple
返回顶部