设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
关于大模型原理的感叹
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
失业的程序员们都在干啥?
›
你能接受女朋友不要彩礼,但是和你谈之前经
›
半夜扰民怎么办,已经严重影响休息了
›
F站怎么有这么多人以 PC 为荣?
›
开网吧是不是个好生意
今日热议主题
对隐私保护做得好的浏览器都有哪些
Claude Code 正确使用姿势到底是什么?
今天晶哥打了两个电话给我,叫我去喝茶
iPhone Fold 的传闻越来越确切了,大家期待
程序员的危机感是不是很强烈?我这 0 基础
咨询深圳南山科技园附近 3km 内价格低廉可
V2 今天是改了什么吗?我怎么登不上去呢?
求县城买房建议!
iPhone 有类似于流量管理的工具吗?
求解 iOS 版本达到什么状态时开始安卓版、
显示全部
|
最新评论
33 条回复
·
3523 次点击
11#
risan
初学
2025-11-24 11:17:18
你可以了解一下“涌现”,会有自己的答案的
12#
xtreme1
小成
2025-11-24 11:20:50
这不是前两年的日经话题么, 主流的一个观点是(我的总结不一定准确), 人类自己的"学习理解"就是在压缩信息, 即找到最短的编码方式, 而这和"预测哪个字最可能出现", 在数学上是同一回事. 相关文章可以搜索 Compression is Intelligence.
13#
jonsmith
小成
2025-11-24 11:32:57
AI 炼丹师,LLM 的内部逻辑是未解之谜。
14#
meihuanyu88x
初学
2025-11-24 11:33:22
知道了原理以后,依旧会觉得它是魔法.
15#
sillydaddy
初学
2025-11-24 11:49:42
你不是一个人。即使是如杨立昆或辛顿这样的行业内专家,也不理解。大模型就是一个黑盒。辛顿是这样解释 LLM 的:你把文字转为另一个空间的向量,这个向量表达了文字的各种 feature ,然后这个向量经过了 LLM 的复杂操作,输出一个同样表达各种 feature 的新向量。这就是“理解”的含义。 可以看一下 3blue1brown 相关的科普视频,****几千万次****的播放量: https://www.youtube.com/watch?v=wjZofJX0v4M&list=PLZHQObOWTQDNU6R1_67000Dx_ZCJB-3pi&index=7
16#
IndexOutOfBounds
初学
2025-11-24 12:01:27
@meihuanyu88x 这个同感,我自己撸了个玩具模型,过程中问了很多 Why ,依然不敢说有很透彻的了解,不过也正常可解释性目前也还只是研究方向 https://github.com/glidea/tinygpt
17#
ShinichiYao
小成
2025-11-24 12:14:17
你不需要知道大脑是怎么工作的,你只要照着上帝的设计把它通过电路模拟出来就行了
18#
apkapb
小成
2025-11-24 12:18:27
我突然想到: 0-1 是最难的,现在 AI 已经过了 0-1 了,这会导致大量的企业投入巨量资金来研究,以后肯定会越来越好的。
19#
TabGre
小成
2025-11-24 12:18:59
@sillydaddy 地址好像不全
20#
cmdOptionKana
初学
2025-11-24 12:19:27
@ShinichiYao “上帝的设计”是指什么?
下一页 »
1
2
3
4
/ 4 页
下一页
浏览过的版块
二手交易
创意
生活
综艺
职场话题
返回顶部