设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
节点
飞墙
Follow
明白贴
工算小助手
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
小米 mino fshex flash 套壳谷歌模型
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
工位搬迁,发生了一件不愉快的事
›
豆包的聪明程度很一般,为什么却是国内最火
›
如果人生是场游戏,我的幸运值恐怕是负数
›
感觉千问的这个活动产品负责人实在动脑子了
›
帮朋友问下如何跨过情色一关
今日热议主题
运维应该如何平衡问题的处理程度
做了个网站记录 AI 炒币实验
想问一下这种 logo 是怎么做的
这种手绘旅游路线图怎样用 AI 生成
出 2020 款 macbook pro, 16+256, M1 芯片
海外回国的机场有推荐吗?
aeroshell 准备 pc 和 ios 一起发布 看看有
稳定高性价比 大香蕉 gemini3proimage(支
2026 想装台黑苹果部 openclaw
for 管理员:关于建立友善度系统建议
显示全部
|
最新评论
77 条回复
·
8239 次点击
11#
Yjhenan
小成
2025-12-25 09:34:43
数据不都是蒸馏出来吗还是怎么着,反正各大模型都有这毛病 https://i.imgur.com/TYtySHv.png https://i.imgur.com/TYtySHv.png
12#
cryptovae
初学
2025-12-25 09:35:51
小米罗福莉前 DeepSeek 研究员,加上上面说的,还不懂吗
13#
yhxx
小成
2025-12-25 09:35:55
@miniliuke 哈哈哈哈 iframe
14#
keethebest
小成
2025-12-25 09:36:39
很正常啊 训练数据问题 以前 gimini 还说自己是百度的模型呢
15#
brazz
小成
2025-12-25 09:36:55
好像没复现出来 https://aistudio.xiaomimimo.com/
16#
iorilu
小成
2025-12-25 09:37:08
小米要能有 flash 水平, 早吹起来了
17#
coconutwater
楼主
初学
2025-12-25 09:38:27
@brazz #14 我是直接接入的 api 调用
18#
dhb233
小成
2025-12-25 09:40:48
哪怕看你的图,也说明不了是谷歌的模型啊,transformer 本来就是所有 AI 的基础啊。
19#
coconutwater
楼主
初学
2025-12-25 09:42:52
经过f友提醒,重新查了相关资料,确实是数据清洗的时候出问题的概率比较大,不能直接说是套壳: "目前的开源或自研模型,为了提升逻辑和对话能力,通常会使用“蒸馏法”——即使用更强的模型(如 Google 的 Gemini 、OpenAI 的 GPT-4 )生成的优质对话数据来训练自己的小模型。小米在训练 MiMo f 时,可能大量使用了 Google 模型生成的合成数据。这些数据里包含了大量“我是 Google 训练的模型”这样的自我介绍语料。"
20#
Gondolier
初学
2025-12-25 09:45:41
@tsja 这倒是真的。同样的苹果的 Apple Intelligence 也很弱智
下一页 »
1
2
3
4
5
6
7
8
/ 8 页
下一页
返回顶部