设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
人人影库
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
Apple
›
用 M4 Max MacBook Pro + 128GB RAM 跑大模型
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
从这个图里你能看出什么规律?
›
有大佬解释一下今天为啥还小涨了吗
›
分享个人作品,寻找新的工作机会
›
接那个 12321 投诉的帖子,"短信渠道"是
›
闲聊下,最近有点焦虑啊
今日热议主题
vitepress 有好看的博客主题吗
VXNA 20250407
全球降息通胀环境下,黄金是唯一的确定性
国内想开 open AI 的 playground,除了找灰
深圳 11 号 12 号线 福永大单间转租¥1200
老铁们, macos15.4 的升级文件怎么删除?
川建国 twitter 有感,欢迎来到新世界
求 html 播放视频解决方案?
foxmail 无法启动,提示 FoxmailUpdateHook
普通 Web 项目如何编译为小程序?
用 M4 Max MacBook Pro + 128GB RAM 跑大模型
yibie
· 2025-3-18 18:29:42 · 419 次点击
M4 Max MacBook Pro + 128GB RAM 跑大模型:
模型使用 70GB 大小的 QwQ-32B ,精度 16 bit
LM Studio 显示的 CPU 使用率没有跑满,不过风扇开始启动了
内存使用 63GB 左右
除了风扇启动之外,其它程序的操作没有影响
QwQ-32B 在推理方面很强,推理过程当中不停地产生新的问题,然后自问自答
举报
·
419 次点击
登录
注册
站外分享
微信扫一扫
QQ分享
微博分享
豆瓣分享
复制链接
显示全部
|
最新评论
3 条回复
沙发
yinmin
小成
2025-3-18 20:32:15
能跑到多少 tokens/秒?另外,8bit 的 70B 模型跑的性能如何?
板凳
yibie
楼主
初学
2025-3-18 20:58:04
8bit 还不知道,之前跑 Gemma3 应该是 8 bit 精度的,20 token/s 吧,不过这个速度不恒定,看模型会不会自己卡,但一般超过 10 token/s
地板
yibie
楼主
初学
2025-3-18 20:58:31
@yinmin 8bit 还不知道,之前跑 Gemma3 应该是 8 bit 精度的,20 token/s 吧,不过这个速度不恒定,看模型会不会自己卡,但一般超过 10 token/s
浏览过的版块
求职
硬件
宽带症候群
投资
iPhone
返回顶部