设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
人人影库
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
Apple
›
用 M4 Max MacBook Pro + 128GB RAM 跑大模型
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
电车有很多缺点,为什么国家还要鼓励发展电
›
关于媳妇,闺蜜,我,真的快要被烦死了,兄
›
[吐槽贴] 2024 年,活在中国,我们竟然还被
›
减肥唯一方法:辟谷
›
公司最近在推行 996
今日热议主题
有人了解过 boss 直聘自动找工作 这个项目
请问免费的虚拟机管理平台推荐 (像是阿里云
win7 每次打开 vscode 1.81.1 版本,每次上
14 寸 M1 Pro 蓝牙怀疑被小米的 Redmi Buds
收个吃灰的 Apple Pencil 一代
实体游戏服
发现身边好几个结婚的亲戚朋友年龄上女生要
Deepseek R1 671B 本地部署方案
你们有玩过 JetBrains 家的远程开发吗?
Java 生态下想搞大流量下的 ws,是不是暂时
用 M4 Max MacBook Pro + 128GB RAM 跑大模型
yibie
·
昨天 18:29
· 412 次点击
M4 Max MacBook Pro + 128GB RAM 跑大模型:
模型使用 70GB 大小的 QwQ-32B ,精度 16 bit
LM Studio 显示的 CPU 使用率没有跑满,不过风扇开始启动了
内存使用 63GB 左右
除了风扇启动之外,其它程序的操作没有影响
QwQ-32B 在推理方面很强,推理过程当中不停地产生新的问题,然后自问自答
举报
·
412 次点击
登录
注册
站外分享
微信扫一扫
QQ分享
微博分享
豆瓣分享
复制链接
显示全部
|
最新评论
3 条回复
沙发
yinmin
小成
昨天 20:32
能跑到多少 tokens/秒?另外,8bit 的 70B 模型跑的性能如何?
板凳
yibie
楼主
初学
昨天 20:58
8bit 还不知道,之前跑 Gemma3 应该是 8 bit 精度的,20 token/s 吧,不过这个速度不恒定,看模型会不会自己卡,但一般超过 10 token/s
地板
yibie
楼主
初学
昨天 20:58
@yinmin 8bit 还不知道,之前跑 Gemma3 应该是 8 bit 精度的,20 token/s 吧,不过这个速度不恒定,看模型会不会自己卡,但一般超过 10 token/s
浏览过的版块
二手交易
职场话题
返回顶部