设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
人人影库
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
OpenAI
›
NVLink 对显卡集群的影响有多大?
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
临近结婚遇到观念差异,想听听大家对婚姻中
›
大家 idea 用的正版还是盗版,还是社区版啊
›
惠州德赛电池发布员工劳动权益重申知情书
›
工行微信立减金-10 元
›
好奇 Java 味是什么味
今日热议主题
Google Play 上架迟迟没有结果,“已签名的
现在二线城市开发到底啥行情
求助!苹果开发者账号被盗了,损失 100 多
关于 windows11 蓝牙突然没了?只能自己重
YoTube 突然画质变差
请教老师们,类似百度地图 API 并发峰值上
请教一下视频录制的右下角显示演讲者,是用
求购一部 iPhone xr
C++库脚手架项目及思考
AI 行业就业岗位分析?通过分析各个公司的
NVLink 对显卡集群的影响有多大?
zhuwd
· 2025-2-15 08:36:39 · 623 次点击
组了 8 台 NVIDIA A100-PCIE-40GB ,用 Ollama 跑了 Deepseek 的 70B 版本,理论上性能是足够的,但是思考时间特别长,显存的占用率也不是很高,功率甚至连五分之一都没达到,不知道问题出在什么地方
举报
·
623 次点击
登录
注册
站外分享
微信扫一扫
QQ分享
微博分享
豆瓣分享
复制链接
显示全部
|
最新评论
5 条回复
沙发
neteroster
小成
2025-2-15 08:41:35
1. 都用这些设备了不用 sglang 跑去用 ollama 这种干啥 2. 没多大并发占用当然不会高,bs=1 decode 是显存带宽瓶颈。
板凳
zhuwd
楼主
小成
2025-2-15 08:43:25
@neteroster 感谢!!小白刚上手,搜了下都是用 ollama 在部署,这就去看一下 sglang
地板
hertzry
初学
2025-2-15 09:44:14
NVLink 需要专门的硬件交换机,你这 PCIe 版用不了。
5#
TimeNewRome
小成
2025-2-15 10:35:16
deepseek 对 IO 要求很高。楼主的 token 输出慢,多半是因为 IO 传输存在瓶颈。 所以最好的解决办法,应该是换成 NVLINK 而不是继续用 PCIE 。 PCIE 通道数有上限,会严重拖慢 IO 速度。
6#
liuyuncai
初学
2025-2-15 10:35:56
被多机互联的通信带宽限制了,而且你这个是 PCIE 的,GPU 通信也被限制了
浏览过的版块
Android
京东
NAS
Linux
重庆
返回顶部