设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
人人影库
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
OpenAI
›
NVLink 对显卡集群的影响有多大?
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
[送码] InfyniDock, macOS 应用多窗口管理
›
是不是只有苹果用户才特别在意电池健康度
›
javaer 是不是写啥都是一股 Java 味儿
›
今天早上追尾了一辆小鹏
›
工行微信立减金-10 元
今日热议主题
StrongBox 被 applause 收购了, 也是收购 B
一个快速搭建 AI 应用的思路及实现
密码管理软件 Strongbox 被纽约的 Applause
[收] 想收个 se1 , 有吗
[租房咨询] 打算租个空房,自己布置家具,
mobaxterm 的文件浏览器,删除的时候为啥不
请问这是在说哪一个?
在公司怎么样才能消息灵通点?
上证突破 3400,大家怎么看?
[网络相关] 求助分析一个早上遇到的服务器
NVLink 对显卡集群的影响有多大?
zhuwd
· 2025-2-15 08:36:39 · 621 次点击
组了 8 台 NVIDIA A100-PCIE-40GB ,用 Ollama 跑了 Deepseek 的 70B 版本,理论上性能是足够的,但是思考时间特别长,显存的占用率也不是很高,功率甚至连五分之一都没达到,不知道问题出在什么地方
举报
·
621 次点击
登录
注册
站外分享
微信扫一扫
QQ分享
微博分享
豆瓣分享
复制链接
显示全部
|
最新评论
5 条回复
沙发
neteroster
小成
2025-2-15 08:41:35
1. 都用这些设备了不用 sglang 跑去用 ollama 这种干啥 2. 没多大并发占用当然不会高,bs=1 decode 是显存带宽瓶颈。
板凳
zhuwd
楼主
小成
2025-2-15 08:43:25
@neteroster 感谢!!小白刚上手,搜了下都是用 ollama 在部署,这就去看一下 sglang
地板
hertzry
初学
2025-2-15 09:44:14
NVLink 需要专门的硬件交换机,你这 PCIe 版用不了。
5#
TimeNewRome
小成
2025-2-15 10:35:16
deepseek 对 IO 要求很高。楼主的 token 输出慢,多半是因为 IO 传输存在瓶颈。 所以最好的解决办法,应该是换成 NVLINK 而不是继续用 PCIE 。 PCIE 通道数有上限,会严重拖慢 IO 速度。
6#
liuyuncai
初学
2025-2-15 10:35:56
被多机互联的通信带宽限制了,而且你这个是 PCIE 的,GPU 通信也被限制了
返回顶部