针对 AI 场景的分布式存储

nakroy · 2024-10-25 13:44:42 · 21 次点击
大模型一般是在集群场景进行分布式训练和推理,那么对于大模型这种动辄几十几百 G (如果训练,还要考虑数据集可能也是 T 级别),分布式存储有比较好的方案吗(读写性能、网络带宽等)?

比如多个 GPU 节点同时从存储节点读取和加载模型权重,对存储节点的读写性能要求应该非常高,想知道集群场景下有没有针对 AI 的分布式存储系统
举报· 21 次点击
登录 注册 站外分享
快来抢沙发
0 条回复  
返回顶部