18项第一,细节曝光!浪潮收割MLPerf榜单的秘诀是?

近日,有着AI领域的“奥运会”之称的国际权威AI基准测试MLPerf公布最新榜单,浪潮、NVIDIA、Intel、高通、阿里巴巴、戴尔、HPE等17家厂商,在几乎所有赛道中展开全面比拼,竞争异常激烈(www.ygrc.net)。在全部42个竞赛项目中,浪潮斩获近半数冠军,获得18项性能第一。一骑绝尘的MLPerf™成绩,进一步凸显出浪潮在AI计算领域卓越的系统设计和非凡的软硬件协同优化能力。

此次性能测试基于最新MLPerf™ Inference V1.0基准,测试内容更加规范,对测试硬件提出了更为细致的要求。其中,固定任务(Closed)强调AI计算系统的公平比较,参赛各方基于同一参考实现开展优化,计算过程在数学上等价。固定任务竞赛衡量的是同一深度学习模型在不同硬件上的性能,重点考察参测厂商硬件系统和软件优化的能力。

针对目前业界功率最高的500W 80GB A100 GPU,浪潮开发的先进片上液冷系统,确保GPU在全功率甚至超频负载下依然稳定工作,将AI计算系统的性能发挥到极致。同时,针对AI训练和推理中最常见的密集通信瓶颈,浪潮PCIe Retimer Free设计实现了CPU-GPU间通道免中继高速互联,大幅降低通信延迟,极大提升了AI训练和推理效率。

而非凡的软硬件协同优化能力,则是浪潮在MLPerf™中不断打破纪录的另一个重要“法宝”。此次MLPerf™基准测试,浪潮竞赛团队在硬件层面通过对CPU、GPU硬件性能的精细校准和全面优化,使CPU性能、GPU性能、CPU与GPU之间的数据通路均处于对AI推理最优状态。在软件层面,通过对TensorRT的深度优化进一步提升了计算性能;同时,结合GPU硬件拓扑对多GPU的轮询调度优化使单卡至多卡性能达到了近似线性扩展。

作为全球领先的AI服务器厂商,浪潮拥有丰富的AI产品阵列。未来,浪潮服务器还将不断推动AI算力多元融合,构建AI产业发展新格局,持续满足智慧时代的多元AI算力需求。

主营产品:柜体,激光切割