英伟达刷新 MLPerf 的 DeepSeek-V3 671B 训练记录：提速 60%，最快 2.02 分钟完成

2026/6/16 23:15:03 来源：IT之家作者：故渊责编：故渊

评论：

英伟达昨日（6 月 16 日）发布博文，宣布在 MLPerf Training 6.0 全部 7 项基准测试中，其 Blackwell 平台拿下最快训练成绩，并成为唯一覆盖全部测试项目的平台。

IT之家注：MLPerf Training 是业界常用的 AI 训练基准测试体系，用来比较不同硬件与系统在模型训练任务中的速度和效率。

而昨日（6 月 16 日）最新发布的 MLPerf Training 6.0 测试套件中，主要包含 7 项核心测试，涵盖了当前主流的大语言模型、生成式 AI 及经典机器学习工作负载：

MLPerf Training 6.0 测试套件主要新增了 DeepSeek-V3 671B 和 GPT-OSS-20B 两个混合专家模型（MoE）预训练工作负载。

英伟达此次提交了 GB200 NVL72 和 GB300 NVL72 两套机架级系统。每套 NVL72 内部通过第 5 代 NVLink Switch 连接 72 块 GPU，把算力和内存整合成统一资源池。

在性能层面，GB300 NVL72 较 GB200 NVL72 在同等规模下最高可带来 1.6 倍训练速度提升。

英伟达刷新 MLPerf 的 DeepSeek-V3 671B 训练记录：提速 60%，最快 2.02 分钟完成

在规模层面，英伟达把 Blackwell 训练集群推到 8192 块 GPU。其在 DeepSeek-V3 671B 任务上，用 GB200 NVL72 完成 8192 块 GPU 规模提交，成为迄今 MLPerf Training 中规模最大的 Blackwell 成绩。

英伟达刷新 MLPerf 的 DeepSeek-V3 671B 训练记录：提速 60%，最快 2.02 分钟完成

CoreWeave 则借助采用 Spectrum-X 以太网的 GB300 NVL72 系统，在 8192 块 GPU 规模上把 DeepSeek-V3 671B 训练到目标质量，耗时缩短至 2.02 分钟。IT之家附上相关截图如下：

英伟达刷新 MLPerf 的 DeepSeek-V3 671B 训练记录：提速 60%，最快 2.02 分钟完成

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

米兰网页版·官方端入口相关的文章

软媒旗下网站： IT之家最会买 - 返利返现优惠券 Win7之家 Win10之家

软媒旗下软件： 软媒米兰网页版·官方端入口-米兰online（中国）APP应用魔方