与DGX以前的版本相比,NVIDIA推出了DGX A100 AI加速器,走了一条替代之路。在DGX A100上,NVIDIA选择使用AMD的EPYC系列CPU,这与以前使用Intel Xeon Platinum的型号有所不同。
NVIDIA DGX A100-Ampere的激动人心的发布
上个月,我们收到消息称NVIDIA正准备推出备受期待且广为流传的AmpereGPU微体系结构,现已改名为GA100。对于DGX A100,A100 GPU将使用GA100的简化版本。
A100-规格
6,912个CUDA内核
108 SM(流式多处理器)
422张量核心
826mm模具面积
540亿个晶体管
台积电7nm CoWoS(晶片上晶圆晶片)
40 GB HBM2
PCIe 4.0
DGX A100规格
8倍NVIDIA A100
320GB总VRAM
12.4 TB / s带宽
第三代NVLink
600 GB / s带宽
2倍AMD EPYC 7742
128核心
256个线程
128个PCIe 4.0通道
1 TB DDR4-3200系统内存
15 TB PCIe 4.0 NVMe固态硬盘
5 PFLOPS计算
AMD与NVIDIA合作-AMD将为DGX A100提供EPYC CPU
对于许多人来说,AMD与NVIDIA之间的合作关系似乎违反直觉,但是对于两家制造商而言,这种合作关系都是非常有益的。AMD的EPYC CPU系列拥有相当多的功能,在这种情况下,引起了NVIDIA的关注。以前,NVIDIA的DGX系统由Intel的Xeon Platinum CPU提供支持,但是NVIDIA已迁移到DGX A100的AMD企业平台。
在单个x86数据中心处理器中,只有第二代AMD EPYC处理器可以提供多达64个内核和128通道的PCIe 4互连性,我们很高兴看到NVIDIA DGX A100系统的强大功能如何使I / O带宽达到有效地加倍。
Raghu Nambiar-公司副总裁。数据中心生态系统与应用工程
DGX A100中使用的第二代AMD EPYC处理器可提供高性能并支持PCIe Gen4。NVIDIA已将这些功能用于创建世界上最强大的AI系统,同时保持与整个DGX系列中使用的GPU优化的软件堆栈的兼容性。
DGX Systems副总裁兼总经理Charlie Boyle-NVIDIA
NVIDIA的DGX A100将由两个AMD EPYC 7742 CPU供电,总共128个内核和256个线程,以及1 TB DDR4-3200系统内存,并将提供PCIe 4.0,这是AMD EPYC CPU独有的功能,总共128个PCIe 4.0通道。