NVIDIA Quantum-2赋能超算上云,跨入新高度

全新400Gbps InfiniBand交换机和网络平台助力AI、数据分析和高性能计算(HPC)应用实现安全、云原生、多租户和裸金属性能的统一
作者 英伟达中国

美国加利福尼亚州圣克拉拉——GTC大会——2021年11月9日——NVIDIA于今日发布NVIDIA Quantum-2 – 新一代InfiniBand网络平台,为云计算提供商和超级计算中心提供极致的性能、广泛的接入能力及强大的安全性。

NVIDIA Quantum-2 平台即400Gbps的 InfiniBand网络平台,包括NVIDIA Quantum-2交换机、ConnectX-7®网卡、BlueField-3®数据处理器DPU(数据处理器)和所有支持这种新架构的软件。这也是迄今为止最先进的端到端网络平台。

NVIDIA Quantum-2平台推出之时,正值越来越多的超级计算中心走向为广大用户开放之际,其中也包括许多外部用户,于此同时,全球云服务提供商也开始为他们的数以百万计的客户提供更多的超级计算服务。

NVIDIA Quantum-2平台正是为上述的两种趋势的高要求应用而量身定制。凭借其云原生技术,这款产品提供每秒400Gb/s 的高吞吐量和先进的多租户支持功能,可满足众多用户的需求。

NVIDIA网络高级副总裁Gilad Shainer 表示,“如今,超级计算中心和公有云的诉求正在走向融合——它们必须为新一代高新能计算(HPC)、AI和数据分析的应用提供尽可能高的性能,同时还应安全隔离应用,并响应用户对流量的不同需求。凭借NVIDIA Quantum-2 InfiniBand平台,现代数据中心已经可以将这一远景变为现实。”

NVIDIA Quantum-2平台的性能和云原生功能

凭借每秒400 Gbps的高吞吐量,NVIDIA Quantum-2 InfiniBand将网速提高了一倍,网络端口数量增加了三倍。它在性能提升3倍的同时,还将对数据中心网络所需的交换机数量减少了6倍,于此同时,数据中心的能耗和空间各减少了7%。

NVIDIA Quantum-2平台实现了多租户之间的性能隔离,这使得一个租户的行为不会干扰到其它租户,同时通过利用先进的基于遥测且支持云原生的拥塞控制机制,确保了可靠的数据吞吐量,并且不受用户或应用需求高峰的影响。  

NVIDIA Quantum-2 SHARPv3网络计算技术可为AI应用提供超出上一代产品32倍的加速引擎数量,借助NVIDIA UFM® Cyber-AI平台,将为数据中心提供先进的InfiniBand网络管理功能,包括预测性维护等。

NVIDIA Quantum-2平台中集成了纳秒级精度的计时系统可以同步分布式应用,如在数据库处理中,有助于减少等待及空闲时间。这一新功能,其使得云数据中心成为电信网络的一部分,可以托管软件定义的5G无线服务。

Quantum-2 InfiniBand交换机

Quantum-2平台的核心是全新的Quantum-2 InfiniBand交换机,其主芯片采用7纳米制程,包含了570亿个晶体管,略多于含 540亿个晶体管的NVIDIA A100 GPU。

它具有64个400Gbps端口或128个200Gbps端口,并将提供不同端口数的交换机系统,最多达2048个400Gbps端口或4096个200Gbps端口——交换能力上,超出上一代Quantum-1约 5倍。

携网络速度、交换能力和高扩展性的优势,使其成为构建下一代巨型高性能计算系统的理想选择。

全球众多领先的基础架构和系统厂商现已支持NVIDIA Quantum-2交换机,包括Atos、DataDirect Networks(DDN)、戴尔、Excelero、技嘉、惠普、IBM、浪潮、联想、Penguin Computing、QCT、超微、VAST Data和WekaIO。

Quantum-2 ConnectX-7和BlueField-3

NVIDIA Quantum-2平台在主机端提供两个网络选项,NVIDIA ConnectX-7网卡和NVIDIA BlueField-3 DPU InfiniBand。

ConnectX-7基于7纳米工艺设计,包含80亿个晶体管,其数据传输速率是目前世界领先的高性能计算网络芯片NVIDIA ConnectX-6的两倍,还使RDMA、GPUDirect® Storage、GPUDirect RDMA和网络计算的性能翻倍。ConnectX-7样片将于明年1月问世。

BlueField-3 InfiniBand也采用7纳米工艺设计,包含220亿个晶体管,提供16个64位的Arm CPU,以卸载和隔离各种数据中心基础设施服务。BlueField-3样片将于明年5月问世。