NVIDIA 推出 Grace CPU 超级芯片

144 个高性能核心,每秒 1 TB 内存;将服务器芯片性能和能效提升一倍
作者 英伟达中国

美国加利福尼亚州圣克拉拉市 — GTC 大会 — 太平洋时间 2022 年 3 月 22 日 — NVIDIA 今日宣布推出首款面向 AI 基础设施和高性能计算的基于 Arm® Neoverse™ 的数据中心专属 CPU,其可提供最高的性能,是当今领先服务器芯片内存带宽和能效的两倍。 

NVIDIA Grace™ CPU 超级芯片由两个 CPU 芯片组成,它们之间通过NVLink®-C2C互连在一起。NVLink®-C2C 是一种新型的高速、低延迟、芯片到芯片的互连技术。

Grace CPU 超级芯片是去年NVIDIA发布的首款由 CPU-GPU 集成的“Grace Hopper 超级芯片”的模块,它将与基于 NVIDIA Hopper™ 架构的 GPU一同应用于大型 HPC 和AI 应用。这两款超级芯片采用相同的底层 CPU 架构及 NVLink-C2C 互连。

NVIDIA 创始人兼首席执行官黄仁勋表示: “一种新型的数据中心已经出现,它就是能对海量数据进行处理和提炼以实现智能的 AI 工厂。Grace CPU 超级芯片能够在一个芯片中提供最高的性能、内存带宽以及 NVIDIA 软件平台,将作为‘全球 AI 基础设施的 CPU’ 大放异彩。”

隆重推出 NVIDIA CPU 平台

Grace CPU 超级芯片专为提供最高的性能而打造,能够在单个插座(socket)中容纳 144 个 Arm 核心,在 SPECrate®2017_int_base 基准测试中的模拟性能达到业界领先的 740 分(1)。根据 NVIDIA 实验室使用同类编译器估算,这一结果较当前 DGX™ A100 搭载的双 CPU 相比高 1.5 倍以上。(2)

Grace CPU 超级芯片还提供业界领先的能效和内存带宽,其依托带有纠错码的LPDDR5x 内存组成的创新的内存子系统,可实现速度和功耗的最佳平衡。LPDDR5x 内存子系统提供两倍于传统DDR5设计的带宽,可达到每秒1 TB ,同时功耗也大幅降低 ,CPU加内存整体功耗仅500瓦。 

Grace CPU 超级芯片基于最新的数据中心架构 Arm®v9,具备最高的单线程核心性能,并支持 Arm 新一代矢量扩展,其将为诸多应用带来直接收益。

Grace CPU 超级芯片可以运行所有的 NVIDIA 计算软件栈,包括 NVIDIA RTX™、NVIDIA HPC、NVIDIA AI 和 Omniverse。Grace CPU 超级芯片结合 NVIDIA ConnectX®-7 网卡,能够灵活地配置到服务器中 —— 或作为独立的纯 CPU 系统,或作为 GPU 加速服务器,搭载一块、两块、四块或八块基于Hopper 的 GPU ,从而使客户通过只维护一套软件栈就能针对自身特定的工作负载做好性能优化。

专为 AI、HPC、云计算和超大规模应用而设计

凭借最高的性能、内存带宽、能效及可配置性,Grace CPU 超级芯片在要求最为严苛的高性能计算、AI、数据分析、科学计算和超大规模计算应用方面将会脱颖而出。

Grace CPU 超级芯片的 144 个核心和 1TB/s 的内存带宽将为基于 CPU 的高性能计算应用提供前所未有的性能。HPC 应用为计算密集型,需要最高性能的核心、最高的内存带宽以及最合适的每核心内存容量来加速产出。   

NVIDIA 正在携手 HPC 、超级计算、超大规模和云计算领域的领先客户,围绕 Grace CPU 超级芯片展开合作。Grace CPU 超级芯片和 Grace Hopper 超级芯片预计将于 2023 年上半年开始供货。

观看GTC 2022 主题演讲,进一步了解 NVIDIA Grace CPU 超级芯片。免费注册 NVIDIA GTC 2022,与 NVIDIA 及行业领导者共襄盛会。

关于NVIDIA
NVIDIA(纳斯达克股票代码:NVDA)1999年发明的GPU驱动了PC游戏市场的增长,并重新定义了现代计算机图形、高性能计算和人工智能。NVIDIA在加速计算和AI领域的创举正在重塑交通,医疗健康和制造业等价值数万亿美元的产业,并推动了许多其他产业的增长。更多信息,请访问https://nvidianews.nvidia.com/。
1)        www.spec.org
2)       硅前 Grace 预测与 SPEC CPU® 2017 的比较是在 GCC 10 上使用“-march=native -O3 -ffast-math -funroll-loops -flto”编译,并在量产的 AMD EPYC™ 7742 系统上运行,得出双插槽设计最终SpecRate2017_int_base模拟得分为460。"
本新闻稿中的部分声明包括但不限于有关以下内容的声明:NVIDIA Grace CPU 超级芯片和 Grace Hopper 超级芯片的优势、影响、规格、性能和可用性;Grace CPU 超级芯片在一个芯片中提供极高的性能、内存带宽和 NVIDIA 软件平台,并作为世界 AI 基础设施的 CPU 而大放异彩;HPC 应用为计算密集型,及其需求;以及 NVIDIA 与领先的 HPC、超级计算、超大规模和云客户围绕 Grace CPU 超级芯片展开合作等均为前瞻性声明,存在风险与不确定性,且最终结果可能与预期存在极大差异。可能导致实际结果出现极大差异的重要因素包括:全球经济状况;我们在制造、组装、包装和测试产品方面对第三方的依赖性;技术发展和竞争的影响;新产品和技术的发展或对我们现有产品和技术的改良;市场对我们的产品或合作伙伴产品的接受情况;设计、制造或软件缺陷;消费者偏好或需求的变化;行业标准和界面的变化;将我们的产品或技术集成到系统中时意外损耗的性能;以及 NVIDIA近期提交给美国证券交易委员会 (SEC) 的报告(包括但不限于 Form 10-K年报及Form 10-Q季报)中屡次具体说明的其他因素。提交给 SEC 的报告副本会发布在公司网站上且可免费从 NVIDIA 获得。这些前瞻性声明不能保证未来的表现,仅在规定日期有效。除非法律另有要求,否则 NVIDIA 对更新这些前瞻性声明以反映未来事件或环境不承担任何责任。
© 2022 NVIDIA Corporation。版权所有。NVIDIA、NVIDIA 徽标、DGX、NVIDIA Grace、NVIDIA Hopper、NVIDIA RTX和 NVLink 是 NVIDIA Corporation 在美国和其他国家/地区的商标和/或注册商标。其他公司和产品名称可能为与之相关的各自公司的商标。功能、价格、供货情况和规格如有变更,恕不另行通知。

英伟达初创加速计划面向初创公司成员推出新权益,并提高原有权益,助力计算加速

该计划的成员数量已超过一万家公司,在AI、数据科学、Omniverse、气候科学等领域拥有大量初创公司成员
作者 英伟达中国

在本周的 GTC 大会上,我们对开发者和初创公司在世界各地开展的卓有成效的工作进行了表彰。

表现突出的莫过于我们遍布全球的 NVIDIA Inception 计划(英伟达初创加速计划)成员,该计划旨在培养为行业带来变革性影响的优秀初创公司。该计划面向各种规模和成长阶段的初创公司,免费为他们提供进入市场支持、专业知识和技术。

从数字孪生、气候科学到医疗健康和机器人,各个领域的初创加速计划成员在 NVIDIA 平台上都有着惊人的表现。初创加速计划现已在 110 个国家/地区拥有一万多名成员,真正反映了全球初创公司生态系统的现状。

我们将继续提供新的权益,帮助初创企业加速发展。

增加权益

初创加速计划会员现可享受 NVIDIA 企业软件套件(包括 NVIDIA AI Enterprise (NVAIE)、Omniverse Enterprise 和 Riva Enterprise)折扣。NVAIE 是一款经 NVIDIA 优化、认证和支持的云原生软件套件,可简化 AI 开发和部署。NVIDIA Omniverse Enterprise 可帮助初创公司构建高质量 3D 工具,或简化和加速复杂的 3D 工作流。NVIDIA Riva Enterprise 可帮助轻松开发虚拟助理、转录服务和聊天机器人等实时应用程序。

这些折扣可令初创加速计划会员更轻松地使用 NVIDIA 软件工具,来构建符合自己解决方案的计算应用程序。

初创加速计划会员还可享受另一项新权益,即获得适用于 NVIDIA DGX 系统的特别租赁计划。现在,该权益已面向美国会员提供。这为初创公司提供了更多利用 DGX 为企业 AI 基础架构大规模提供领先解决方案的机会。

初创加速计划会员可以继续获得学分和独家折扣,通过 NVIDIA 深度学习培训中心参加自定进度的技术课程以及有讲师指导的研讨会。即将举办的 DLI 研讨会包括“构建对话式 AI 应用程序”和“适用于预测性维护的 AI 应用程序”;课程包含“构建实时视频 AI 应用程序”和“部署生产级推理模型”。

不断扩展的生态系统

NVIDIA Inception(英伟达初创加速计划)是初创公司开展各类有趣工作的家园,欢迎各领域、各区域和各行业的开发者参与。

在该计划中,会员数量更多的是医疗健康行业,已有 1600 多家医疗健康初创公司参与其中。紧随其后的是 1500 多家 IT 服务初创公司、超过 825 家媒体和娱乐 (M&E) 初创公司以及 800 多家视频分析初创公司。在初创加速计划中,机器人初创公司的会员数量已达 660 多家,他们正通过数字和物理机器人为下一波 AI 浪潮铺平道路。

初创加速计划日益普及的一个指标是,在新兴领域开展工作的初创公司越来越多,例如 NVIDIA Omniverse,这是一个用于 3D 设计协作和实时、物理性质准确的模拟以及气候科学等的开发平台。一些加入初创加速计划的初创公司已经开始使用 Omniverse 平台进行开发。

初创加速计划成员 Charisma 正在利用 Omniverse 为虚拟世界、游戏和教育领域开发数字人。该公司利用云端的 NVIDIA V100 Tensor Core GPU 将交互式对话输入到 Omniverse Audio2Face 应用。

另一家初创加速计划成员 RIOS 通过部署 AI 赋能的端到端机器人工作站,帮助企业实现工厂、仓库和供应链运营的自动化。该公司正在利用 基于 Omniverse 的 Isaac Sim,并将其用于客户部署。

RADiCAL 正在开发用于从 2D 内容中检测和重建 3D 人类动作的计算机视觉技术。为了加速工作进程,这家初创公司已经在 Omniverse 上进行开发。

在气候科学领域,许多初创加速计划成员也正在进行革命性工作,寻求突破。

初创加速计划成员 TrueOcean 正在运行 NVIDIA DGX A100 系统,来开发 AI 算法,用于预测海草草甸中二氧化碳捕获的量化,以及了解海底地质学。海草草甸可以在缺氧的海床中吸收和储存碳,在缺氧海床中,它的分解速度比陆地上慢得多。

为了与 NVIDIA 自身的计划 – 构建用于预测气候变化的功能强大的 AI 超级计算机相一致,初创加速计划成员 Blackshark 提供了语义、逼真的地球 3D 数字孪生作为 Unreal Engine 的插件,并使用 Omniverse 作为其构建大型虚拟地理环境的平台之一。

如果您是一家从事颠覆性开发工作的初创公司,请立即加入 NVIDIA Inception(英伟达初创加速计划)。

查看 NVIDIA Inception(英伟达初创加速计划)会员带来的 Omniverse 和气候变化相关 GTC 会议。免费注册。观看 NVIDIA 创始人兼首席执行官黄仁勋先生的 GTC 大会主题演讲。在该演讲中,初创加速计划会员 HeartDub 和 PRENAV 一起展示了新的“我是 AI”视频

点击链接观看 GTC 2022 重播  https://www.nvidia.cn/gtc-global/keynote/

NVIDIA 展示 DRIVE Sim 中的新型 AI 工具,推动自动驾驶汽车的开发

NVIDIA 研究团队取得突破性成果,展示了 Omniverse 数字孪生技术在仿真中重建真实场景的强大功能
作者 Matt Cragun

自动驾驶汽车的开发和验证需要能够在仿真中复制真实场景。

GTC 大会上,NVIDIA 创始人兼首席执行官黄仁勋先生展示了适用于  NVIDIA DRIVE Sim 的新型 AI 工具,这些工具可以准确重建和修改实际驾驶场景。这些工具由 NVIDIA 研究团队利用 NVIDIA Omniverse 平台和 NVIDIA DRIVE Map 等技术取得的突破性成果提供支持。

黄仁勋先生演示了这些方法,展示开发者如何在快速迭代中轻松测试多个场景:

在仿真中重建任何场景后,这些场景便可用作许多不同变化的基础,包括改变迎面而来的车辆的轨迹,或在驾驶路径上增加障碍物,从而有助于开发者改进 AI 驱动。

然而,在仿真中重建真实驾驶场景并从中生成真实的数据是一个费时费力的过程。这需要技术经验丰富的工程师和艺术家,但即便如此,也很难做到。

NVIDIA 已实施两种基于 AI 的方法来无缝执行此过程:虚拟重建和神经重建。第一种方法复制真实场景,作为完全合成的 3D 场景,第二种方法则使用神经仿真增强真实的传感器数据。

这两种方法不仅能够重现单个场景,还能够实现扩展,生成许多富有挑战性的新场景。这种功能加速了持续的自动驾驶汽车训练、测试和验证工作流。

虚拟重建

在上面的主题演讲视频中,使用 NVIDIA DRIVE Map、Omniverse 和 DRIVE Sim,以 3D 形式重建了 NVIDIA 总部周围的整体驾驶环境和各个场景。

借助 DRIVE Map,开发者可以在 Omniverse 中查看道路网络的数字孪生。通过使用建立在 Omniverse 上的工具,详细的地图可以转换为能够与 NVIDIA DRIVE Sim 一起使用的可驾驶仿真环境。

利用重建的仿真环境,开发者可以使用在真实驾驶中获得的摄像头、激光雷达和车辆数据来重现事件,例如在交叉路口发生的惊险一刻或穿越施工区。

该平台的 AI 帮助重建场景。首先,对于每个追踪的物体,AI 会查看摄像头图像,并从 DRIVE Sim 目录中找到极其相似的 3D 素材,以及与视频中物体颜色非常接近的颜色。

最后,重现追踪物体的实际路径;然而,由于存在遮挡,通常会存在空白。在这种情况下,基于 AI 的交通模型会应用于追踪的物体,以预测其运行情况并填补其轨迹中的空白。

使用真实驾驶中的摄像头和激光雷达数据以及 AI 重建场景。

借助虚拟重建,开发者能够发现具有挑战性的潜在情况,通过基于物理传感器和 AI 行为模型生成的高保真数据来训练和验证自动驾驶汽车系统,从而创建许多新场景。场景中的数据也可以训练行为模型。

使用 AI 从原场景中生成看似合理、具有挑战性的场景。

神经重建

另一种方法依靠的是神经仿真,而不是以合成方式生成场景,首先使用真实的传感器数据,然后再进行修改。

传感器重放(回放录制的传感器数据以测试自动驾驶汽车系统的性能的过程)是自动驾驶汽车开发的主要内容。这是一个开环过程,意味着自动驾驶汽车栈的决策不会影响世界,因为所有数据都是预先录制的。

NVIDIA 研究团队提供的神经重建方法的预览将这些录制的数据转变为一个完全反应式的可修改环境,就像在演示中一样,最初录制的货车驶过时,汽车可以重新设定为右转弯。这种革命性的方法可以实现在自动驾驶栈与驾驶环境之间进行闭环测试和完全交互。

此过程从录制的驾驶数据开始。AI 可识别场景中的动态物体,并将其移除,以创建可从新视角呈现的 3D 环境精确副本。然后,将动态物体重新融入 3D 场景,呈现基于 AI 的逼真行为和外貌,并考虑照明和阴影。

使用 AI 基于预先录制的驾驶数据创建 3D 交互式环境。

然后,自动驾驶系统会在这个虚拟世界中行驶,且场景会做出相应的反应。您可以通过增强现实使场景变得更加复杂,可以插入其他虚拟物体、车辆和行人,使渲染结果看起来就像是真实场景的一部分,并且可以与环境进行物理交互。

车辆上的每一个传感器(包括摄像头和激光雷达)都可以使用 AI 在场景中进行仿真。

在 Omniverse 中,可以在驾驶环境中插入虚拟物体和车辆。针对场景生成了人工传感器数据(包括激光雷达)。

充满可能性的虚拟世界

这些新方法由 NVIDIA 在渲染、图形和 AI 方面的专业知识驱动。

作为一个模块化平台,DRIVE Sim 在确定性仿真的基础上支持这些功能。它提供车辆动态、基于 AI 的交通模型、场景工具和全面的 SDK,以构建所需的任何工具。

通过这两种强大新颖的 AI 方法,开发者可以轻松地从现实世界迁移到虚拟世界,从而加快自动驾驶的开发和部署。