富士通使用 24 个 NVIDIA DGX-1 打造新型人工智能 (AI) 超级计算机

作者 英伟达中国

富士通今天宣布,它使用 24 个 NVIDIA DGX-1 AI 系统帮助日本最大的综合研究机构 RIKEN 打造一台用于研究深度学习的超级计算机。

这台超级计算机包含迄今为止单个客户安装的最多 DGX-1 系统,它将加快 AI 的应用脚步,解决医疗、制造与公共安全方面的棘手难题。

NVIDIA 创办人兼首席执行官 (CEO) 黄仁勋说:“DGX-1 对 AI 研究人员来说就像是一台时光机器。全球各地的企业、研究中心和大专院校纷纷采用 DGX-1,以赶上深度学习的浪潮,而深度学习这项技术突破处于 AI 革命的核心位置。”

这台新型超级计算机定于下个月上线运行,RIKEN 高级智能项目中心将使用它促进医药、制造、保健、防灾等多个领域的 AI 研究工作。

富士通有限公司技术计算解决方案部门主管 Arimichi Kunisawa 表示:“我们认为,这个基于 NVIDIA DGX-1 的超算系统将加快实际应用最新 AI 技术的脚步与下一代 AI 算法的研究。富士通将运用在高性能计算开发和 AI 研究方面的丰富经验,支持研发单位善加利用这个超算系统,帮助在未来运用 AI 解决各种社会问题。”

RIKEN AIP Supercomputer - Built on NVIDIA 24 DGX-1's
日本 RIKEN 的新型超级计算机,由 24 个 NVIDIA DGX-1 AI 系统打造而成。图片由富士通有限公司提供。

传统的高性能计算 (HPC) 架构成本过高且效率低下,无法满足 AI 研究人员的需求。因此,富士通等公司和 RIKEN 等客户寻求基于 GPU 的解决方案,以便在提高性能的同时降低成本和耗电量。每个 DGX-1 均集八颗 NVIDIA Tesla P100 GPU 的运算能力与针对深度学习框架优化的综合软件堆栈于一体,性能媲美 250 台传统 x86 服务器。

该超算系统包含 DGX-1 特有的多项创新技术,其中包括:

  • 容器化的深度学习框架,经 NVIDIA 优化可获得最强的 GPU 加速深度学习训练效果
  • NVIDIA NVLink 带来更出色的性能和多 GPU 扩展能力,加速获得重大发现
  • 针对深度学习优化的集成式软硬件架构

这台超级计算机还将使用 32 台富士通 PRIMERGY 服务器,它们与 DGX-1 系统相配合,在进行半精度浮点运算时能将整体理论处理性能提升至 4 千万亿次浮点运算。