阿里云HPC更新顶级GPU:机器学习疯狂提速10倍

by 英伟达中国

AlphaGo与围棋高手过招让人们真切地感受到人工智能的实力,而这一表现建立在强大的高性能计算平台之上。

3月10日,阿里云面向深度学习、3D图形图像渲染及科学计算发布新一代HPC平台。新平台采用了全新的 NVIDIA Tesla M40 GPU 超大规模加速器和 Intel 酷睿第5代CPU,并使用阿里自有的优化组件,整体性能大幅飞跃。这也是国内首个采用NVIDIA Maxwell架构GPU的云上高性能计算平台。

阿里云新一代HPC配备2块Tesla M40 GPU加速卡和双路32物理核(64逻辑核)CPU,整体单精度计算峰值突破16 TFlops,同时配备了DDR4 128GB内存和2块容量为1.92TB的SSD硬盘。

NVIDIA Tesla M40是全球最快的深度学习训练加速器,让数据科学家在训练自己的深度神经网络时能够节省数天乃至数周的时间。它专为机器学习而优化,与CPU相比可令训练时间缩短8倍;专为全年不间断运行而打造,在数据中心环境中可提供极高的可靠性;支持GPUDirect技术,能够快速训练多节点神经网络。

阿里云HPC负责人王琤表示,“当前高性能计算已经进入井喷期,作为国内最大的公共云高性能计算平台,阿里云经过专业的测试以及阿里内广泛的实践基础,我们确信在深度学习领域,客户会从全新机型上获益。”

此前,NVIDIA曾表示,人工智能竞赛正在进行,它正在云计算、汽车以及医疗等行业中掀起革命。机器学习对这代人来说是一大计算挑战, GPU能使机器学习速度提升10倍。

开放全世界唯一kepler架构GPU原生汇编器

高性能计算不仅需要硬件设施,更需要匹配“软实力”,才能最大限度发挥硬件性能。

王琤介绍,阿里云不仅提供硬件和基本系统,更为HPC准备了Docker实例、调度系统、监控平台,以及针对深度学习的训练、预测中间件和工具。

尤其值得一提的是,开放了全世界唯一的kepler架构GPU原生汇编器,这是阿里内部性能调优的“独门秘技”。阿里用这款汇编器优化出了目前在kepler架构GPU上最快的卷积、矩阵乘法实现。

从今年1月份正式上线到现在,阿里云HPC用户不断增长,客户类型涵盖深度学习、语音识别、图像识别、搜索、渲染、医疗图像以及科研用户,神马、face++、格灵深瞳、dress+等明星企业都在使用阿里用HPC平台。

释放数据科学家潜能  人类更快拥抱未来

目前,领先的深度学习模型通常需要数天到数周的训练时间,这就迫使数据科学家在准确性与部署时间之间作出妥协。

据介绍,新GPU针对机器学习进行了优化,专为缩短训练时间而定制,拥有高可靠、全年不间断运行等特点。

实验数据显示,配备4块Tesla M40 GPU的服务器比双路E5-2697 v3的CPU服务器在运行Caffe进行训练时加速13倍,可让数据科学家在训练自己的深度神经网络时能够节省数天乃至数周的时间。

1
配备4块M40的服务器比双路E5-2697 v3的CPU服务器在Caffe的训练上加速13倍

已为下一个《疯狂动物城》做好计算准备

新一代阿里云HPC平台除了可以应用于深度学习、科学计算外,还能用于图形图像渲染,著名影片《阿凡达》就采用Tesla GPU集群来做渲染,比CPU 集群性能提升25倍。事实上,近8年来每一部入围奥斯卡“最佳视觉效果奖”提名和获奖的电影,均是在NVIDIA GPU支持下完成的。

2 
Tesla GPU上渲染的《阿凡达》角色造型逼真

阿里云新一代HPC支持NVIDIA IRAY Server渲染集群,能大幅提升图形图像渲染性能。Iray支持的插件包括Autodesk 3DS Max、Maya和REVIT等,客户端可以直接把重负荷的渲染任务直接提交到阿里云HPC的渲染集群,能够实时显示照片级渲染结果。

“我们的客户已经开始利用基于GPU的云渲染平台,很期待他们在阿里云上制作出可以媲美《疯狂动物城》、《阿凡达》的3D影视,造福中国观众。”王琤表示。

qr_code_v2