机器学习是我们这个时代最重要的计算开发成果之一。
先进的机器学习技术推动着人工智能的迅猛发展,并为新一波智能应用程序和服务的出现创造了有利条件。
实时语言翻译、自动机器人、通过面部分析检测人类的情绪,这些仅仅是所有可能应用领域的其中一部分。
但是要训练为这些新型应用程序提供动力的复杂深度神经网络,需要具备超强的计算性能。这必定是一个巨大的挑战。即使在速度最快的超级计算机上,也要数天乃至数周的时间才能完成训练。
因此,几乎每个顶尖的机器学习研究人员和开发者都开始采用我们的 Tesla 加速计算平台和深度学习软件开发者套件 (一套用于加速深度神经网络的工具和资料库) 便不足为奇了。
使用 GPU 加速后,神经网络训练要比使用 CPU 时快 10-20 倍。这意味着训练时间从数天甚至数周减少为仅需几个小时。如此一来,研究人员和数据科学家可以建立更大、更复杂的神经网络,这将推动超级智能的新一代应用程序的产生。
各大组织将 GPU 用于机器学习领域
Facebook 是最近宣布计划使用 GPU 的公司。今天一早,该公司宣布推出「Big Sur」,这是该公司为训练深度神经网络而特别建立的下一代系统。
Big Sur 使用新型 Tesla M40 GPU 加速器,这款加速器的设计目的是训练企业数据中心中的深度神经网络。使用 GPU 后,Big Sur 的速度比现有系统快了 2 倍。这可以让 Facebook 训练两倍之多的神经网络,同时还可提升应用程序智能和准确性。
Facebook 的合作伙伴计划通过 Open Compute Project (开放计算项目) 向社区开放 Big Sur 规格的源码。这将允许其他人将 GPU 用于所有类型的机器学习工作。
其他组织也在利用 GPU 支持机器学习。
上个月,IBM 宣布其 Watson 认知计算平台开始支持 NVIDIA Tesla K80 GPU 加速器。
添加到 Watson 的 POWER 架构后,GPU 将该架构的检索和排列 API 能力提升了 1.7 倍,处理能力提升了 10 倍。这将增强 Watson 的自然语言处理能力和其他关键应用程序。
在 NVIDIA 深度学习 SDK 的推动下,机器学习领域取得长足进步
GPU 之所以能快速应用到机器学习领域,关键在于 NVIDIA 的深度学习 SDK。这是一套强大的工具和资料库,能为数据科学家和研究人员提供用于训练和部署深度神经网络的基本要件。
其中包括 DIGITS – NVIDIA 的深度学习 GPU 训练系统。借助该系统,数据科学家和研究人员能使用实时网络行为可视化技术,基于掌握的数据快速设计最佳深度神经网络。整个过程不需要他们编写任何代码。
此 SDK 还包括 cuDNN – NVIDIA CUDA 深度神经网络。其经过优化的例程可让开发者专注于设计和训练神经网络模型,而不是低级的性能调整。
另外还包括其他资料库和工具 (cuBLAS、cuSPARSE、NCCL 和 CUDA 工具包),它们全都针对机器学习工作负载进行了优化。
深度学习框架的基础
NVIDIA GPU 和深度学习 SDK 推动机器学习不断发展。越来越多组织开发和使用 GPU 加速的深度学习框架,以训练深度神经网络。
其中包括 Microsoft 的 CNTK 框架和 Google 的 TensorFlow。他们的开发人员最近将这两个框架作为开源解决方案提供给外界。它们将与其他开放框架 (Caffe、Theano 和 Torch) 一起,广泛用于设计和训练深度神经网络。
由机器学习推动的人工智能竞赛已然开始。作为机器学习的首选引擎,GPU 将帮助推动几乎所有产业和研究领域的创新。