用于加速PyData生态系统量子计算、到户交付和超级计算的65个软件开发工具包,为150多种产品带来了性能提升。
NVIDIA发布了65个全新及更新的软件开发工具包,包括库、代码样本和指南,为正在推动广泛计算挑战前沿的数据科学家、研究者、学生和开发者带来更好的特性和功能。
NVIDIA创始人兼首席执行官黄仁勋在其GTC主题演讲中发布了这些新增内容,其中包括用于加速量子计算、到户交付算法和图神经网络挖掘的新一代SDK。
NVIDIA产品目录中有150多个加速计算工具包,NVIDIA开发者计划中的近300万名成员使用这些工具包,这个数字在过去五年增长了6倍。CUDA(并行计算平台和编程模型)仅在去年就被下载了700万次,自发布以来的下载次数已达到3000万次。
拓展新市场
新发布的SDK有:
- NVIDIA ReOpt:用于实时物流,引入了先进的大规模并行算法,可以优化车辆路线、仓库选择和车队组合。其动态改道功能可以减少旅行时间、节省燃料成本并最大限度地减少闲置时间,这将为物流和供应链行业节省数十亿美元。
- cuNumeric:用于阵列计算,实现NumPy应用编程接口,可以自动扩展到多GPU和多节点系统,而不需要修改代码。这将给使用Python的2000万名数据科学家、研究者和科学家带来重要的价值。该工具包现已在GitHub和Conda上提供,可以扩展到数千个GPU,为PyData和NumPy生态系统创造加速计算。
- cuQuantum:用于量子计算,大大加快了模拟大型量子电路的速度,使量子研究者能够研究更广泛的算法和应用空间。开发者可以模拟分子的近期变异量子算法和能够识别容错的纠错算法等领域,也可以加速Atos、谷歌和IBM的流行量子模拟器
- CUDA-X加速 DGL容器:用于图神经网络,为从事具有大型图的GNN的开发者和数据科学家提供了一种快速建立工作环境的方法。该容器使得在结合DGL和Pytorch的集成GPU加速GNN 环境中的工作变得很容易。凭借GPU加速GNN,我们可以挖掘图中的洞察,即使是有接近一万亿条边的全球最大图也不例外。例如Pinterest使用具有数十亿个节点和边缘的图神经网络来了解其具有超过3000亿个Pin的生态系统。该网络基于GPU和各种经过优化的库,可用于模型的训练和推理。
Amazon Web Services机器学习总监Alex Smola表示:“我们团队十分高兴能与NVIDIA合作,通过用于图构建的RAPIDS cuDF、用于图采样的RAPIDS cuGraph和GNN的自定义计算内核来加速DGL。而开源的DGL也能通过亚马逊NeptuneML以托管式服务的形式提供。”
经过更新的SDK加速应用开发
众多最受欢迎的NVIDIA SDK都增强了功能并进行了升级,包括Clara、DLSS、RTX、Nsight和Isaac工具包。
其他经过更新的SDK包括:
- RAPIDS 21.10:用于数据科学,提供时间序列数据处理这项新功能并对现有算法进行多项加速。适用于 Apache Spark 3.0 的 RAPIDS 加速器允许企业在不更改代码的情况下加速其在 NVIDIA GPU 上的分析操作。今年以来,NVIDIA最受欢迎的SDK之一——RAPIDS的下载量增长了400%。
- Deepstream 6.0:用于智能视频分析的Deepstream 6.0引入了新的图合成器界面,使具有最低编码能力的用户也能使用计算机视觉,还引入了可视化拖放界面,可实现简单、直观的AI产品开发流程。
- Triton 2.15、TensorRT 8.2和cuDNN 8.4:用于深度神经网络,为大型语言模型提供新的优化,并且为梯度增强决策树和随机森林提供推理加速。
- DOCA 1.2:用于数据中心网络,提供一个零信任的安全框架,该框架通过硬件和软件认证、线路速率数据加密、分布式防火墙和智能遥测来扩展威胁保护。
- Merlin 0.8:用于推荐系统,具有预测用户下一步行动的新功能,只需很少的用户数据,甚至无需用户数据,并且支持大于GPU内存的模型。
适用于SDK的新培训课程
根据IDC预计,全球全职开发者的短缺数量预计将从2021年的140万增加到2025年的400万。该分析公司认为,创建提供教育和赋能的基础设施是弥补这一短缺的长期解决方案。
NVIDIA深度学习培训中心的两门新课程支持并加速开发者对SDK的学习和使用,为该学院的40多门课程目录增添新的内容。
- “用于DPU的DOCA介绍”是一门自学课程。该课程向开发者、研究者和学生介绍NVIDIA DOCA的基本概念。NVIDIA DOCA是一个用于在NVIDIA BlueField DPUs上实现加速数据中心计算的平台。
- 将于本月晚些时候推出的“构建实时视频AI应用”课程将介绍如何使用NVIDIA DeepStream智能视频分析工具和NVIDIA TAO工具套件将原始视频数据转化为基于实时深度学习的洞察,从而实现用于构建高性能流媒体管道的硬件加速组件。
配合新SDK的NVIDIA 深度学习培训中心课程包括:
- 由教师授课的“加速数据科学基础”和自学课程“加速端到端数据科学工作流”使用NVIDIA RAPIDS加速数据科学库来应用各种GPU加速机器学习算法,包括XGBoost、cuGRAPH的单源最短路径以及cuML的 KNN、DBSCAN和逻辑回归,以便执行大规模的数据分析。
- “构建智能推荐系统”涵盖NVIDIA Merlin和其他用于构建高效推荐系统的基本工具和技术以及如何部署用于实时推荐的GPU加速解决方案。
请访问NVIDIA开发者区域了解更多信息。