NVIDIA 今日宣布收购 SchedMD,该公司是 Slurm 软件的主要开发商,Slurm 是一款用于 HPC 和 AI 的开源工作负载管理系统。此次收购旨在帮助强化开源软件生态系统,并推动研究人员、开发者和企业的 AI 创新。
NVIDIA 将继续开发并提供 Slurm 这一厂商中立的开源软件,支持其在各种硬件和软件环境中广泛可用,并得到 HPC 和 AI 社区的支持。
HPC 和 AI 工作负载涉及在集群上运行并行任务的复杂计算,这需要对计算资源进行编排、调度和分配。随着 HPC 和 AI 集群规模越来越大、性能越来越强大,高效的资源利用至关重要。
作为可扩展性、吞吐量和复杂策略管理方面领先的工作负载管理器和作业调度系统,Slurm 为在超级计算机 TOP500 榜单中排名前 10 和前 100 的一半以上系统提供了助力。
Slurm 由 NVIDIA 最新的硬件提供支持,也是生成式 AI 所需的关键基础设施的一部分,基础模型开发者和 AI 构建者使用它来管理模型训练和推理需求。
SchedMD CEO Danny Auble 表示:“我们很高兴能与 NVIDIA 合作。此次收购充分验证了 Slurm 在要求严苛的 HPC 和 AI 环境中发挥的关键作用。NVIDIA 在加速计算方面的深厚专业能力和投入将进一步推动 Slurm 的发展,而 Slurm 也将继续保持开源,以满足下一代 AI 和超级计算的需求。”
NVIDIA 与 SchedMD 已合作超过十年,未来也将持续投入 Slurm 的开发,以确保其持续成为在 HPC 和 AI 领域领先的开源调度系统。
NVIDIA 将加速 SchedMD 对新系统的访问,使 NVIDIA 加速计算平台的用户能够优化其整个计算基础设施的工作负载,同时还支持多样化的硬件和软件生态系统,以便客户可以使用最新的 Slurm 创新运行异构集群。
NVIDIA 将持续为 SchedMD 的数百家客户提供 Slurm 的开源软件支持、培训和开发服务,这些客户包括云服务提供商、制造企业、AI 公司和研究实验室,涵盖自动驾驶、医疗健康和生命科学、能源、金融服务、制造等行业。
NVIDIA 正与 SchedMD 合作支持开源软件生态系统,推动各行各业、各种规模的 HPC 和 AI 创新。
