案例简介
厦门理工学院采用联想 SR670 v2 服务器,其搭载 NVIDIA GPU 并结合 NVIDIA AI Enterprise 软件套件,成功为计算机学院构建深度学习平台,使团队能快速部署 AI 软件环境,充分利用 GPU 资源,兼顾科研与教学,以应对复杂的教学和科研需求。
客户简介及其应用背景
厦门理工学院位是福建省属公立本科大学。学校遵循“明理精工,与时偕行”的校训,建设“亲产业、开放式、国际化”的国内一流高水平应用技术大学。现拥有福建省新能源汽车与安全技术研究院、福建省客车先进设计与制造重点实验室、福建省功能材料及应用重点实验室、福建省医疗数据挖掘与应用工程技术研究中心、福建省软件评测工程技术研究中心、数字福建自然灾害监测大数据研究所等省级科研平台 35 个,厦门市科研平台及厅级科研平台 24 个。
客户挑战
此次项目针对计算机学院深度学习平台的建设,项目初期采购的联想 SR670 v2 服务器,每台服务器配置三块 GPU,在项目规划和实施的过程中,需要解决客户在科研及教学的过程中面临的主要挑战:
- GPU 资源严重受限。学院需要担负科研任务的同时,还有人工智能教学的任务,需要同时满足至少 20 位学生对于 GPU 同时访问的教学需求。
- 基础软件环境不够灵活。不同的教学任务需要不同的软件环境,如何快速高效的部署软件环境,而且 AI 环境部署过程简单且版本便于维护。
- 管理和维护成本高昂。学校指派了 2 名老师管理该平台,希望平台尽量标准化,自动化,易于操作和管理,遇到技术问题,需要厂商提供及时的技术支持能力,保障科研和教学工作的正常稳定运行。
应用方案
基于客户需求和挑战,NVIDIA 精英级合作伙伴北京慧点数码科技协助厦门理工学院设计并部署了一套结合 NVIDIA AI Enterprise 软件套件端到端的解决方案,成功助力客户计算机学院深度学习平台的高效构建
首先服务器采用了 VMware vSphere 結合 NVIDIA vGPU 的方式,将 GPU 算力切分并用于教学环境,使每个学生可以分配相应的 GPU 算力,做到 GPU 资源的按需调配和高效回收。
其次通过 NVIDIA NGC 网站下载教学环境中需要的应用镜像,让不同的教学任务生成不同的运行环境,在上课时候能快速生成统一的教学环境供学生上课使用,课后关闭虚拟机以释放计算资源。
最后教师在科研工作中,借助则 NVIDIA NGC 中镜像容器,部署自己的科研开发环境,同时保存为本地的工作模版,无需要重复构建,极大提高了老师们的科研效率。
方案效果及影响
慧点数码构建的这套方案通过不同的 AI 环境配置模板,实现快速按需的 GPU 部署能力,不仅满足了老师们在科研项目中对于算力的充沛需求,同时也满足了同学们在课程学习中的并发计算要求。
而利用 NVIDIA NGC 的软件目录和 VMware 虚拟化的模板功能,可以简化快速的部署不同的深度学习框架模板,快速的部署教学用虚拟机及快速释放回收 GPU 算力。同时使管理 GPU 资源的工作更加高效,避免重复和繁杂的底层 AI 软件基础架构部署及适配工作,帮助老师将更多精力投入到科研和教学的工作中。
NVIDIA AI Enterprise 软件套件作为 AI 应用的操作系统,借助 NVIDIA TAO 工具套件,采用低代码和少量训练数据集的情况下,并搭配 NVIDIA 所提供的预训练模型,即可在数小时(而非数月)内创建自定义的 AI 应用模型,帮助老师和同学在人工智能科研和教学的过程中,持续地攀高探索。
最后 NVIDIA AI Enterprise 助力厦门理工学院及时获得 NVIDIA 的技术支持服务,使 NVIDIA 的专家成为助力学院开展相关工作的重要辅助力量,提供长期支持(LTS)软件版本,持续的升级和维护计划,优先客户培训和知识库资源等相关资源。
NVIDIA AI Enterprise 是一款端到端、云原生的 AI 和数据分析软件套件,并且经过优化,可助力任何组织使用 AI 取得成功。欢迎访问官网探索更多 NVIDIA AI Enterprise:https://www.nvidia.cn/data-center/products/ai-enterprise/