笔记本电脑无法满足数据科学研发需求的四个理由

对于现在从事密集的 AI 和数据科学工作的很多人来说,带有完全 GPU 加速功能的移动工作站是必不可少的。

by Andre Franklin

1979 年,International Harvester 推出了令人印象深刻的“Scout”,这被很多人认为是现代 SUV 的先驱,当时该产品的口号是:缺少任何一点就只是一辆普通的汽车。

资料来源:1979 International Harvester Scout 广告。

资料来源:1979 International Harvester Scout 广告。

当广告中的汽车奋力穿过一条泥泞的河流时,它在传递一条很明确的信息:普通汽车就是不能满足所有的驾驶要求,但是强健有力的 Scout 可以让消费者体验到卡车的优势。

对于现在从事密集的 AI 和数据科学工作的很多人来说,带有完全 GPU 加速功能的移动工作站就是计算机中的 Scout——缺少任何一点就只是一台笔记本电脑。

正如 SUV 是为了经受越野考验而打造一样,移动工作站也是为了满足数据科学和 AI 工作的极端需求而设计。为了处理 AI 算法所需的大量数据集,需要带有完全 GPU 加速功能的 AI 堆栈,大容量的 GPU 内存也很必要。

所有带有 GPU 的笔记本电脑都能为适当的工作量带来一定的加速,但是移动数据科学工作站带来的好处并不仅限于此。而且尽管这些工作站表现强劲,但有些也极为轻便。

以下是移动工作站更适合数据科学的四大理由:

1.让开发人员更自由、更高效

在移动工作站进行开发工作可以为开发人员提供更大的自由度和生产效率,从而在本地计算机和远程计算机之间达到更好的平衡。

移动工作站的自由指的是能够在任何地方肆意做实验和有创造性地进行开发工作。开发人员可以按照需求进行任何尝试,这带来了灵活性,也就是一种更好的工作方式、生活方式和更高的效率,同时也减轻了压力。

Data Science Workstation Workflow

能够在本地进行试验和迭代让数据科学家可以根据需要利用云技术,例如处理大型数据集和培训模型。此外,在无需考虑云设置和成本的情况下,可以轻松尝试不同的算法、参数和数据,这样也有利于提高开发人员的效率。其他开发任务也可以进行地更加高效,同时更节省成本,包括审查和清理数据、开发数据特征和评估、搭建和测试模型。

移动工作站擅长处理交互式工作负载、实况流物体检测和很多自然语言处理模型,同时会让探索性编程变得更加轻松。调整自然语言处理模型(例如自动语言识别、文字转语音和光学字符识别),从而在本地进行评估,这样可以缩短试验时间。对于直接与摄像头、麦克风和显示器互动的模型来说,移动工作站也有自己的用武之地,例如在制作语音控制软件原型时。

很多数据科学家通过快速多次迭代和快速试验结果来优化移动工作站的 AI 工作负载。优化后,大规模数据集在本地服务器或云资源中会运行得更加高效。

当移动工作站受到 NGC 中心等 GPU 优化的各种软件的支持时,生产效率会进一步得到提升。开发人员可以免费下载预训练模型、GPU 优化的 AI、深度学习框架和各种面向具体行业的 AI 软件开发包,例如适合自然语言处理的 NVIDIA Riva 和适合推荐系统的 NVIDIA Merlin

2.成本更低,结果更快

虽然任何笔记本电脑都可以将 AI 工作发送到云端,但是产生的成本可能不是一笔小数目。本地或远程共享资源的排期要求可能会拖慢数据准备结果和开发分析模型的速度,后者会用到机器学习、深度学习和其他密集的工作负载。

移动数据科学工作站可以为您的笔记本电脑带来云的效力。在本地运行云试验可以显著减少云成本,而且通常可以节约时间。密集的模型训练是移动工作站开发流程中唯一一项比较大的云成本。

就像拥有私家车的固定成本与共享汽车按里程计费的累计成本对比一样,移动工作站对于很多规模较大的数据科学工作来说都是有意义的,例如利用机器学习和深度学习来训练模型。

除了考虑运营成本之外,共享资源通常也必须进行排期,这可能会造成瓶颈,或者非常不便于设置和使用。还有必须考虑成本费用和将大数据从边缘转移到云的成本。事实上,通常在较大的共享资源中运行的工作其实在移动 GPU 工作站上处理更为合理。

3.体验始终如一

要想在移动工作站、内部私有云工作站和服务器获得始终如一的体验,需要使用单一的数据科学堆栈。否则,当堆栈转移到工作最终运行的中间或生产服务器时,就会失去强大的移动工作站的性能优势。

在不同的软件堆栈服务器上运行带来的意外,可能会让在移动工作站开发有效的深度学习算法所付出的辛苦付之东流。

4.拓展软件生态系统,加快开发进程

跟大多数笔记本电脑一样,移动数据科学工作站可以运行常用的 Office 生产力应用。

但是 GPU 加速平台的软件种类繁多,可以让开发人员使用针对具体任务预置的软件流程,例如计算机视觉、自然语言处理和推荐系统、快速启动开发等。

各种各样的程序库可以确保维持现在的开发优势,同时还能提供未来的灵活性。同样重要的还是,广泛的软件程序库经过认证,可以在要求的 GPU 上运行。

作为数据科学工作的业界标准,NVIDIA GPU 可以提供业内最广泛的软件支持。其中就包括软件生态系统,可以为用户提供针对很多具体任务预置的软件流程。还包括  RAPIDS  和  CUDA 等低级别程序库,让开发人员可以“入侵”自己的程序流程。

是什么在驱动您的数据科学工作?

企业和数据科学家应该问问自己,他们的笔记本电脑配置是否可以应对数据科学和 AI 的挑战。他们还需要考虑采用移动工作站来加快开发进程的代价,因为数据科学驱动的应用越来越普遍。

NGC 数据科学移动工作站包含软件堆栈,其中有最常用的 AI 框架和 SDK,例如 TensorFlow 和 PyTorch,旨在为开发人员节省环境配置时间。在https://www.nvidia.cn/deep-learning-ai/solutions/data-science/workstations/了解如何进行试验,并衡量开发人员可以获得的成本收益、生产效率和灵活度。