为什么加速数据处理对各行各业的 AI 创新都至关重要

作者 Ben Oliveri

在各行各业,AI 正在用机器驱动的计算来推动创新。在金融领域,银行正在使用 AI 更快地检测欺诈行为并确保账户安全;电信公司正在使用 AI 优化网络以提供优质服务;科学家正在使用 AI 开发治疗罕见病的新疗法;公共事业正在使用 AI 建设更清洁、更可靠的能源网络,汽车行业正在利用 AI 使自动驾驶汽车更安全、更便捷。

数据是各种大型 AI 用例的基础。有效且精确的 AI 模型需要使用广泛的数据集进行训练。企业要想利用 AI 的力量,就必须建立一个数据流,从各种来源提取数据,并将其转换成一致的格式并进行有效存储。

数据科学家通过多次实验完善数据集以微调 AI 模型,从而在真实应用中实现其最佳性能。从语音助手到个性化推荐系统,这些应用都需要快速处理大量数据,以保障实时性能。

随着 AI 模型变得越来越复杂,并开始处理文本、音频、图像和视频等各类数据,满足快速数据处理的需求变得更加关键。对于继续依赖传统 CPU 计算的机构而言,数据瓶颈、数据中心成本不断攀升和算力不足阻碍了其创新发展和性能提升。

许多企业正转向加速计算以将 AI 融入其业务运营中。这种方法充分利用 GPU、专用硬件、软件和并行计算技术,将计算性能提升最高达 150 倍,能效提升高达 42 倍。 各行各业的领先企业正在利用加速数据处理来实施其开创性的 AI 计划。

金融机构瞬间检测到欺诈行为

由于需要对大量交易数据进行快速分析,金融机构在检测欺诈方式时面临巨大挑战。此外,由于缺乏真实欺诈案例的标记数据,也给 AI 模型的训练造成了困难。在处理与欺诈检测相关的大量数据时,传统的数据科学工作流缺乏所需的加速能力。这导致数据处理缓慢,阻碍了实时数据分析和欺诈检测。

为了克服这些挑战,每年处理超过 80 亿笔交易的美国运通使用加速计算来训练和部署长短期记忆(LSTM)模型。这些模型用于顺序分析和异常检测,并能够适应新数据和从中学习,是打击欺诈的理想选择。

利用 GPU 上的并行计算技术,美国运通大幅加快了 LSTM 模型的训练速度。GPU 还使已经投入使用的模型能够处理大量交易数据,以进行高性能的计算,从而实时检测欺诈行为。

该系统可在低于两毫秒的延迟中运行,以更好地保护客户和商家,与基于 CPU 的配置相比性能提高了 50 倍。通过将加速的 LSTM 深度神经网络与其现有方法相结合,美国运通在特定领域的欺诈检测准确率提高了 6%。

金融公司还可以使用加速计算来降低数据处理成本。通过在 NVIDIA GPU 上运行涉及大量数据的 Spark3 工作负载,PayPal 证实了其有望将大数据处理和 AI 应用的云成本降低 70%

通过更高效地处理数据,金融机构可以实时检测欺诈行为,从而在不干扰交易流的情况下更快决策,并将财务损失的风险降至最低。

电信公司简化复杂的人员调派

电信公司的各项业务产生了海量数据,包括网络设备、客户交互、计费系统以及网络性能和维护。

每天处理数百 PB 数据的全国性网络需要进行复杂的技术人员调派,以确保服务。为了优化技术人员调度,先进的调派引擎需要执行数万亿次计算,并充分考虑天气、技术人员技能、客户需求和车队分布等因素。这些操作的成功取决于细致的数据准备和充足的算力。

AT&T 拥有美国最大的现场调度服务团队之一。该公司正在通过 NVIDIA cuOpt 改善数据密集型人员调派,依靠启发式、元启发式和优化来计算复杂的车辆调派问题。

在早期试验中,cuOpt 在 10 秒内就提供了调派解决方案,将云计算成本降低了 90%,这使技术人员每天能够完成更多的服务呼叫。NVIDIA RAPIDS 是一套能够加速数据科学和分析数据流的软件库,它进一步加速了 cuOpt,使企业能够集成 本地搜索启发式算法和元启发式算法(如 Tabu 搜索),以持续地优化人员调派。

AT&T 正在采用 NVIDIA RAPIDS Accelerator for Apache Spark,以增强基于 Spark 的 AI 和数据流的性能。这有助于该公司从训练 AI 模型到保持网络质量,再到减少客户流失和改进欺诈检测的运营效率全方位提升。通过 RAPIDS 加速器,AT&T 正在减少目标工作负载的云计算支出,同时实现更高的性能并减少碳排放量。

基于电信公司对提高运营效率同时提供高质量服务的需求,加速数据流的传输和处理将至关重要。

生物医学研究人员缩短新药研发时间

研究人员对人类基因组中大约 25000 个基因进行了研究,以了解它们与疾病之间存在何种关系,这使得医学数据和同行评审的研究论文数量激增。生物医学研究人员依靠这些论文来缩小开发新疗法的研究范围。然而,对数量如此庞大且仍在不断增加的相关研究进行文献综述,已成为一项不可能完成的任务。

领先的制药公司阿斯利康开发了一个生物学洞察知识图谱(BIKG),从文献综述到筛选命中率评级、靶点识别等整个药物发现过程为科学家提供帮助。该图谱将公共和内部数据库与科学文献中的信息进行整合,模拟了 1000 万至 10 亿种复杂的生物关系。

BIKG 已被有效地用于基因排序,帮助科学家假设高潜力靶点以研发新疗法。在今年的 NVIDIA GTC 上,阿斯利康团队介绍了一个项目,该项目成功识别了与肺癌治疗耐药性相关的基因。

为了缩小潜在基因的范围,数据科学家和生物学研究人员共同定义了相关标准和基因特征,以确定理想的开发疗法靶点。他们训练了一种机器学习算法,在 BIKG 数据库中搜索具有文献中提到的可治疗基因的特征。通过利用 NVIDIA RAPIDS 来加快计算速度,该团队将初始基因库从 3000 个减少到仅仅 40 个目标基因,以前完成这项任务需要耗时几个月,但现在只需要几秒钟。

通过用加速计算和 AI 助力药物研发,制药公司和研究人员最终可以利用医学领域积累的大量数据,更快、更安全地开发新药,帮助挽救生命。

公共事业公司创造清洁能源的未来

能源部门正大力推动碳中和能源转型。在过去的 10 年里,随着太阳能等可再生能源的使用成本大幅下降,清洁能源未来的实现取得了重大的进展。

然而,在整合来自风力发电厂、太阳能发电厂和家用电池的清洁能源时,电网管理面临着新的复杂性考验。在能源基础设施多元化并且需要双向输电的情况下,电网管理变得更加数据密集化。因此,现在需要新的智能电网来处理汽车充电的高压充电区,此外还必须管理分布式储能的可用性,并适应整个电网的各种用电情况。

知名电网边缘软件公司 Utilidata 与 NVIDIA 合作,使用定制的 NVIDIA Jetson Orin 边缘 AI 模块,为电网边缘开发了分布式 AI 平台 Karman。这种嵌入电表的定制芯片和平台将每个电表转化为一个数据收集和控制终端,支持每秒处理数千个数据点。

Karman 处理来自电网边缘电表的实时高分辨率数据。这使公共事业公司能够在几秒钟内(而不是几分钟或几小时)详细了解电网状况,预测用电情况,并无缝整合分布式能源。此外,通过边缘设备上的推理模型,电网运营商可以预测并快速识别线路故障,以预测潜在的停电,并进行预防性维护,从而提高电网的可靠性。

通过集成 AI 和加速数据分析,Karman 帮助公共事业公司将现有的基础设施改造成高效的智能电网。这样即可实现量身定制、本地化的电力分配,以满足波动的用电需求,而无需大规模地升级实体基础设施,从而实现更具成本效益的电网现代化。

汽车制造商使自动驾驶汽车更安全、更便捷

汽车厂商正在努力实现全自动驾驶。为此,车辆必须能够实时检测物体和进行导航。这就需要高速的数据处理,包括将摄像头、激光雷达、雷达和 GPS 的实时数据输入 AI 模型,以做出导航决策,确保道路安全。

自动驾驶的推理工作流非常复杂,包括多个 AI 模型以及必要的预处理和后处理步骤。传统上,这些步骤是在客户端使用 CPU 处理的。然而,这可能会导致处理速度出现重大瓶颈,对于快速处理等同于安全的应用来说是不可接受的缺点。

为了提高自动驾驶工作流的效率,智能电动汽车制造商蔚来将 NVIDIA Triton 推理服务器集成到其推理工作流中。NVIDIA Triton 是一款开源、多框架的推理服务软件。通过整合数据处理任务,蔚来在一些核心领域将延时降低至原来的 1/6,并将总体数据吞吐量提高最多达 5 倍。

蔚来以 GPU 为中心的方法使更新和部署全新 AI 模型变得更容易,并无需对车辆进行任何改动。此外,该公司还可以在同一组图像上同时使用多个 AI 模型,而无需通过网络来回发送数据,从而节省了数据传输成本并提高了性能。

通过使用加速的数据处理,自动驾驶汽车软件开发人员可确保他们能够达到高性能标准,以避免交通事故,降低运输成本,从而助力用户更好地出行。

零售商提升需求预测能力

在快节奏的零售环境中,快速处理和分析数据的能力对于调整库存水平、个性化客户互动和动态地优化定价策略至关重要。零售商的规模越大,销售的产品越多,其数据操作就越复杂,同时计算密集程度也更高。

世界上最大的零售商沃尔玛通过使用加速计算,显著地提高了对其 4500 个商店中 5 亿种商品组合的预测准确性。

随着现有的计算环境开始出现无法完成工作或产生不准确结果的问题,沃尔玛的数据科学团队构建了更强大的机器学习算法,以来应对这一巨大的预测挑战,他们发现,数据科学家必须从算法中删除一些特征,才能顺利运行。

为了改进预测,沃尔玛开始使用 NVIDIA GPU 和 RAPID。该公司现在使用的预测模型拥有 350 种数据特征,可以预测所有产品类别的销量情况,包括销售数据、促销活动以及影响需求的外部因素(如天气状况和超级碗等重大活动)。

先进的模型帮助沃尔玛将预测准确率从 94% 提高到 97%,同时消除了约 1 亿美元的生鲜产品浪费,减少了缺货和降价的情况。GPU 运行模型的速度也提高了 100 倍,只需 4 小时即可完成各项作业,而这在 CPU 环境中则花费数周的时间。

通过将数据密集型操作转移到 GPU 和加速计算,零售商可以降低成本和碳排放量,同时为消费者提供最适合的选择和更低的价格。

公共部门提高防灾能力

无人机和卫星拍摄了大量航空图像数据,公共和私营机构则使用这些数据来预测天气模式、追踪动物迁徙和观察环境变化。这些数据对研究和规划非常宝贵,可以帮助农业、灾害管理和应对气候变化等领域做出更加明智的决策。然而,如果缺乏特定的位置元数据,则这些图像发挥的价值可能会受到限制。

与 NVIDIA 合作的一家美国机构正在探索一种方法来自动确定缺少地理空间元数据的图像位置,这对搜救、应对自然灾害和监测环境等任务至关重要。然而,使用没有元数据的航空图像识别更大的区域内的一块小区域,这种挑战有如大海捞针。设计有助于地理定位的算法,必须解决图像光照的变化以及在不同时间、日期和角度拍摄图像所造成的差异。

为了识别无地理标记的航空图像,NVIDIA、Booz-Allen 公司和当地政府机构合作开发了一种解决方案,即通过使用计算机视觉算法从图像像素数据中提取信息,以解决图像相似性搜索问题。

在试图解决此问题时,一位 NVIDIA 解决方案架构师首先使用了基于 Python 的应用程序。最初在 CPU 上运行时,其处理时间超过 24 小时。而 GPU 可将处理时间压缩到仅几分钟,且并行执行数千个数据操作,而在 CPU 上只能执行少量操作。通过将应用程序代码转移到开源 GPU 加速库 CuPy 中,该应用程序惊人地提速了 180 万倍,在 67 微秒内就返回了结果。

借助可以在几分钟内处理大面积陆地图像和数据的解决方案,各个组织或机构就可以获得其所需的关键信息,从而更快、更有效地应对紧急情况,并积极主动地制定计划,从而有望挽救生命、保护环境。

加速 AI 计划,交付业务成果

使用加速计算进行数据处理的企业正在推进 AI 计划,以实现其在业内更高水平的创新并取得更好的成果。

加速计算可以更高效地处理大型数据集,更快地实现模型训练和精选的优化算法,并为实时 AI 解决方案提供更精确的结果。

与基于 CPU 的传统系统相比,使用加速计算的企业可以实现更高的性价比,并增强其向客户、员工和合作伙伴提供卓越结果和优质体验的能力。

了解加速计算如何帮助组织机构实现 AI 目标并推动创新,请访问 https://www.nvidia.cn/data-center/solutions/accelerated-computing/