全球电信网络每天需支持数百万用户连接,平均每分钟产生超过 3,800 TB 数据。
基站、路由器、交换机及数据中心产生的海量实时数据,包括网络流量信息、性能指标、配置与拓扑等,具有非结构化与高度复杂性。传统自动化工具常难以处理此类数据的实时大规模工作负载。
为解决这一挑战,NVIDIA 在GTC 上宣布,其合作伙伴正基于 NVIDIA AI Enterprise 软件平台的 NVIDIA NIM 与 NeMo 微服务,开发专为电信行业定制的大型电信模型 (LTMs) 与 AI 智能体。这些 LTMs 与AI 智能体将推动在网络运维中实现下一代 AI。
大型电信模型 (LTMs) 是基于电信网络数据训练的多模态大型语言模型 (LLMs),是开发网络 AI 智能体的核心。这些智能体可自动化复杂决策流程、提升运维效率、提高员工生产力并优化网络性能。
软银集团与 Tech Mahindra 已基于 NVIDIA AI Enterprise 构建了新型 LTMs 与 AI 智能体,而Amdocs、BubbleRAN 与 ServiceNow 正通过新型 AI 智能体加强其网络运维与优化。
这一进展意义重大。NVIDIA 近期开展的电信行业调查显示,40% 的受访者表示正在将 AI 引入网络规划与运维。
LTMs:理解网络的“语言”
正如 LLM 理解并生成人类语言,NVIDIA BioNeMo NIM 微服务理解用于药物发现的生物数据语言一样,LTM 现在帮助 AI 智能体能够掌握电信网络的语言。
合作伙伴基于 NVIDIA AI Enterprise 平台开发的 LTMs 具备以下特性:
- 专精网络智能:可理解实时网络事件、预测故障并自动化解决。
- 针对电信工作负载优化:依托 NVIDIA NIM 微服务,实现高效、精准与低延迟。
- 支持持续学习与适应:通过 NVIDIA NeMo 的后训练扩展能力,LTMs 可从新事件、警报与异常中学习,持续提升性能。
NVIDIA AI Enterprise 还提供一系列工具与蓝图,帮助构建可简化网络运营、降低成本并提升效率的 AI 智能体,同时优化网络关键性能指标,例如:
- 减少停机时间:AI 智能体可提前预测故障,并增强网络韧性。
- 改善用户体验:AI 驱动优化可提升网速、减少中断并保障无缝连接。
- 强化安全:AI 实时扫描威胁,降低网络攻击风险。
行业领先企业推出 LTMs 与 AI 智能体
多家电信企业正利用 NVIDIA AI Enterprise 推进其最新技术。
软银集团开发了基于大规模 LLM 基础模型的新型 LTM,并使用其自身的网络数据对该模型进行了训练。该模型以 NVIDIA NIM 微服务形式提供,最初专注于网络配置,可自动调整网络以适应流量变化 (如体育场馆大型活动期间)。软银集团还推出网络智能体蓝图,加速 AI 在电信运维中的普及。
Tech Mahindra 利用 NVIDIA 代理式 AI 工具开发 LTM,以助力解决关键的网络运维问题。其自适应网络洞察工作室能够提供网络问题的全景视图,生成不同详细程度的自动化报告,为信息技术团队、网络工程师以及公司高管提供信息并给予协助。
此外,Tech Mahindra 主动网络异常解决中心能够通过 LTM 自动处理大量网络事件,减轻工程师负担并提升效率。
Amdocs 的网络保障智能体 (由 amAIz Agents 驱动) 能够自动化执行故障预测等重复任务,还能针对网络问题开展影响分析,制定预防措施,并提供分步指导解决方案。另外,公司推出的网络部署智能体,通过自动化集成、部署任务与互操作性测试,简化了开放式无线接入网 (RAN) 的采用流程,同时为网络工程师提供有价值的见解。
BubbleRAN 正在云原生基础设施上开发自主的多智能体 RAN 智能平台。在这个平台上,LTMs 观察网络状态、配置情况、可用性以及关键绩效指标,辅助行网络监控和故障排除。平台还通过高级操作工具,实现了网络重新配置和策略实施过程的自动化。其 AI 智能体利用先进的检索增强生成管道和电信专用 API,实时解答 5G 部署相关问题,以满足客户需求。
ServiceNow 基于 NVIDIA DGX Cloud 上的 NVIDIA AI Enterprise 而构建的电信 AI 智能体,通过生成问题解决方案手册,并在潜在的网络中断发生前进行预测,从而提高了工作效率。这有助于通信服务提供商缩短问题解决时间,并提升客户满意度。这些新的、可以直接使用的 AI 智能体还能对网络事件进行分析,找出网络中断的根本原因,以便更快地解决问题,并避免在未来发生类似的情况。
更多有关代理式 AI 的最新进展,请关注在加利福尼亚州圣何塞举办的 NVIDIA GTC 大会。会议将持续至 3 月 21 日。