NVIDIA 推出大型语言模型云服务以推进 AI 和数字生物学的发展

NVIDIA NeMo 大型语言模型(LLM)服务帮助开发者定制大规模语言模型;NVIDIA BioNeMo 服务帮助研究人员生成和预测分子、蛋白质及 DNA
作者 英伟达中国

美国加利福尼亚州圣克拉拉——GTC——2022 年 9 月 20 日——NVIDIA 于今日发布两项全新大型语言模型(LLM)云 AI 服务——NVIDIA NeMo 大型语言模型服务NVIDIA BioNeMo LLM 服务,使开发者能够轻松调整 LLM 并部署定制的 AI 应用程序,其可用于内容生成、文本摘要、聊天机器人、代码开发,以及蛋白质结构和生物分子特性预测等。

通过 NeMo LLM 服务,开发者能够在 NVIDIA 管理的基础设施上使用被称为提示学习的训练方法快速定制多个预训练基础模型。NVIDIA BioNeMo 服务是云应用程序编程接口(API),它可以将 LLM 用例扩展到语言以外的科学应用中,加快制药和生物技术公司的药物研发速度。

NVIDIA 创始人兼首席执行官黄仁勋表示:“大型语言模型具有改变每个行业的潜力。通过对基础模型进行调整,可将 LLM 的力量带给数百万的开发者,让他们无需重新构建庞大的模型,即可创建各种语言服务并推动科学发现。”

NeMo LLM 服务通过提示学习提高准确性,加快部署速度

借助 NeMo LLM 服务,开发者可以使用自己的训练数据定制基础模型——从 30 亿个参数到世界上最大的 LLM 之一 Megatron 530B。与从头开始训练模型所需的数周或数月相比,该过程只需几分钟到几小时。

提示学习是使用一种名为 P-tuning 的技术来定制模型,使开发者只需使用几百个示例就能快速定制最初需要使用数十亿个数据点训练的基础模型。定制流程生成任务专属的提示标记,这些标记会与基础模型相结合,为特定用例提供更高的准确性和更相关的响应。

开发者可以使用同一模型定制多个用例并生成许多不同的 Prompt Token。游乐场功能提供可以轻松实验并与模型互动的无代码选项,进一步提高了 LLM 对行业特定用例的有效性和可及性。

一旦准备好部署,经过调整的模型即可在云实例、本地系统上或通过 API 运行。

BioNeMo LLM 服务使研究人员能够充分利用大规模模型的力量

BioNeMo LLM 服务包括两个用于化学和生物学应用的新 BioNeMo 语言模型。该服务提供蛋白质、DNA 和化学数据方面的支持,帮助研究人员发现生物序列中的模式和洞察。

BioNeMo 使研究人员能够利用包含数十亿个参数的模型来扩大研究范围。这些大型模型可以储存更多关于蛋白质结构、基因间进化关系的信息,甚至可以生成用于治疗的新型生物分子。

云 API 提供对 Megatron 530B 和其他现成模型的访问

除了调整基础模型之外,LLM 服务还提供通过云 API 使用现成和定制模型的选项。

这让开发者可以访问包括 Megatron 530B 在内的各种预训练 LLM,以及使用 NVIDIA NeMo Megatron 框架创建的 T5 和 GPT-3 模型。NVIDIA NeMo Megatron 框架现已进入公测阶段,可支持各种应用和多语言服务需求。     

汽车、计算、教育、医疗、电信等行业的领导者正在使用 NeMo Megatron 为客户提供中文、英语、韩语、瑞典语等语言的领先服务。

供货情况

NeMo LLM 和 BioNeMo 服务以及云 API 预计将在下个月开放抢先体验,开发者现在就可以申请并了解详情。

现在可以从 NVIDIA NGC™ 获得 NeMo Megatron 框架的公测版,并且该框架在优化后,可在 NVIDIA DGX™ FoundryNVIDIA DGX SuperPOD™ 以及 Amazon Web Services、Microsoft Azure 和 Oracle Cloud Infrastructure 的加速云实例上运行。

想要体验 NeMo Megatron 框架的开发者可以免费试用 NVIDIA LaunchPad 实验室。

关注黄仁勋在 GTC 2022 上的主题演讲,进一步了解 NVIDIA AI 驱动的大型语言模型。

关于 NVIDIA

NVIDIA(纳斯达克股票代码:NVDA)创立于 1993 年并且一直是加速计算领域的先行者。公司在 1999 年发明的 GPU 激发了 PC 游戏市场的增长、重新定义了计算机显卡并点燃了现代 AI 时代。NVIDIA 现在已成为一家全栈式计算公司,提供重塑行业的数据中心级产品。更多信息,请访问 http://nvidianews.nvidia.com/

本新闻稿中的部分声明包括但不限于有关以下内容的声明:我们产品和技术的优势、影响、功能和供货情况,包括 NeMo LLM 服务和 BioNeMo LLM 服务;大型语言模型改变每个行业的潜力;能够调整基础模型所产生的影响;以及大型模型存储更多关于蛋白质结构、基因间进化关系的信息,并生成用于治疗的新型生物分子等均为前瞻性声明,存在风险与不确定性,且最终结果可能与预期存在极大差异。可能导致实际结果出现极大差异的重要因素包括:全球经济状况;我们在制造、组装、包装和测试产品方面对第三方的依赖性;技术发展和竞争的影响;新产品和技术的发展或对我们现有产品和技术的改良;市场对我们的产品或合作伙伴产品的接受情况;设计、制造或软件缺陷;消费者偏好或需求的变化;行业标准和界面的变化;将我们的产品或技术集成到系统中时意外损耗的性能;以及 NVIDIA 近期提交给美国证券交易委员会(SEC)的报告(包括但不限于 Form 10-K 年报及 Form 10-Q 季报)中屡次具体说明的其他因素。提交给 SEC 的报告副本会发布在公司网站上且可免费从 NVIDIA 获得。这些前瞻性声明不能保证未来的表现,仅在规定日期有效。除非法律另有要求,否则 NVIDIA 对更新这些前瞻性声明以反映未来事件或环境不承担任何责任。

©2022 NVIDIA Corporation。版权所有。NVIDIA、NVIDIA 徽标、NVIDIA DGX 和 NVIDIA DGX SuperPOD 是 NVIDIA Corporation 在美国和其他国家/地区的商标和/或注册商标。其他公司和产品名称可能为与之相关的各自公司的商标。功能、价格、供货情况和规格如有变更,恕不另行通知。