NVIDIA发布大型语言模型和生成式AI服务以推动生命科学研发

作为NVIDIA AI Foundations的一部分,全新BioNeMo云服务加速生命科学研究、药物研发和蛋白质工程
by 英伟达中国

加利福尼亚州圣克拉拉 – GTC – 太平洋时间2023年3月21日 – NVIDIA今日推出一整套用于自定义AI基础模型的生成式AI云服务。这些服务将加速新蛋白质和治疗方法的创建以及基因组学、化学、生物学和分子动力学等领域的研究。

作为NVIDIA AI Foundations的一部分,用于AI模型训练和推理的全新BioNeMo™ 云服务产品能够加速药物研发过程中最耗时、费用最高的阶段。研究人员能够依靠它在自己的专有数据上对生成式AI应用进行微调,并可以直接通过网络浏览器或者全新云应用编程接口(API)运行AI模型推理,并轻松集成到现有应用中。

NVIDIA医疗业务副总裁Kimberly Powell表示:“生成式AI的革命性力量为生命科学和制药行业开辟了巨大的前景。NVIDIA与该领域先锋企业的长期合作,推动了BioNeMo 云服务的发展。这项服务现在已经被当作一个AI药物研发实验室,它可提供预训练模型,并使用专有数据自定义服务于药物研发流程各阶段的模型。这能够帮助研究人员识别正确的靶向目标、设计分子和蛋白质并预测它们在人体内的相互作用,从而研发出最佳的候选药物。”

早期用户——安进

世界领先的生物技术公司安进(Amgen)已经在使用这项服务推进其研发工作。

安进数字创新研究加速中心、生物治疗研发部执行总监Peter Grandsard表示:“BioNeMo大大加快了我们的生物制剂研发流程。凭借这项服务,我们可以在安进的专有数据上预训练用于分子生物的大型语言模型,使我们能够探索和研发出新一代药物中的治疗性蛋白质来帮助治疗患者。”

生成式AI大幅加快药物研发流程

BioNeMo 云服务包含预训练的AI模型,以帮助研究人员建立AI药物研发流程。该服务已被包括Evozyne和Insilico Medicine在内的药物研发企业用于支持数据驱动的新候选治疗药物的设计。

生成式AI模型能够快速识别潜在的药物分子,在某些情况下可从零开始设计出化合物或基于蛋白质的治疗药物。这些模型在小分子、蛋白质、DNA和RNA序列的大型数据集上进行训练后,可以预测蛋白质的3D结构和分子与目标蛋白质对接的程度。

新的生成式AI模型在BioNeMo Service上提供早期访问

除了之前公布的MegaMolBART生成式化学模型、ESM1nv蛋白质语言模型和OpenFold蛋白质结构预测模型之外,BioNeMo现在又加入了6个经过优化的全新开源模型,包括:

  • AlphaFold2:DeepMind开发的一个深度学习模型,其能够将确定蛋白质结构所需的时间从几年缩短到几分钟甚至几秒,仅需要使用蛋白质的氨基酸序列。该模型已经被100多万研究人员使用。
  • DiffDock:为了帮助研究人员了解药物分子如何与目标蛋白结合,该模型以高精度和高计算效率预测小分子的3D方位和锚定反应。
  • ESMFold:这个蛋白质结构预测模型使用Meta AI的ESM2蛋白质语言模型,可以基于单个氨基酸序列来预测蛋白质的3D结构,而不需要类似序列的样本。
  • ESM2:该蛋白质语言模型用于推理蛋白质的机器表示,对蛋白质结构预测、属性预测和分子对接等下游任务很有用处。
  • MoFlow:用于分子优化和小分子生成,这个生成化学模型重新创建分子,提出潜在治疗药物的各种化学结构。
  • ProtGPT-2:这个语言模型生成新的蛋白质序列,帮助研究人员设计具有独特结构、属性和功能的蛋白质。

BioNeMo 服务使用户可以通过一个浏览器界面轻松访问这些生成式AI模型,进行互动推理并实现蛋白质结构的可视化。研究人员将BioNeMo与NVIDIA DGX Cloud™上的超级计算资源组合后,就可以在使用NVIDIA Base Command™ 平台NVIDIA AI Enterprise软件套件的全托管软件服务上自定义他们的模型。

制药公司和初创企业利用BioNeMo优化AI工作流程

制药公司和药物研发初创企业正在使用BioNeMo并且多次取得显著的成果。

安进使用其专有的抗体专利数据对 BioNeMo 的 ESM 模型架构进行了预训练和微调。该公司将在DGX Cloud上训练五个用于分子筛选和优化的自定义模型所需要的时间从三个月缩短到几周。

芝加哥生物技术公司兼NVIDIA初创加速计划成员Evozyne的研究人员与NVIDIA联合开发了一个基于 BioNeMo 的深度学习模型——Protein Transformer Variational AutoEncoder。这个生成式AI模型在Evozyne专有的蛋白质数据上进行了微调,研究人员用它可设计出性能明显高于自然界中的酶的合成变体。 

NVIDIA 初创加速计划高级成员Insilico Medicine正在使用BioNeMo加速早期药物研发流程。该流程在过去需要花费四年多的时间,成本约5亿美元。Insilico使用了端到端的生成式AI,只用了三分之一的时间和十分之一的成本就能识别出一种临床前候选药物。该药物预计很快将进入二期患者临床试验阶段。

申请抢先体验BioNeMo

在GTC上了解AI和医疗行业的最新进展,包括安进演讲者主持的三场分会、Evozyne演讲者主持的一场分会和DeepMind演讲者主持的另一场关于AlphaFold的分会。本届GTC将在线上举办并持续到3月23日(星期四)。在这里免费报名参加。

观看NVIDIA创始人兼首席执行官黄仁勋GTC主题演讲中关于BioNeMo Cloud Service的部分。

关于 NVIDIA
自1993年成立以来,NVIDIA (NASDAQ: NVDA) 一直是加速计算领域的先驱。NVIDIA 1999年发明的GPU驱动了PC游戏市场的增长,并重新定义了现代计算机图形,开启了现代AI时代,推动了元宇宙的创建。NVIDIA现在是一家全栈计算公司,其数据中心规模的产品正在重塑整个行业。更多信息,请访问 https://nvidianews.nvidia.com/

本新闻稿中的部分声明包括但不限于有关以下内容的声明:我们与安进、Astellas、Evozyne和Insilico Medicine合作的优势、影响、性能、功能和供货情况。我们产品和技术的优势、影响、性能、功能和供货情况,包括NVIDIA AI Foundations(例如全新BioNeMo Cloud Service产品)、BioNeMo模型(包括MegaMolBART生成式化学模型、ESM1nv蛋白质语言模型、OpenFold蛋白质结构预测模型、AlphaFold2、DiffDock、ESMFold、ESM2、MoFlow和ProtGPT-2、NVIDIA DGX Cloud、NVIDIA Base Command Platform以及NVIDIA AI Enterprise软件套件;生成式AI的革命性力量为生命科学和制药行业开辟巨大的前景;制药公司和药物研发初创企业正在使用BioNemo并且多次取得显著的成果;临床前候选药物即将进入二期患者临床试验阶段等均为前瞻性声明,存在风险与不确定性,且最终结果可能与预期存在极大差异。可能导致实际结果出现极大差异的重要因素包括:全球经济状况;我们在制造、组装、包装和测试产品方面对第三方的依赖性;技术发展和竞争的影响;新产品和技术的发展或对我们现有产品和技术的改良;市场对我们的产品或合作伙伴产品的接受情况;设计、制造或软件缺陷;消费者偏好或需求的变化;行业标准和界面的变化;将我们的产品或技术集成到系统中时意外损耗的性能;以及 NVIDIA近期提交给美国证券交易委员会 (SEC) 的报告(包括但不限于 Form 10-K年报及Form 10-Q季报)中屡次具体说明的其他因素。提交给 SEC 的报告副本会发布在公司网站上且可免费从 NVIDIA 获得。这些前瞻性声明不能保证未来的表现,仅在规定日期有效。除非法律另有要求,否则 NVIDIA 对更新这些前瞻性声明以反映未来事件或环境不承担任何责任。

©2023 NVIDIA Corporation。版权所有。NVIDIA、NVIDIA徽标、BioNeMo、DGX Cloud和NVIDIA Base Command是NVIDIA Corporation在美国和其他国家/地区的商标和/或注册商标。其他公司和产品名称可能为与之相关的各自公司的商标。功能、价格、供货情况和规格如有变更,恕不另行通知。