制药和科技生物头部企业的研究与开发人员现在可以通过亚马逊云科技( Amazon Web Services, AWS) 轻松部署 NVIDIA Clara 软件和服务,以加快医疗研究进程。
这项计划于太平洋时间 11 月 28 日 在 AWS re:Invent 上公布,让使用 AWS 云资源的医疗和生命科学开发人员能够灵活地集成 NVIDIA 加速的产品,比如用于药物发现的生成式 AI 平台 NVIDIA BioNeMo 等。该平台即将登陆亚马逊云科技 上的 NVIDIA DGX 云,目前可通过高性能计算集群管理工具 AWS ParallelCluster 及 Amazon SageMaker 机器学习服务使用。
全球数千家医疗和生命科学企业已采用 AWS。现在,他们将能够访问 BioNeMo,使用专有数据构建或自定义数字生物学基础模型,并通过运行在 AWS 上 的 NVIDIA GPU 加速的云服务器提升模型训练和部署规模。
许多 AWS 用户已采用 BioNeMo 来开展由生成式 AI 加速的药物研发,包括 Alchemab Therapeutics、Basecamp Research、Character Biosciences、Evozyne、Etcembly 和 LabGenius 等生物科技创新企业。此次合作为他们提供了更多快速扩展云计算资源的方式,以开发基于生物分子数据训练而成的生成式 AI 模型。
此次宣布的计划扩展了 NVIDIA 目前在 AWS 上提供的医疗产品——用于医学影像工作流的 NVIDIA MONAI 和用于加速基因组学的 NVIDIA Parabricks。
AWS 的新成员:NVIDIA BioNeMo 助力用于药物研发的生成式 AI 发展
BioNeMo 是一个适用于特定领域的数字生物学生成式 AI 框架。该框架包含预训练的大语言模型(LLM)、数据加载器以及优化的训练方案,通过加快目标识别、蛋白质结构预测和候选药物筛选,能够助推计算机辅助药物研发的发展。
借助 BioNeMo,药物发现团队可以使用其专有数据来建立或优化模型,并在云端高性能计算集群上运行这些模型。
其中,ESM-2 模型(一个支持蛋白质结构预测的强大 LLM)在 256 颗 NVIDIA Tensor Core GPU 上实现了近似线性的扩展。研究人员可以扩展到 512 颗 NVIDIA GPU 并在几天之内完成训练,而不是一个月,后者是最初的论文中公布的训练用时。
开发人员能够使用 6.5 亿或 30 亿参数的检查点大规模训练 ESM-2。此外,BioNeMo 训练框架支持的 AI 模型还包括小分子生成模型 MegaMolBART 和蛋白质序列生成模型 ProT5。
BioNeMo 的预训练模型和优化的训练方案(可通过 AWS ParallelCluster 和 Amazon ECS 等自管理服务以及 NVIDIA DGX 云和 Amazon SageMaker 提供的集成管理服务获得)能够帮助研发团队建立基础模型,从而探索更多候选药物、优化湿实验室实验,并更快找到有前景的临床候选药物。
用于医学影像和基因组学的 NVIDIA Clara 登陆 AWS
由 NVIDIA 参与创立并提供企业级支持的 MONAI 项目旨在为医学影像工作流提供支持,其下载量已超过 180 万次,并可在 AWS 上部署。开发人员可以使用存储在 AWS 云资源上的专有医疗数据集来快速注释和构建医学影像 AI 模型。
这些模型通过在 NVIDIA GPU 驱动的亚马逊 EC2 实例上进行训练,可用于交互式注释和微调以完成分割、分类、配准和检测等医学影像任务。开发人员还可以利用 MONAI 提供的 MRI 影像来合成模型增强训练数据集。
为加快整个基因组学管道,Parabricks 可以在 15 分钟左右的时间内完成整个人类基因组的变异检测,而仅使用 CPU 系统完成这项工作则需要一天的时间。在 AWS 上,开发人员可以快速扩展,以实现在多个 GPU 节点上处理大量基因组数据。
AWS HealthOmics 上有十多个 Parabricks 工作流可作为 Ready2Run 工作流使用,使客户能够轻松运行预构建的管道。
即刻使用 NVIDIA Clara on AWS 来加速用于药物研发、基因组学和医学影像的 AI 工作流。