支持技术创新,NVIDIA 助力推动智能精准化测序

作者 英伟达中国

芯像生物科技是一家成立于 2017 年的领先的人工智能 NGS(Next-generation sequencing)测序仪生产商,以半导体芯片技术为核心,赋能体外诊断技术的创新,目标是打造检测结果快速精准、仪器运营低成本高产出、运行流程集成自动与智能化的基因测序平台,推动技术的普及,为人类生命健康护航。 
 

公司开发出的 StarSeq100 AI 测序仪,利用人工智能和 GPU 加速技术实现全流程的高效测序,从数据处理、特征学习到模型训练和 FastQ 生成,极大地提高测序通量,并显著降低单位样本的测序成本。 

芯像生物的目标用户主要是中心医院、地区医院、生物医药研究机构、基因组学研究所等医学和科研机构。StarSeq100 AI 测序仪的高效性和精准性使其成为医学研究和临床诊断领域的理想选择,帮助用户更快速、更准确地进行基因测序,为疾病诊断、治疗和个性化医学提供强有力的支持。 

芯像生物已成功落地多项业务场景的 AI 赋能,其中包括无创产前基因检测(NIPT)、宏基因组测序(mNGS)和靶向测序(tNGS)等。通过将人工智能和 GPU 加速技术应用于这些领域,芯像生物实现了高通量、高精准的测序结果,帮助医学机构和研究所加速疾病诊断和治疗,推动了基因测序技术的普及和应用。同时,芯像生物与上海生物医药技术研究院达成合作,共建 AI 测序仪联合实验室,通过深入合作,推动测序仪技术的创新与发展,为临床医学和基因组学研究提供更加先进的技术支持和解决方案。 

智能精准化测序面临的挑战 

“智能精准化测序将成为未来主流测序方式”,但目前面临着多项挑战和限制。首先,现有的传统测序算法和工具平台适用于小规模数据和计算量不大的场景,无法满足 NGS 行业日益增长的海量数据处理需求,同时测序精度也有待提高,很难利用异构架构如 CPU+GPU 来实现并行计算。其次,AI 技术的使用门槛较高,导致传统测序仪器厂商缺乏开发工具和对相关算法不够熟悉。这使得引入 AI 技术在 NGS 行业中面临着技术难题。 

构建 NGS AI 测序仪平台也面临着以下几大挑战。首先是数据管理和处理。由于 NGS 每次运行生成大量数据,通常从千兆字节到太字节不等,因此需要大量的计算资源和存储容量来管理、存储和传输如此庞大的数据集。其次是保证测序的高精度。要实现高精度的 NGS 数据处理,需要采用高质量的测序算法,并在整个分析工作流程中应用严格的质量控制措施。第三个挑战是算力支持。大规模数据的训练和推理需要强大的算力,仅依靠 CPU 远远不够。因此,需要建立 CPU+GPU 异构计算环境,并根据 CPU 和 GPU 使用情况来支持自动扩容缩容,以实现资源的合理分配和高效利用。 

解决这些问题和挑战对于 NGS 行业的发展至关重要。通过引入智能精准化测序和 AI 技术,可以提高测序精度和效率,推动 NGS 行业向更加智能化和精准化的方向发展。同时,加强技术人才培养和资源投入,将有助于克服技术应用的瓶颈,推动 NGS 行业持续创新和发展。建立高性能的 CPU+GPU 异构计算环境,将使得大规模数据的处理更加高效,为 NGS 行业的未来发展奠定坚实基础。 

NVIDIA 助力解决困境 

为了解决所面临的困境,使得行业发展创新更进一步,芯像生物科技积极地实施了如下的解决方案: 

  1. 使用深度学习神经网络克服 DNA 测序的各种挑战。基于卷积神经网络(CNN)的 DNA 簇检测优化,提高 DNA 簇检测准确性,从而更有效地提取荧光信号信息。采用多个网络块构建层级处理流程来构建碱基 basecall 过程,提高基因组序列的准确性。 
  1.  引入 SMART 碱基 basecall 及过滤技术,实现吞吐量、准确性和速度的平衡,适用于不同应用场景。根据各应用的需求进行自适应性过滤,高利用率的智能数据筛选算法以精准选取符合应用需求的数据,并有效降低单位样本的测序成本。 
  1. NVIDIA GPU 加速 AI 训练迭代流程,以覆盖跨测序仪、跨试剂、跨物种、跨应用带来的增量式多样性的数据训练需求。StarSeq100 AI 测序仪所部署的深度学习模型训练基于 NVIDIA GPU 和 Pytorch 框架,模型训练速度较原来提升了 10 倍,训练数据吞吐量提升 8 倍,训练稳定性亦大幅提升。 
  1. 基于 NVIDIA GPU AI 推理加速的异构平台,以双倍提升测序算法计算速度,有效降低了客户测序报告等待时间,为用户提供更快速、高效的测序体验。 

NVIDIA 赋能 StarSeq100 AI 测序仪 

NVIDIA 产品在 StarSeq100 AI 测序仪的技术、产品、业务和行业竞争力方面发挥了重要作用,为芯像生物带来了显著的影响。NVIDIA GPU 为 StarSeq100 AI 测序仪提供了强大的计算能力,使 NGS 深度学习测序成为了可能。通过使用深度学习技术和 NVIDIA GPU,StarSeq100 AI 测序仪实现了从数据处理、特征学习、模型训练到 FastQ 的全流程 GPU 加速。这大大提高了训练、推理速度,同时使测序通量提升了 30-40%,极大地降低了部署的成本和单位样本的测序成本。NVIDIA 产品的高性能计算能力为 StarSeq100 AI 测序仪的技术和产品带来了巨大的提升,使其成为 NGS 测序领域的领先产品。 

同时 NVIDIA 深度学习培训中心(DLI)免费课程为芯像生物提供了学习机会。作为 NVIDIA 初创加速计划的会员,芯像生物可以专享这些课程,提高员工的技术学习能力。这有助于芯像生物在技术方面保持领先,并加速 StarSeq100 AI 测序仪的技术创新。NVIDIA 产品的教育支持使得芯像生物的团队能够不断学习和掌握最新的人工智能测序技术,从而在市场竞争中保持优势。 

NVIDIA 产品为 StarSeq100 AI 测序仪的技术创新和业务发展提供了有力支持。通过加速计算和提供学习机会。NVIDIA 的创新技术和全面支持为 StarSeq100 AI 测序仪的成功应用和业务拓展奠定了坚实的基础,比如在病原感染、肿瘤及生殖遗传方面,AI 测序仪使得这些疾病的检测分析更快速,更精准。 

NVIDIA 初创加速计划 

上海芯像生物科技有限公司是 NVIDIA 初创加速计划 (NVIDIA Inception) 会员企业。NVIDIA 初创加速计划为免费会员制、旨在培养颠覆行业格局的优秀创业公司。该计划联合国内外知名的风投机构,创业孵化器,创业加速器,行业合作伙伴以及科技创业媒体等,打造创业加速生态系统。能够提供产品折扣,技术支持,市场宣传,融资对接,业务推荐等一系列服务,加速创业公司的发展。