基因组学在未来的医疗健康行业中扮演了重要角色,有助为人口水平的研究和临床治疗提供实用信息。全球已有 50 多个国家或地区宣布推出人口计划,其中涉及对数千乃至数百万个基因组进行测序。这些计划所产生的数据将带来根本性突破,医疗机构更可利用这些突破开展诊断及治疗工作。
过去十年中诞生了许多全新的高通量测序仪,但这些测序仪也为分析工作带来了艰巨的挑战。基因组学数据十分复杂。此类数据计算密集性高,且每七个月就会翻一番,这使该行业的数据生成速度超出了 YouTube、Netflix 和天文学数据生成速度的总和。准确性、成本和速度都是关键的考量因素,但传统的 CPU 方法不能为研究人员提供应对此类数据激增所需的计算能力。
就癌症基因组学而言,整个人类基因组平均可产生多达 1TB 的测序数据。将基因组与参考序列进行比对、确定基因组变体并产生可行的见解,这一过程要花费 1000 多个 CPU 小时。借助 NVIDIA GPU 和加速软件,这些计算密集型任务的执行速度可显著提升到原来的 30 到 60 倍。
在亟待解决这些问题时,研究人员将目光转向 GPU,期待 GPU 能为执行基因组分析时所用的高通量、高并行应用提供助力。
作为阿拉伯联合酋长国人口基因组计划的一部分,Group 42 (G42) 利用 NVIDIA DGX™系统构建了一台 GPU 支持的超级计算机 Artemis,此台计算机可提供 7.2 petaFLOPS的运算能力。他们在此台计算机上部署了一款经加速的基因组分析软件套件 NVIDIA Clara™ Parabricks,由此来增强对阿联酋公民基因组的科学认识,并提升该国的医疗健康水平。
GPU 同时也推进了一系列临床发现。Translational Genomics Research Institute(TGEN) 利用基因组测序探究患有罕见神经系统疾病的儿童会对不同的治疗方案作出何种反应。TGEN的高性能计算基础架构由 NVIDIA V100 Tensor Core GPU 和 Clara Parabricks Pipelines 提供动力支持,当日即可给出分析结果,帮助研究人员和医生设计出更为有效的治疗方案。
借助 NVIDIA Clara Parabricks Pipelines(专为高通量实验室设计的软件)和 NVIDIA Clara Parabricks Toolkit(专为开发者构建基因组学工具而打造的技术堆栈),NVIDIA可为 DNA 和 RNA 基因组数据的一级、二级和三级分析实现远超以往的加速。通过利用GPU 在单个平台上为 AI、高性能计算 (HPC) 和数据分析提供动力支持,遗传学家可获得已针对速度、准确性和成本进行优化的工具,进而根据碱基对数据确定变体、基因表达并发现生物标志物。
了解更多NVIDIA医疗健康与生命科学解决方案,欢迎点击专题Pro页面。