登录

生物计算时代来临!基因组、蛋白质组、空间转录组和RNA,都需要IT&BT?

作者: 动脉网 2021-05-22 08:00

近日,由百图生科和播禾创新联合主办的首届“中国生物计算大会”在苏州国际博览中心举办。此次大会邀请了生物计算领域超过100名行业科学家、意见领袖、政府高层以及企业伙伴,从行业需求、驱动力、当前挑战及未来展望等多个维度共同定义生物计算。

 

今年是人类基因组测序完成20周年。随着测序成本降低,基因组应用逐步走向临床,包括肿瘤领域的肿瘤突变检测和伴随用药诊断、感染病的检测、基因编辑、基因治疗等。20年的征程,虽然途中遇到了许多的阻碍,但基因组积累了很多的数据需要解读。

 

生物计算与新数据论坛的嘉宾分别在基因组、转录组、代谢组、垃圾基因组、单细胞组学、空间组、免疫组、DNA/RNA等领域发表了他们的看法,以下是部分观点摘录。

 

表观遗传学技术的癌症筛查与癌症治疗

 

DNA上有几千万个胞嘧啶的修饰排列组合,这个排列组合十分复杂,虽然有类似的基因组的序列,但是在上面的修饰是完全不一样的,这种修饰调控了基因表达。

 

这种修饰的方法主要是甲基化和羟甲基化。甲基化是抑制基因的过程,而羟甲基化是激活基因的过程。甲基化主要抑制不需要表达的基因和不变的重复性片段,这类重复片段会耗费大量的测序成本。

 

何川教授团队采用了羟甲基化的化学标记法。在细胞体系上,他们发现羟甲基主要集中在基因本体和增强子。根据这个方法,他们构建出一套人体羟甲基图谱,在19个不同人体器官,100个样品里做羟甲基测序。

 

他们发现,不同的器官具有器官特异性,而在这些器官特异性的基因表达上,羟甲基的基因表达和RNA的表达存在正相关性。

 

肿瘤细胞与正常细胞相比,增强子上羟甲基增加。羟甲基化可以标志不同的细胞形态和不同患病的细胞类型,换句话说,羟甲基化的表达对应基因的表达。

 

通过重构羟甲基化图谱,准确地表达一个人的身体健康状态。如果一个人患上癌症,胃癌或者肝癌,只需要2~3 ml血液就可以做精准测序,追溯DNA。复旦中山医院做了一项有关肝癌的癌症早筛,一两千个样本的双盲试验里,灵敏度和特异性均能达到95以上。

 

除了癌症早筛,癌症治疗方面何川教授也有涉猎。

 

在芝加哥大学的一项恶性肿瘤研究里,他们在治疗前和治疗过程中预测患者的治疗反应,并在2020年发表论文。而在另一项针对淋巴癌的R-CHOP化疗方案里,他们选用了4~5种化疗药物,结果表明,大约50%的患者产生疗效。

 

北京大学的林坚教授利用这个方法产生了一个病例样本,可以比较准确的预测什么类型的病人对治疗方案有效。

 

何川教授认为,如果百图生科的计算平台能够构每个人的健康档案,他们就可以每年实时监测人们的健康变化,实现更早的疾病预防和检测。而对于已发生的疾病,更精准的用药是他们未来努力的方向。

 

蛋白质组+机器学习:低成本高通量的精准医疗

 

西湖.png

西湖大学特聘研究员,西湖欧米创始人 郭天南

 

蛋白质十分复杂,它的信息含量比基因组高出至少6个维度,在时间、空间、蛋白变体、蛋白质复合物、功能活性以及生灭等几个维度中,均比基因组复杂。


郭天南研究员表示:蛋白质组学的大数据正在产生。


目前生命科学微观世界的数据非常稀少,一个成年人约有30万亿个细胞,一个真菌细胞约有4千万个蛋白质。蛋白分子是绝大部分药物的作用靶点,而我们对这些微观世界数据的了解非常稀少,掌握了这些数据,并且得以合理运用,将会加强我们对疾病与健康的更深一层认识。


通过分子诊断去观察疾病的进展,郭天南研究员团队在血液中检测了22个蛋白和7个代谢小分子,建立了一个机器学习的模型,可以对新冠患者的轻重症进行鉴别,使用这个模型,他们发现了几例有趣的病例。


一名70岁的轻症男性患者,因为年龄较大,治疗方式与重症相同,被模型认定为重症患者。另一位被模型判定为重症的轻症患者,有较长期的乙肝和糖尿病病史。虽然是轻症,但该患者病程时间最长,50多天检测结果持续阳性,至今未能查明原因。还有一位66岁的轻症患者,被分子模型诊断为重症。回顾病史发现这位患者在采血当天血糖升高。直至患者痊愈出院,依旧原因不明。


这一系列病例研究表明,所以的疾病变化在分子层面都是有迹可循的。蛋白质分子检测,可以使用靶向质谱,具有低成本的优势。另外一个蛋白质组学的优点是,只需少量的肿瘤组织,或微量的血液样本就可以完成高通量、高重复性的蛋白质组学分析。

 

郭天南教授列举了几个案例。


案例1:采集一万个血清样本的蛋白质组,结合机器学习来预测代谢综合症的风险。在这一项研究中,只需要1微升血清,就能完成几十次蛋白质组学分析。这项技术已经非常成熟,成本低廉,完成1个样品检测只需约20分钟。


案例2:通过尿微量蛋白质组结合机器学习诊断新冠轻重症。尿液含有大量可以被质谱检测到的蛋白,且不存在高丰度蛋白的干扰,通过尿液做出一个可预测轻重症的模型。这项技术的优点在于取样无创。在尿液里,研究人员检测到100多个细胞因子。


案例3:蛋白质组学判断甲状腺结节的良恶性。在甲状腺结节的患者中,大约30%的结节难以诊断。现有的诊断技术还无法准确地判断这30%结节的良恶性。郭天南教授团队做了一项关于蛋白质组联合AI进行甲状腺结节良恶性判断的研究。通过模型测验,该蛋白质测序技术的综合准确率可以达到90%以上,而普通基因测序的综合准确率在60%~80%之间。

 

空间转录组技术进化,带动数据质量和分析方法的进化


“条码”及固态表面的RNA捕捉是基于二代测序的空间转录组的常规技术方案。樊荣实验室采取了另一种新的技术,直接将条码送进组织。这项技术是多功能的,能够应用到整个转录组或组合蛋白。目前组合的蛋白已增加到数百个。

 

樊荣实验室通过收集CDNA做建库,完成测序之后,根据空间定位码来构建空间基因的表达。该空间转录组的数据质量可以达到10微米级别,目前已检测到近5000个umi,超过200个基因,完全覆盖整个转录组。

 

在数据整合方面,由于每个组织像素点的基因数目与单细胞测序数据相当,樊荣博士团队将两种数据整合,做聚类分析发现了25个不同类别。通过进一步分析,最终显示出10个类别。

 

樊荣博士还做了以下几方面的研究:临床石蜡包埋样本,单细胞测序空间转录组、染色质的状态或者染色质的修饰等。

 

RNA的系统生物学:测序解析结构,大数据与AI的结合

 

RNA是一个非常多才多艺的分子,它可以像DNA一样编码遗传信息,也可以催化生命化学反应。目前基于RNA的治疗包括ASO、小核酸药物、siRNA、miRNA药物和mRNA疫苗等。

 

张强锋教授从RNA结构出发,理解RNA的功能,理解RNA的调控并且靶向RNA。

 

RNA结构复杂,RNA的二级结构是目前的关注重点。通过识别RNA的稳定结构,使其从二维结构转化为三维结构,然后就可以生成小分子药物。

 

测序时代的到来加快了RNA的发展,通过测序可以大规模的解析RNA结构,了解每一个分子的位点。张强锋和何川教授一起发明了一些微量的RNA结构测序技术。通过分离得到少量的样品,观察RNA结构,解析免疫因子降解机制。通过这些技术就可以研究RNA结构在RNA功能和调控中心的作用。

 

通过测序技术,张强锋教授的实验室和清华大学实验室以及协和、中国医学科学院的实验室一起合作解析了新冠病毒在人类宿主细胞内的RNA基因组结构,并且在非编码区发现多个进化保守的RNA结构元件。

 

经过试验他们发现,结构元件的改变会影响RNA的效率,影响效果可达50%。通过突变他们还发现改变结构元件会对新冠病毒的生命周期产生较大的影响。

 

张强锋教授团队采用CLIP-seq技术解析RNA蛋白,他们发现细胞内RNA结构和蛋白结合相关性非常高。将RNA序列数据结合起来,他们开发了一个名为PrismNet的深度学习工具,这个工具可以基于RNA结构,预测动态细胞蛋白与RNA的相互作用。

注:文中如果涉及企业数据,均由受访者向分析师提供并确认。
声明:动脉网所刊载内容之知识产权为动脉网及相关权利人专属所有或持有。转载请联系tg@vcbeat.net。

动脉网

未来医疗服务平台

分享
动脉橙
以上数据来自动脉橙产业智库

我们以独创的在线数据库方式,为健康产业人士提供全方位和实时的市场资讯、行业数据和分析师见解。现已覆盖数字健康、医疗器械、生物医药等近500+细分赛道,涉及公司名单、招投标、投融资信息、头部企业动态等各类数据并持续更新。

点击 【申请试用】了解动脉橙产业智库更多内容。
精彩内容推荐

【VB100】第六届未来医疗100强大会开启,在世界难题面前书写“中国故事”

助力社会办医实现差异化服务,橙一健康希望实现“无边界的医疗”

最高1亿元项目资助会花落谁家?SATOL生命科技创新创业大赛持续招募中!

Google Health命悬一线!谷歌为何再次折戟医疗?

动脉网

共发表文章7632篇

最近内容
  • 拜耳Co.Lab上海正式启动招募入驻企业

    8 小时后

  • 赛诺秀:射频抗衰黑科技——TempSure丽可秀【动脉严选新品鉴第57期】

    1 小时前

  • 医疗器械设计与制造论坛议程全公开【第八届未来医疗生态展会】

    1 小时前

上一篇

JACC Editorial:肺高压疾病的新克星——PADN

2021-05-21
下一篇

“最没存在感”的县城,却占中国输注器械31%的市场份额,有望突破千亿年生产总值【未来医疗坐标城市】

2021-05-22