大家好,我是张大可,来自中国科学院北京基因组研究所。今天我跟大家分享的题目是:隐匿在生命背后的语言——探索基因测序的应用边界。
在很多人眼里基因测序是一个确定 DNA 组成、剪辑序列组成的技术活儿,好像对人的衣食住行难以产生立竿见影的效果,也有人认为基因测序是在解读生命的天书,这本天书似乎能够解决生命过程中所有的问题,那是不是这样呢?今天我们讨论的就是,基因测序在生活中的应用边界。
基因工作者在破解什么?
目前基因检测市场的繁荣背后经历了几十年、上百年,以及几代科研工作者的不懈努力。提到医学领域的应用不可避免地会提及人类基因组计划。
这个起始于 1999 年、完成于 2003 年涉及中美六国科学家共同完成的计划,历时 10 多年、投资 30 亿美元才获得了人的第一份基因组草图。随着时间的前进、技术的进步、成本的下降,今天我们可以在不到一周的时间内获得这份草图,其花费只不过是 500 美元。
这份草图里面涵盖了大量的遗传信息,记载了人进化过程中的所有经历,包括从单细胞向多细胞生物的演化、从海洋的生命到陆地生命的演变、从有尾动物到无尾动物的改变。
图 | 人类胚胎 0-8 周的 23 个阶段(来源:embryology.med.unsw.edu.au)
在 60 天胚胎演化周期中,人的进化过程在胚胎发育早期被精确重演,这个过程背后是生命的语言在控制。遗传语言掌握着复杂而又精密的人体系统,这个系统的基本单元是细胞,我们有 200 多种细胞,构成了 4 种基本的组织,形成了 12 种器官,这些复杂的系统构成了整个人体。
基因工作者获得了人类的遗传基因编码,其实只迈出了自我解码的第一步,我们整体的工作可以用一句话简单概括,就是完成对生命语言的逆向工程。我们需要判断到底有多少基因,它们在细胞里面扮演什么样的角色、发挥什么样的功能,能有哪些因素调控它们的功能促使它们协同完成某一项工作,以及它们多努力地完成这项工作。
此外,人和人之间大概有千分之一的遗传差异,这个遗传差异会造成你我在高矮胖瘦、疾病发生风险上的不同,这些遗传差异是怎样影响细胞的整个活动,同时影响疾病发生的呢?就是我们需要做并且不断探索基因检测应用边界的基础性工作。
人体的研究是需要经过严格的伦理审查的,我们不能在人体上直接进行各种各样的尝试,最简单的一个方法其实是在疾病的诊疗当中积累大量的证据,积累基因和疾病发生关系之间的相关性的证据。
截止现在全球的科学家已经在 ClinVar 数据库中积累了 50 万条以上的基因导致疾病或者性状改变的信息,利用这些信息我们对遗传病的诊断有了更为精确的了解。千分之一的遗传差别会导致遗传疾病的风险,科学家们把相应的研究综合在了 GWAS Catalog 数据库中,目前市面上采用的基因检测产品中涉及疾病风险评估的部分,大多采纳的是这个数据库中的研究结果。
肿瘤的发生是基因变化导致的,为了了解其中的规律科学家们目前收集了接近 40 种、超过 30000 例样本的组织进行各个角度的分析并存在 TCGA 基因数据库中,通过数据库中大量的科研素材,可以知道肿瘤发生的规律、分析它们对疾病的影响同时研发出更好的治疗方案。
现在测序技术的进步以及成本的下降,使得我们可以一个个细胞地去看生命语言的变化对细胞行为的影响。对疾病的理解也可以渐渐深入到某一小组细胞的变化对疾病的影响,从而能设计出更好的药物来减少药物的毒副反应,甚至可以改变细胞的命运,实现组织和器官的再生。
对于遗传的研究进程其实还很短暂,如果把 1900 年重新发现孟德尔定律作为现代分子遗传学的开端,至今为止才不过 120 年的历史,我们进行大规模基因组群研究的历程也不过短短 20 年,相比于亿万年的进化历程来说这个研究的历程还十分短暂、积累也十分有限。
不过我们已经取得了日新月异的研究进展,使得大家在市面上可以看到纷繁复杂的基因检测产品,涵盖基因疾病风险的评估、药物基因组学、法医、祖源等各个方面,深刻地颠覆了目前的医学诊断领域。
把生老病死的生命历程作为一个时间轴去看这些基因检测产品,从出生我们可以接触到新生儿的筛查,在育龄夫妇结婚的时候可以携带者的筛查,在出现肿瘤之后可以做肿瘤相关的基因检测,以及会做一些肿瘤免疫、治疗相关的评估,这些基因检测产品其实涵盖生命周期的整个历程。
基因检测靠谱吗?
大家觉得我是做基因研究的,碰到我脱口而出第一个问题就是基因检测靠谱吗?这个问题其实可以归纳为基因检测准不准?最核心的一点是要了解遗传因素在提问者关心问题中的贡献大小。
传统来说遗传病发生的原因大多是基因的变化,检测到的基因的改变有助于遗传病的诊断,比如复杂的疾病比如常见的心脑血管疾病,其实遗传因素对整个疾病发生的贡献只占 20% 到 30%,那做相应的基因风险评估,预测准确性十分有限。
市场上涉及遗传病、肿瘤诊疗和药物的基因检测产品,因为检测的对象比较明确从而产生的结果也比较明确,所以整体给人一种很靠谱的感觉。基于 DNA 测序判断个体的特征、判断微生物的来源,也是非常直接的对其基因序列特征的检查,这种检测的针对性非常强,也给人很靠谱的感觉。
以上所有的检测其实都在分析一个既成的事实,也就是这个改变已经发生而且产生了相应的后果。再举两个例子,一个是在孕期接触到的无创产前筛查,这需要抽取孕妇的外周血去看胎儿释放出来的 DNA 是否有异常,那么胎儿已经在母体当中孕育而成,我们不是在分析这个孕妇孕育一个异常胎儿的风险。
图 | NIPT 无创产前筛查(来源:illumina 官网)
又比如像肿瘤的液体活检,在外周血中寻找来自肿瘤的信息标记物,包括它的 DNA 、释放的外泌体和凋亡小体等,这些都是体内已经产生了肿瘤之后寻找的踪迹,而不是对产生肿瘤的风险评估。
评估一个技术是不是靠谱在我看来需要从四个角度切入。
第一,它是不是具有扎实的理论基础;第二,它的研究进展能不能支撑它在目前市场上的应用;第三,它有什么样的技术平台,各个技术平台的优缺点是什么,局限性在哪里;第四,应用技术解决问题的时候,背后支撑的团队是不是有足够的经验去分析解决各种意想不到的问题。
然而那些都不是目前来自于市场上最大的质疑,最大的质疑是基因检测对未来事件的预测,也就是基因疾病风险的评估。2018 年《麻省理工科技评论》曾经把基因检测作为疾病风险评估的工具,列为最有潜力的十大技术进展之一,但是给它起了一个具有调侃意味的名字——基因占卜,意味着虽然承认了这个技术应用的广泛前景,但对里面的不确定性也有不踏实的感觉。
(图片来源:麻省理工科技评论)
疾病风险的评估的确对传统的遗传病诊断观念造成了非常大的冲击。
遗传病患者的家属通常有多个个体发病,而且多个个体可能都是由同一个或两个致病突变导致的。但是疾病风险评估用到的基因改变有很多,每一个风险的存在并不一定导致疾病的发生,这种风险只是一种概率,这种概率和可能性在人类认知系统中仅仅是一种相关性而不是明确的因果,这种不确定性带给大家一种不靠谱的感觉,是对人类认知感受的冲击。
人在进化过程中需要做很多决策,包括某一个果子吃不吃、某一个虫子碰不碰,这些都可能会直接影响到个体是不是在恶劣的自然环境当中存活下来,我们需要立刻知道这个判断和选择的结果,偏重即时反馈和明确的因果关系。
随着人类寿命的延长,从建国前三十多岁的寿命,延长到建国后七十多岁的寿命,在整体生命过程当中需要做大量的选择和决策,这些决策很多时候都不能即时看到效果。疾病预防就好比在高速路上驾驶一辆汽车,想要安全地从起点到终点,其实不仅仅需要对每一个异常情况做准确地判断,同时也要坚持安全行车规则。
所以在人一生中所要遵循的就是始终让自己做出疾病风险比较小的决定,虽然很难说这种决定一定会导致一个结果,但是它会极大地降低发生疾病的概率。我们要做的是每个人正确地面对疾病发生的风险,不过于焦虑。
同时科研界要做的是把风险研究的基础做得更扎实、更准确、更好地指导人们的健康生活。相信通过科研界的不断进展和在市场上基因检测产品的不断尝试,以及人类群体作为一个整体在基因研究领域的不断进展,最后大家能达到一个状态,那就是古希腊特尔斐神庙上的一句格言:认识自己。
谢谢大家!
张大可:中科院北京基因组研究所遗传学博士
来源:DeepTech深科技 作者:演绎inSite