从一代走向二代的测序技术
那是在上个世纪九十年代的时候,我开始参与人类基因组学方面的研究, 包括后来创建上海国家人类基因组中心 (南方中心)。之后,南方中心和华大基因一起合作,测序1%的人类基因组。这是第一个阶段,使用的是测序速度相对比较低的Sanger测序。在这之后,基因组学的研究进入到一个新阶段,在这个阶段里,很多人开始用DNA芯片的技术来研究基因表达谱。在这个过程中,我和在Rosetta的同事进行了很多研究如肿瘤分型等,后来也应用到分子诊断上面, 包括研制MammaPrint,用于乳腺癌预后测试,该产品于2007年通过美国FDA认证。二代测序的出现,使得大家也包括我本人,开始转向二代测序技术的使用。从2009年时候,我开始涉足二代测序技术,进行肿瘤方面的研究,主要是在肝癌、胃癌,以及肺癌等方面。对一些肿瘤进行测序,从而知道肿瘤的驱动基因是什么。例如,当时和香港大学合作,使我们能够分析中国人乙肝病毒所导致的肝癌中可能的驱动基因突变。这是一项比较完整的分子流行病学调查,在乙肝所导致的肝癌研究中,我们走在世界的前列。
有相当一部分疾病是由于DNA水平的基因突变而引发,找到肿瘤所特有的体细胞突变后,便可以对病患使用靶向药物、进行靶向治疗。基因测序在这一过程中, 在两方面起到作用:一方面是从研究方面来发现不同类型肿瘤的驱动基因;另一方面利用驱动基因可以作为一种分子诊断手段。当然基因检测的手段包括一代测序、定量PCR以及现在的二代测序。二代测序技术在通量方面的快速提升,以及单个碱基的测序成本大大下降,这就带来了很多临床上以及研究上的应用。当成本很昂贵的时候,研究人员用不起或是做不了那么大规模的测序工作,现在测序变成了一个相对比较简单的事情。大家会把二代测序作为研究的手段,并逐步地应用到临床。
精准医疗需要数据分享
在研究过程当中,测序不同患者的基因序列,这是一个知识积累的过程。从统计学方面讲,只有积攒越来越多的数据,才能知道更多的疾病发生的机制,这就是大数据。数据在积累过程当中同时对数据进行分析,这条路会继续发展下去。另外,我觉得应用会变得更加的突出,可以识别肿瘤里有哪些驱动基因,在未来可能对每位病人的肿瘤都进行测序,了解该病人究竟有哪一个驱动基因,再针对他所特定的驱动基因来进行靶向治疗,这就是我们现在说的精准医疗。我觉得这是未来最大的一个发展方向。
现在,我国精准医疗发展较快,与此同时会积累很多中国人的基因数据。有一些基因突变可能跟人种相关,如果没有大数据的支撑,就无法了解不同人种所携带的特异突变。但现在中国人的数据跟国际数据相比,仍然是非常少的。比如现在比较火热的BRCA1/2基因突变,它与乳腺癌的遗传有直接的相关性。在最近美国医学会杂志 (JAMA)发表的一篇文章中,统计了全球三万多病人的数据,其中中国大陆的数据是零。如果我们真的检测到病人有些BRCA基因在DNA水平发生变异,我们仍很难判断这些变异是致病的还是非致病的。所以我们不仅要产生大数据,还要分享这个数据,如果只有积累没有共享的话就不是大数据了。我认为数据的分享在中国精准医疗里应该是非常重要的。
肿瘤的分子诊断,是我一直在走的路
在过去几年里,我个人最满意的地方就是在国际肿瘤基因组学研究工作中,我们提供了很重要的数据。我和我的团队, 亚洲癌症研究组织(ACRG), 为肝癌、胃癌以及肺癌研究产生了大量的重要数据,这里面包括我们所做的三个亚洲人群的研究。而我个人比较遗憾的是将数据应用到临床研究上,这一步仍然走的比较慢。当然,要达到医学诊断的精准需要非常严谨,因此慢也有慢的道理。毕竟对其临床价值的认识,需要一个过程。同时,一个新技术带来的结果不一定都是正面的,在我们认识不够完全的时候,新技术也许会带来一些负面的影响。所以,我觉得虽然现在进展慢,但是一个相对合理的慢。尽管如此,我还是希望我们在临床应用上面能走的快一点。
我是做医生出身,从医生转向做研究。我现在正逐步的回到临床上,做分子诊断方面的推进。未来,我个人会专注于用新技术来做肿瘤的分子诊断,使得肿瘤的分子诊断能够更敏感,更精确,同时也更便宜。这是我未来十年的人生目标!
医谷链
《田埂:我与NGS这十年,前五年拼命学技术,后五年推广应用》
来源:测序中国