我的故事说起来可能有点长,之前就有朋友希望我能把之前的一些经历写成一本书。今天,我们可以来聊一聊其中几个有意思的故事。当时我在Lynx Therapeutics做高通量测序相关的工作。2002年诺贝尔生理学与医学奖获得者悉尼·布伦纳(Sydney Brenner)是我的指导者。他选择线虫作为实验生物模型,使得基因分析能够和细胞的分裂、分化,以及器官的发育联系起来,并且能够通过显微镜追踪这一系列过程,他在英国剑桥完成的这些为他获得诺贝尔奖奠定了基础。Sydney当时是Lynx 的首席科学家,在业内非常受尊敬,Lynx的很多体系都是他在设计,我在Lynx 的一项工作就是和Sydney配合,老先生的思维很活跃,有时候一天会有20多个想法,我的工作就是对这些想法“做减法”,将能够产业化的想法实现。在他的领导下Lynx建立了一套完整的测序体系。
合并前,Lynx和Solexa公司各自拥有自己的技术
二代测序包含一个扩增技术,以及一个测序技术。Sydney的测序方案就是在磁珠上扩增DNA, 有点像乳液PCR;测序技术是采用encoding-decoding技术;Solid的技术有点相似,甚至导致了后来ABI和Illumina的官司战。
我们当时想做的是把平面放大这个技术引进来,把之前在珠子上进行扩增的技术在平面上实现,经过多方筛选,引进了瑞士一家公司的平面技术,也就是现在我们所说的cluster技术。因此,Lynx公司的测序技术变成了cluster扩增技术加上encoding-decoding测序技术的组合,被称作MPSS技术。之后,在与Solexa公司合并的时候,整个技术体系又面临了新的挑战。当时Solexa的整体测序也包括一套DNA信号放大技术和测序技术,他们的测序技术是采用Reversible terminator。
当时,双方都派出一个团队来进行商谈整合公司资源。Lynx公司就有我,另外还有负责仪器的,以及软件开发和实验方面的人。英国Solexa公司派出是负责生物信息的Clive Brown ,现在是Oxford Nanopore Technologies首席信息官(CIO),负责化学的John Milton,现在是Oxford Nanopore的首席科技官(CSO),另外还有负责技术整合以及仪器研发的人员。
双方激烈争辩后,确定了最终的技术方案
双方团队坐在一起,对这四类技术进行协商,哪些技术能往前走,哪些技术得先缓一缓。Solexa CEO John West对我们说(这时候已经合并了):“现在不可能同时运行多套技术,所以要选出一套方案:一个放大技术,一个测序技术,往前走,在座的各位在没有选出最佳方案之前,不能离开会议室!”于是Lynx首先介绍MPSS技术,从磁珠到如何测序的整套体系。在当时,该技术读长16bp,产生50万序列;如果读长超长,测序质量就会直线下降,测序技术都有局限性,但这在当时来说已经是很好的测序技术了。Solexa 方面John Milton做了他们体系的报告,他们的仪器非常庞大,要做真正的第三代。因为是没有放大的单分子测序技术,当时只能测3-4个碱基,而且非常不稳定。在讨论测序技术的时候,双方都认为自己的测序技术非常好,因为这牵涉到公司,我们在MPSS里花了那么多功夫,将encoding-decoding的方法研发出来,对这个技术是非常有感情的。当然,对方团队也一样,跟他们的Reversible terminator感情上连得非常紧。在讲解技术的时候,双方都站在自己这一边,大家对这些前沿技术都讲得非常好,但是心理清楚是有一定局限性的。大家讲完后,就开始选择测序技术,双方进行辩论,阐述对方技术的缺点在哪里,双方争论很激烈互不相让,一定要选择自己的技术。
争论到下午4点的时候,John West进来了,询问选择好了没有,大家表示没有做好选择。John West表示,那就继续选,选不出来大家就在会议室过夜。公司只有那么多资源,必须选出一个。于是大家继续争论,到五点还是没有结果。John West又进来,你们不好做出选择,那我就教大家做一个武断性的方法,就是举手投票,来选择哪个技术应该往前走。最后的结果让大家都非常惊讶,Solexa的成员全部投票选择Lynx的技术往前走,Lynx的成员全部投票给Solexa的技术应该向前发展。原来,双方都意识到自己技术的局限性太大,对自己技术了解很深的时候,虽然表面上争论老半天,但真正要让这项技术干活的时候,自己都非常清楚自己技术的局限性非常大。于是双方又僵持住了,虽然互相支持对方,但僵持得很厉害。最后John West说:那这样吧,各位想想三年之后,当技术成熟之后,会是哪项技术更容易让客户接受、让使用方接受?你们都是站在研发方的角度来看这个问题,客户的角度来理解的话,哪个技术更容易解释,更被接受呢?大家异口同声的说Solexa的Reversible terminator最容易被接受,而且大家一直强调是今后的方向。不管Lynx的encoding-decoding技术能否成功,Reversible terminator是业内大家期望得到的技术,虽然难度非常非常大,但这才是正确的方向。这差不多是2005年的1月份才定下来,将Reversible terminator和Cluster技术结合是我们要发展的方向。
结合技术大放异彩
当Cluster技术与Reversible teminateor技术结合后,马上就出现了非常好的发展势头。Reversible terminator技术以前因为都是单分子,难度大,但它与cluster技术结合放大之后,信号增强,一下子就显出了强大的技术优势。读长从当时的16bp,差不多以每两个月、三个月增加5bp的速度增长。这里面后来还有很多故事,我们当时还算过如果在平面上来测表面的荧光,这个表面荧光能量的厚度只有100nm。那这100nm之内你能测多长的序列?我们做过理论上的计算,但是非常担心的是这个会是Illumina/Solexa测序技术读长的一种限制。实际上后来真正的情况是比我们的理论值要好得多。当时理论上面做了一个错误的假设,假设DNA是直的,但实际上DNA有的是弯曲的,有的是环向的,所以这100nm的长度的实现可以吸收。到了2005年底基本上就可以测25bp的长度,产生几千万个序列。就短短一年的时间这个技术就取得突飞猛进的发展。
Solexa借Lynx壳上市,后被Illumina收购
Solexa 跟Lynx是2004年底就决定双方的股东和董事的合并。实际上合并的时候Lynx 是一个上市公司,Solexa是一个私有公司,用中国话说叫借壳,Solexa借了Lynx的壳。上市之后,2005年两家公司已经正式合并,更名为Solexa,合并之后要做人员的整合 ,技术的整合,公司运营的整合,其中一个很重要的关键点是技术的整合。到了2007年,Illumina收购了Solexa公司。
一双筷子引发的思考
接下来,我继续说说第二件小事,就是跟卢煜明一起做无创。我们是07年开始讨论怎么做无创检测。当时最关键的是唐氏综合征,卢煜明是全世界大元老,很有经验,摸索了十年。第一次见面我们就觉得这是一个很好的方向,当时没把握其中具体一些细节的东西怎么做,怎么做到最终,尤其是怎么分析是我们的一个主要关注点。经过好几轮的讨论,都没把这个分析给确定下来。在08年1月15号左右 ,确切时间可能不是那么准,卢煜明、我、赵慧君我们三个人在香港的沙田赛马场的一个中餐馆,一边谈一边吃中饭。数据分析里面最大的问题是参照物是什么,有了正常的参照物,异常的才能够检测出来。这个参照物是什么 ,我们一直没能定下来。吃饭的时候我们看着一双筷子,就在想,对一双筷子来说,一支有问题,一支没有问题,这本身不就有参照吗?人类基因组里面有23对染色体,21号染色体是要我们测的染色体,那其他染色体就都是我们的参照物,这叫自身参照,完全可以做得到,这样把这个参照物的问题定下来了。当时还想到既然拿自身可以做参照,那么能不能借用群体作参照。假设我们要做50个正常人,那21号染色体的数量是固定的,占全染色体的比例基本上是固定的。但在检测的时候会出现偏差,如果这个偏差不是太远的话,那么这个是可以作为参照的。把50人进行平均就可以作为参照。我们就在这次吃饭的时候,定下来有可能两套参照物,一套是可以用群体作参照,另一套是同一个人用其他染色体作为参照物。于是我们就取了28个样品,但当时卢教授那边刚好没有测序仪,所以我找了高远教授说明了情况,希望能合作起来,把这个测序一块做起来。高远一听,觉得确实是一个很有意思的项目。最后这28个样品就在高远那个地方做了,用的Illumina较早期的测序仪GA。香港赛马场跟卢煜明的讨论,是里程碑的一次。2008年1月做的讨论,2008年4月前后,高远那边的数据就全出来了,基本上结论就有了,08年10月发了文章。
刚才提到的两套参照现在行业内都在用。后来卢煜明的体系中,我们操作大部分还是用的群体参照,群体参照里面非常关键的是CV要非常非常小,我们确实能把这个做得很好。2010年斯坦福大学的一位教授发表的文章里面,用的是自身的参照。Illumina Verinata Health的整套体系,用的也是自身参照的体系。所以计算过程中有两套参照,各有利和弊,现在都在用。
肿瘤无创检测等待新突破
目前,我比较看好肿瘤的无创检测,经历过08、09年NIPT的那些早期的讨论之后,现在肿瘤无创检测面临的问题和08年面临的唐氏筛查的问题非常相似,技术上也是非常接近。现在肿瘤所谓的早期诊断,实际上就是肿瘤病人已经有了突变,已经有了早期的癌症, 但他没有感觉到,也就是没症状的癌症病人。另一种就是已经知道症状了,例如他突然间咳嗽,呼吸艰难,然后去医院一查,发现有一个阴影,再去做诊断,发现得了癌症。对于前一种没有症状的癌症病人的诊断,有点像我们产科体系的产前诊断。后一种有点像产后,小孩儿已经生出来了,如果携带有疾病就很难治疗了,这一点这跟肿瘤非常的像。现在的检测手段也是有点类似,目前我们所知道的大多数的检测基本上是基于蛋白类的检测。传统的抗原的检测,跟血清筛查作为唐筛的检测非常类似,它的准确度精确度都不高,假阳性假阴性比较高,但成本比较低。我觉得今后这几年会出现的情况,用我们现在比较时髦的话叫精准。精准实际上是这些肿瘤病人在没有症状的阶段,他的突变已经存在,血液里面已经有肿瘤细胞,肿瘤不断生长,释放出肿瘤DNA到血液。现在问题就是能否拿血液中的这些肿瘤DNA,判断出这是肿瘤病人。这种癌症的早期检测要求非常高,不是一年两年就能完成。卢教授在2007年跟我们见面时候已经琢磨唐筛十年了,肿瘤的早诊也是大家的好多年的梦想。
为什么一直没有实现呢?原因很简单,肿瘤DNA进入血液里面的实在太少了,对精确度要非常之高。携带肿瘤突变的DNA释放到血液里面被人体自身的DNA稀释到千分之一万分之一的水平,能不能以一个灵敏度非常高的技术把这个万分之一的突变给检测出来。这是检测遗传疾病跟肿瘤不一样的地方,遗传疾病的突变比较明确,肿瘤的突变要多方位的考察,好多突变要综合起来 ,肿瘤的种类也很多,所以它的复杂度非常高。这牵涉到非常重要的一点是检测灵敏度要非常好,错误率要非常低。如果错误率高的话,噪声太高,肯定灵敏度就不高。Somatic mutation(发生于肿瘤的体细胞突变) 只占了万分之一的情况下,要鉴定这个突变,就必须要有一个富集的手段,靶向富集到极低浓度的突变。
肿瘤的早期检测是行业内追求的一个目标。我回来之前所在的公司LifeTech对NIPT和肿瘤市场做过深度评估,认为肿瘤市场是最重要的市场,但最关键的是能否检测到突变。NIPT是相对稍小一点的市场,所以该公司大部分的精力是投入到肿瘤的检测。Thermo Fisher在肿瘤市场做得挺好的,这跟当时早期的决定是有关系的。也就是说在那个时候(2009-2010年),NIPT的文章出来之后,实际上很多人,包括我自己,都在从测序技术发展的角度去思考,当时提出来一个词叫NICT(Non-invasive cancer testing),也就是我们现在说的肿瘤无创检测。
随着测序技术的灵敏度,精确度越来越高,我个人非常相信能够有所突破。这有点像2008年NIPT快要到被突破的程度,今后几年之内,这个领域里面会形成非常好的发展前景,甚至比NIPT还要好。
值得骄傲的事
我觉得最骄傲的一件事情是真正的把NIPT在中国推动起来。中国是国际上很重要的NIPT发源地和做的最好的地方之一。但是对我来说,不管世界的还是中国的,最觉得骄傲的是我能有幸参与这个过程,让NIPT真正的在社会上解决问题,真正的为一些有可能生出异常小孩的父母提供技术上的帮助。这个是我觉得是有意义的一件事,我一辈子只要能把这件事做好我就觉得很值得。要说遗憾的话,目前,行业的发展速度还没能跟上我个人期望的速度。
未来愿景
我希望今后五年、十年之内,能把重要的疾病,尤其是肿瘤,以及遗传疾病,能够实现早期预测。致残致愚致死的这三类出生缺陷 ,在小孩儿没出生之前,父母能够得到信息;肿瘤的病人在他没表现出症状之前,能够知道自己已经得了肿瘤;这是我们最大的愿景!
周代星:贝瑞和康CEO。1990年毕业于中国科学技术大学,而后留学美国,获得马里兰大学博士学位。曾任Illumina,Life等公司高管,于2010年回国创建北京贝瑞和康生物技术有限公司。
医谷链
《田埂:我与NGS这十年,前五年拼命学技术,后五年推广应用》
来源:测序中国