25年前,也就是四分之一个世纪前的1990年9月底,人类基因组计划(HGP)正式启动——作为一种以科学联盟为基础的大科学模式的运作,影响巨大、收获颇丰。作为HGP领军人物的埃里克·D·格林(Eric D.Green)、詹姆斯·D·沃森(James D.Watson)和弗朗西斯·S·柯林斯(Francis S.Collins)先后担任了HGP核心机构的美国国立人类基因组研究所所长,值此HGP 25周年之际,他们对HGP的成功与影响总结了六条经验,值得科学界人士深思和借鉴。
25年前,美国新组建了美国国立人类基因组研究中心(现名国立人类基因组研究所,NHGRI),在这家研究所中,我们三人先后担任其所长,以该所为支柱力量,与来自美国和国际上的合作伙伴们共同努力,开启了人类基因组计划(HGP)的新纪元。接下来发生的事情代表了最具人类历史重大意义的科学事业之一:以2003年HGP宣布完成为标志,科学家们用13年时间(1990年至2003年)的探索,完成了对人类基因组的三十亿碱基对的测序。
HGP已经并将继续给我们认识人类疾病带来新的战略眼光,即使是到了近年,围绕HGP的讨论仍然是这样的一种格局。到目前为止,我们不仅见证了HGP对生物医学研究的巨大推动,也切切实实地感叹HGP积极探索和创新了新的做科学(doing science)的模式。
作为生物学界的第一个大科学计划,HGP为诸多基于联盟的科学研究开拓了新的发展路子。仅仅NHGRI就从2000年以来参与和启动了超过25个类似的科学计划。这些发展对生物医学研究提出了新的挑战,例如,要求来自不同国家和学科的各种团队团结在一起分析和分享巨大的数据集。
对于年轻的科研人员来说,他们今天正在试图解决的许多问题之新颖和繁多,这对于四分之一世纪前的前辈们来说是根本不可想象的。显而易见的是,HGP仍然有可能与大科学计划(如美国精准医学计划)产生互动,这种互动是大有必要的。事实上,我们认为今天基于联盟的科学计划的成功,蕴含着六个方面的重大指导思想。
六条值得认真考虑的经验
1.拥抱合作
不可避免的是,HGP打破了常规的工作方式,不再是个人劳心劳力地对小批量科学问题零敲碎打地分离和回答,这种基因狩猎(gene hunting)的美好称谓给基因组科学家带来美好的回忆。尤其令人神往的是上世纪90年代以来的HGP结构基因组学、功能基因组学和后基因组计划,它的运作模式与假说驱动式的研究方式格格不入,取而代之的是集中精力发现根本性的信息,并以之来唤醒许多后续的研究工作。
早在启动之初的1990年,HGP就汇聚了超过来自许多国家的2 000名科学家,其中有些小组还吸引了不同投资渠道的资助。HGP这项大科学计划无疑是成功的,它的成功来自于:资助者参与的强有力领导;对研究任务的崇高意义的共享;研究人员们为了集体的利好而心甘情愿地放弃个人的成就、服务于一揽子利好。
随着HGP的发展,许多项基于联盟的基因组学计划应运而生。其中最着名的是对人类基因组内序列变异本进行分类的千人基因组计划;对引起癌症的突变进行分析的癌症基因组图谱计划;运用基因组测序在内的新技术来研究微生物群落的人体微生物组计划。
在基于联盟的科学中频繁出现的障碍是参与者们不情愿接纳新的合作者。但是各种科学行动正在破除这些旧的科学规范,尤其是人们日益认识到对数据和资源进行整合可以给每个参与者们带来巨大的利益。
到目前为止,非洲遗传学和基因组学研究人员们通常来说更喜欢与欧美科学家们合作,不太倾向于与其他非洲研究人员们进行合作。然而,目标为改善非洲基因组学研究的非洲人类遗传性和健康计划(Human Heredity and Health in Africa,H3Africa),已经大大地促进和培育了非洲内部的生物学合作。美国国立卫生研究院(NIH)和英国威康信托基金会分别于2012和2013年建立的29项合作研究基金,涉及到24个非洲国家的参加,此后,这方面的数字还在增加。H3ABioNet是一个生物信息学网络,旨在促进非洲科学家们在分析数据中共享专家人才、基础设施和工具,现在已经包容了15个国家的32个研究团队的参与。
2.最大化数据共享
HGP改变了生物医学研究中的数据共享规范。一旦HGP开始产生巨量基因组作图和序列数据,就会有巨大的推动力催生政策来缩短数据产生与发布之间的时间差。这方面努力的结果是1996年制定了“百慕大原则”(Bermuda Principles),即要求所有测序数据必须在产出的24小时之内递交到公共数据库里,使珍贵的数据得到实际和及时的共享。
这些规则在其后的多年间得到了有力的执行。2003年,百慕大原则扩展成劳德代尔堡协议;2008年,NIH将其数据共享预期扩展到了包括全基因组关联研究,目标是分析成百上千人体内的共同基因组学变异本,旨在揭示一些科学家们感兴趣的变异体。2014年,在HGP领域开始实施一项扩展版的“基因组学数据共享政策”,要求几乎所有使用NIH资助产生或分析的大规模基因组学数据都要共享。
然而,数据的广泛传播和共享也带来了一些新的挑战。这些挑战包括分析和移动巨量数据集所带来的计算和物流方面的困难;至于人体数据(尤其是基因组学和临床数据),还产生了如何保护参与者的隐私问题。为此,各项科学计划正在寻求这些问题的解决之道。例如,对计算平台的需求导致了在生物医学研究中使用云计算的快速发展,以及用“数据共有体”来容纳发表的和未发表的数据。2013年建立的一项“用于基因组学和健康的全球联盟”计划,正在积极筹备一个“负责任地共享基因组学和健康相关数据”国际框架,这将带来人们对HGP相关的法律、伦理学和技术问题的考虑。
3.数据分析计划
HGP是有其缺陷的,这是可以理解的。回顾HGP的发展,这一计划早期没有得到充分注意的领域是数据分析:第一幅人类基因组序列是以一种零碎的方式产生的。为了得到每个染色体的连接序列,科学家们不得不设计计算工具将成千上万的测序序列进行组装(每个长约100-300千碱基)。在整个HGP中,对这样一种计算过程的需求(后来成为了一种技术上的挑战)明显地相对晚迟一些。通过一个小型生物信息学家小组可谓神勇的杰出工作,这个任务大约可以在数个月内完成。事实说明,对于数据分析更早地规划会使得生物信息学工作更为轻松一些。
近年来,几项基因组学计划(如千人基因组计划和癌症基因组图谱)的工作已经证明,对于数据分析规划进行早期设计是可以为数据生成带来战略性的思考与完善。最近,美国精准医学计划的规划工作重点,包括了如何最好地融合和分析预期的巨量数据类型,从电子健康记录和基因组学分析数据,到来自环境监测仪和可穿戴式身体传感器的信息。
4.优先发展技术
1990年10月,HGP的参与者向媒体宣布,HGP认识到:对人类基因组进行作图和测序将需要在更大项目的基础上建立相应的工具和方法。事实上,该科学计划催生了大量至关重要的基因组学技术,导致了分子生物学、化学、物理、机器人学和计算等各个相关领域的伟大创新,建立了以创新方式使用这些工具和方法的战略。在一些情况下,众多方面的渐进式改进如同鹅卵石般铺垫一样产生了革命性进展,比如,基于毛细管技术的DNA测序仪最后被用于制作第一幅人类基因组序列图谱。
从一开始就培育技术创新,这一点对于今天的大科学计划同样重要。这方面的一个范例是“使用先进神经技术的美国人脑研究计划”(BRAIN)。这项科学计划的总目标是使我们对人类大脑的认识带来革命,即首先集中研发新一代的研究工具来对大脑所有细胞类型进行分类,建立起它们之间的连接图谱,记录来自各种回路的信号,进而从整体上建立功能与行为的相关性。
5.关注社会影响
HGP的创始人意识到,从人类基因组作图和测序中得到的信息可以对社会产生意义深远的影响。因此,HGP作为第一个大规模的研究计划,其中的一个组成部分就是对社会影响问题的审视,比如,如何保护个人隐私和预防歧视等。在NIH对HGP的预算中,有5%用于ELSI(伦理学、法律和社会影响)研究,这是至今对生物伦理学研究领域的最大投资。
今天,许多前沿科学的探索项目都会将不同的社会影响和伦理学纳入考虑范畴。在备受关注的范例中,有改变人类和其他物种基因组的CRISPR/Cas9基因编辑工具,还有在传染病爆发期间快速研究潜在治疗方法的快速跟踪临床试验设计。不幸的是,大多数基于联盟的科学计划并没有像HGP那样有一个专门的生物伦理学研究项目。我们认为,在启动新的大科学计划时,这样的(生物伦理学)项目是不可或缺的。
6.要有冒险精神
可以说,HGP的各项目标是雄心勃勃、充满胆识和魄力的。但对于人类基因组究竟应该如何精确作图直至最终测序,科学家们还缺乏清楚的认识,包括存有悲观和怀疑的情绪,而一些功能基因组学等后基因组计划的工作则对此起到了强心针的效果。
我们认为,HGP成功的关键是领袖科学家坚持不懈的开放胸襟与战略共享,以及对研究工作的“盘点库存”。正因为如此,HGP的五年计划分别于1993年和1998年进行了修订,包括HGP的各个组成部分也定期修订。
总体目标明确,这是推进大科学计划前行及成功的关键一步,同时要结合度量学对其质量指标进行评估,并适时对整个规划情况进行调整。这种出发点和指导思想,已然成为了后续大科学计划的规范,包括美国的大脑计划和精准医学计划。
盘点HGP 25年来的科学成果,可谓是硕果累累。如今,研究生们有可能参与促进对数以千计的疾病的分子机制的揭示:见证癌症诊断和治疗的革命,见证微生物组学的成熟,见证干细胞治疗的常规使用,以及其他引人入胜的生物医学进展。
人类基因组计划的故事给我们提供了一份有价值的提示,不论是内容还是方式,这些进展都将会引发科学研究的基础性革命。这对于从事生物医学研究的人士来说,这是他们期盼的,而对于一般公众而言,接受这些科学革命也同样重要,哪怕只是点个赞!
来源:科学网 作者:埃里克·D·格林,NHGRI所长;詹姆斯·D·沃森,冷泉港实验室荣誉退休主任,曾任美国国立人类基因组研究中心主任;弗朗西斯·S·柯林斯,美国国立卫生研究院院长,原NHGRI所长 编译:李升伟