麻省总院的Daniel MacArthur认为人类外显子最大数据库——外显子集成联合(ExAC,Exome Aggregation Consortium database)在鉴定引起个人疾病的遗传因素方面有更好的准确度,为患者提供了更明确和直接的益处。
他是8月17日发表在Nature上一篇文章的资深作者,该文章的研究作者们编制了该数据库,利用来自20多个疾病研究的DNA数据进行分析。ExAC在2014年在网上公布,被查询了超过500万次。在这篇Nature封面故事发表的同一天,New England Journal of Medicine和Nature Genetics都各有一篇研究文章发表,都运用这个数据库纠正了之前对DNA变异和疾病的观点。
人类DNA的巨大目录可以帮助研究者发现引起疾病的微小差错,有一些是指出错误的线索。ExAC这个超过6万人基因编码的数据库,旨在于研究由单个故障基因导致的罕见疾病。大多数这类疾病是如此罕见,以至于一般公众从来没有听说过它们。但也有成千上万的人得病,作为一个群体,他们占出生率的百分之一。
为什么样本量对罕见病关联基因非常重要
对于罕见病,医生试图通过分析病人的DNA来寻找遗传原因。但每个人都携带和标准DNA不同的成千上万的变异,目标是找出其中那使人生病的一个或两个变异。
研究人员通常是通过关联推断来做到这一点。如果在病人中出现的差异是从未见过的或者在其它状况极度罕见,它可能被认为是疾病的原因。
挑战是要从公众获得足够的DNA。如果采样量太小或者对于不同的人群不够全面,一个突变可能会被错误地归咎于引起病人问题的原因。一个更好的抽样可能会显示这个差异其实也经常出现在健康人群中。错误的线索可能会损害病人的护理,或者错过治疗。
New England Journal of Medicine报道的遗传误诊
这种“遗传性误诊”的一个例子在同一天在New England Journal of Medicine上与Nature一项不相关的研究中被提出。它侧重于一种遗传性疾病称为肥厚型心肌病。心脏肌肉变厚会影响泵血。
在一个实验室检测了三年的记录中,发现有七名患者被告知他们携带了两种与心脏病有联系的DNA变异。两变种后来被重新分类为良性。其中有5名是非洲裔,如果这些变种的原始研究已经包含了足够美国黑人的样本,他们可能不会得出错误的结论。
科学家介绍新的数据库ExAC,可以避免这样的错误。它提供了一个比过去更全面的DNA变化的集合。来自欧洲,非洲,南亚,东亚和拉丁美洲血统的人大约1000万个微小的变化已被列出。
Nature Genetics对拷贝数差异的纠正
在同一天发布在Nature Genetics另一项研究中,在ExAC近6万人的外显子数据中分析了罕见拷贝数差异(CNV)的比例和特性。研究发现就平均而言,个人带有0.81个删除的1.75个重复的基因,大多数人(70%)携带至少一种罕见的基因CNV。
对于每个基因,研究人员凭经验估计了对CNV的相对容忍度,证实了基于单核苷酸变异(SNV)基因限制的检测是和保持进化的分析独立相关的。研究文章指出对于精神分裂症患者,受CNVs影响的基因比对照组更宽容。
ExAC 的CNV数据在人类基因差异谱系中是一个重要的组成部分,有助于个人基因组的揭示和人群疾病的研究。
Nature用ExAC所指出过去的错误
在Nature文章中的分析对于运用ExAC如何指出过去的错误提供了另一个例子。研究人员分析了192个之前认为和疾病相关的DNA差异,但在ExAC中显示实际在一般人群中也是非常普遍的。
研究人员发现在新的标准下,至少163例该被重新归类为良性或者可能是良性。在去年11月,研究者报道了126种这样的差异被重新分类。
但是科学家们指出比ExAC更大的数据库也需要精准地将遗传变异联系到疾病或者排除,还有很长的路要走。
来源:生物探索