斯坦福大学研究人员正在设计(新的)方法,让计算机帮助执行一些目前科学家在研究患者基因组从而诊断疾病时需要手动完成的密集遗传分析。
1997年,当Shayla Haddock出生时,她的父母立即意识到有些不对劲。作为家里的第六个孩子(共七个孩子),Shayla的面部特征与众不同,足部畸形,而且四肢短于正常状态,体形小于大多数新生儿。听力测试表明她还存在耳聋问题。
医生2012年分析了Shayla Haddock的基因组,寻找导致其足部畸形、耳聋和四肢短于正常状态的原因。虽然初步分析没有提供诊断,但2015年的一次重新分析揭示了答案:Shayla罹患的是有一种被称为Wiedemann-Steiner综合征的罕见遗传病。这次重新分析使用了斯坦福大学新近开发的计算工具。
Shayla的父母,Cheryl和Levko Siloti,寻找了这些异常的答案,他们忧虑的是:在Cheryl怀孕期间,是否发生了一些本可以预防的问题而导致Shayla的症状?能够确诊并改进Shayla的治疗方案吗?如果Shayla的兄弟姐妹们将来成家立业,他们的孩子会面临相同的疾病风险吗?
“这是一种情感过山车”Cheryl Siloti说。多年来,就Shayla的状况,医生们提出了许多可能的诊断,但医学检查反复否定了他们的理论。“医生告知我们这些可能性,随后他们又否定了这些可能‘不,这个不是答案’”。
这个位于加州斯托克顿市的家庭所面临的问题说明了诊断罕见遗传病的挑战,也是阐释斯坦福大学医学院(Stanford University School of Medicine)科学家们为什么设计新方法以及如何提供帮助的一个范例。
医生们和Shayla的父母一样渴望做出诊断,但他们几乎得不出任何确切的结果。2012年8月10日——就在斯坦福西尔·帕卡德儿童医院(Lucile Packard Children's Hospital Stanford)的医生得出“无法将Shayla的遗传模式和症状与(任何)一种疾病相匹配”的结论两周后——一篇科学报告揭示了基因缺陷和一种罕见疾病之间联系的新发现,这篇文章允许医生们对Shayla做出诊断。但在那个时候,无法定期进行基因测试结果的重新分析,以考虑到新的知识。Shayla的家人和医生们仍然不知道他们已经可以获得答案。
——遗传再分析
去年,作为一项科学研究的一部分,Shayla的父母同意对她的基因组进行重新分析。这一次,斯坦福大学的计算机科学家使用他们开发的新型计算工具将Shayla的基因序列与科学文献进行比较。他们发现了2012年的(那篇)科学报告并预测Shayla罹患的是一种被称为Wiedemann-Steiner综合征(Wiedemann-Steiner syndrome)的罕见遗传病,预测得到了Shayla医生的证实。
“每过一个月,都会有更多的全球遗传多样性反映在科学数据库中,每次都会有更多信息,更容易解释接下来看到的(问题)”Shayla在帕卡德儿童医院的临床遗传学家Jon Bernstein博士说道。Jon Bernstein博士是7月21日在线发表于《医学遗传学》(Genetics in Medicine)的新报告的作者。研究中10%的患者——包括Shayla在内的4人,在首次遗传分析(平均于20个月之前进行)后没有获得诊断——基于最近的发现而被诊断为不同的罕见疾病。
这些“近在咫尺的遗漏”凸显了精准健康领域中的一个巨大挑战:虽然获得个人基因序列的速度、成本和工作量近年来急剧下降,但训练有素的专家依然需要工作大约20到40个小时来将患者的罕见突变与可能揭示诊断结果的科学文献信息相匹配。在疑似罹患罕见遗传病的患者中,75%无法在首次DNA分析后获得诊断。不过,知识库正在快速增长,研究人员每年都会发现大约250种遗传病的原因,同时找到9200个特定基因病因与已知疾病之间的关联。
——太多需要手动诊断
“我们的研究表明,由于存在稳定的发现率,因此对患者基因测试结果进行重新分析是有用的”Bernstein说道。Bernstein同时是斯坦福大学医学院的儿科学副教授。
“但是我们没有足够的人力资源,无法像临床医生和科学家们过去所做的那样来继续所有的手动分析”该研究资深作者,发育生物学、计算机科学和儿科学副教授Gill Bejerano博士说道。
Bejerano领导的计算机科学家们设计了新研究中使用的自动化方法。数百万美国人可能罹患某种形式的罕见遗传病,他指出——对于手动诊断而言太多了。“我们团队认为,相对于在每位患者的分析中继续投入数十个小时,更有意义的是将时间用于构建能够帮助我们完成大量工作的计算机科学工具”他说道。
在新的研究中,这些科学家测试了将未确诊患者基因组与现有基因数据库进行自动对比(的方法)能否加速诊断。结果表明这种方法有效。
“基因组根本上是一种程序语言”Bejerano说,“我们确实想使用机器学习和其他方法来构建计算机系统,将尽可能少的工作留给人类专家。在这些工作中,电脑不如人类,但我们认为我们能够通过计算机处理这种方法中80%到90%的工作,并在循环过程中为人类节省大量的时间。”
——对比患者和父母的基因
Bernstein和Bejerano表示,新研究的另一项关键发现是:将患者的基因序列和父母的基因序列进行对比,能够极大地加快诊断过程。这种对比有助于发现父母不携带而在患者中发生的新致病突变。“如果(患者)父母的数据摆在你的面前,这些(发现)就会更容易地显现。”Bernstein说道。
在Shayla的病例中,她的诊断为家人带来了他们一直寻求的答案。她的致病性突变不是从父母那里遗传的,而是自然发生的。这不是可预防的问题,也不会影响她兄弟姐妹们的孩子。“知道这些,真的让我们长长地舒了一口气”Siloti说道。
诊断也帮助Silotis找到了其他拥有同样患儿的家庭。他们在Facebook群组分享故事,而且感觉他们已经发现了支持和群体的新意义。“我们一直相信知识就是力量”Siloti说,“得到答案的感觉真好,特别是在经历长时间的寻找之后。”
这项新的研究由斯坦福大学儿科学系、斯坦福发现基金、国防高级研究计划局和国家卫生研究院(U01MH105949)资助。共同领导作者是研究科学家Aaron Wenger博士和 Harendra Guturu博士。
为什么难以诊断罕见遗传病,下面的数据能够带来启示:
1. 人类基因组的大小:30亿个碱基。碱基是构成我们基因和控制基因的基因组区域的“单词”中的单个“字母”;
2. 罹患某种形式罕见遗传病的美国人的数量估计为:2500万;
3. 每年新识别出原因的单基因疾病数量:250;
4. 每年新识别的与现有疾病相关联的基因改变的数量:9200;
5. 在怀疑罕见遗传病时,分析个人基因信息所需的时间:20到40小时;
6. 疑似罕见单基因疾病患者中首次基因测序就能获得诊断的比例:25%;
7. 为了帮助未确诊患者匹配新发现而进行重新分析的典型频率:一直很少,但得益于新的自动化基因分析技术,有望变得更为常见。
原文检索
《Automating genetic analysis helps keep up with rapid discovery of new diseases》
来源:中国罕见病网 作者:翻译:渐冻人尘雾