尽管基于NGS的临床检测越来越多,但目前定量评估一个检测性能的标准和方法却非常有限。扩增、建库以及测序过程中引入的偏差都会影响检测的灵敏性,相同的检测在不同的实验室中运行也会出现极大的变化。
为了评估检测的性能和可靠性,来自澳大利亚悉尼加文医学研究所(Garvan Institute of Medical Research)的研究人员开发出了一种技术,利用合成DNA跟踪标定(spike-in)来量化检测特定变异的能力。这项研究发表在《Nature Methods》上,研究人员描述了这种名为sequins的方法。
利用sequin标准代表基因变异(来源:doi:10.1038/nmeth.3957)
发表在《Nature Methods》上的另一项研究中,研究小组描述了一种基于RNA的sequins。
RNA sequins设计和使用的示意图(来源:doi:10.1038/nmeth.3958)
这两项研究的通讯作者、加文研究所转录组研究实验室主管Tim Mercer介绍,他的实验室一直致力于新基因的发现和lncRNA研究,希望在试验中有一个对照,帮助他们了解是否真的发现了新基因。
这项技术的关键在于,研究人员设计了反向的合成序列——从3‘到5’方向,这种合成序列不会对目标序列的测序产生干扰。另外,研究小组还设计了一种用于spike-in reads比对的合成参考序列。
sequins可以被设计来代表不同的变异。例如,在一项试验中,研究人员利用一个癌症基因panel,想找到具体可操作的靶点,这种情况下可以设计合成spike-in代表这些变异,把spike-in作为对照。如果测序检测到了合成的变异,那么在真实样本中应该也能检测到同样的变异,这就为变异的检测增加了可靠性,且可排除某种变异的存在。
由于是镜像,sequin reads不会干扰天然的分子。因此,sequin reads只会比对到合成基因组上,而真实的reads则只会比对到参考序列上。
美国国家标准与技术研究院(NIST)的Marc Salit教授曾带领NIST的Genome in a Bottle(GIAB)联盟,进行NGS参考样品的设计。他说,这项前沿工作将会推动更多工具的研发,为NGS检测临床应用的可靠性和有效性提供证据。
Salit说,sequin方法可以作为GIAB联盟工作的补充。GIAB联盟正在开发参考基因组,通过分析与参考标准的匹配度,帮助研究人员验证其NGS方法的有效性。但这些参考样品都来自健康基因组。sequin方法的不同之处在于,spike-in可以被设计来代表疾病相关的变异。另外,GIAB参考样品只能帮助实验室验证整个方法的有效性,不能作为每次检测运行时的内参。
Mercer说,发表在《Nature Methods》上的这两篇文章建立了sequin方法的基本概念,下一步就是应用这种方法,解决基因组中用短读长测序技术难以分析的复杂区域。作者在文章中指出,目前即使是应用设计的sequin来处理这些复杂的区域也是非常有挑战性的。
Salit也表示,这个方法的缺点是,基因组中难以测序的区域同样也难以合成。目前研究人员正在努力解决这个问题。Salit和GIAB联盟想与Mercer的团队合作,研究如何在GIAB中使用这些参考样品。
Mercer说,除了继续研发sequin技术,他计划免费向学术界提供该方法。sequin可以应用到很多方面,包括基于肿瘤的检测、宏基因组学研究,甚至免疫研究,用来验证特定的免疫受体。如果有公司对它感兴趣,或可获得许可协议。
参考文献1. Representing genetic variation with synthetic DNA standards. Nature Methods (2016) doi:10.1038/nmeth.3957
2. Spliced synthetic genes as internal controls in RNA sequencing experiments. Nature Methods (2016) doi:10.1038/nmeth.3958
来源:测序中国(微信号:seq114) 作者:iseqer