St. Jude儿童研究医院的科学家开发了一款新软件。该软件可以通过全基因组测序有效发现肿瘤基因拷贝数变异。相关文章发表在5月4日的Nature Methods杂志上。
2010年,St. Jude儿童研究医院和华盛顿大学合作研究的儿科癌症基因组计划。该计划使用高通量全基因组测序技术对大部分的侵袭性肿瘤和儿童罕见肿瘤进行了研究。计划实施早期,研究者发现现有的分析方法会丢失很多DNA片段的重复或缺失信息,并且对于少部分能够提供癌症起源信息的基因的微小变异也可能会遗失。
为解决上述问题,St. Jude儿童研究医院的研究者开发了这款名为CONSERTING(Copy Number Segmentation by Regression Tree in Next Generation Sequencing)的软件,以期提高从高通量全基因组测序数据中发现DNA拷贝数的变异能力。全基因组测序数据中包含着染色体重排的信息,通过CONSERTING可以发现拷贝数变异及鉴定在基因组的起源。
研究者使用了来自43个儿童和成人的脑瘤、白血病、黑色素瘤及儿童视网膜母细胞瘤的正常和肿瘤组织的全基因组测序数据,用CONSERTING与已发表的4种鉴定拷贝数变异的软件进行分析、比较,发现CONSERTING具有更高的准确性和敏感性,对拷贝数变异的检测精准度在儿童和成人中分别提高了100倍和10倍。
CONSERTING将一个称为回归树的机器学习数据分析算法与高通量基因组测序相结合。机器学习利用计算技术快速重复的分析优势,对大样本复杂数据进行深度挖掘。该文章的通讯作者,St. Jude研究所计算生物学家Jinghui Zhang博士说:“这一结合为我们提供了强大的检测拷贝数变异的工具,甚至在相对较少的细胞或包含正常细胞的肿瘤样本中都能够进行检测。CONSERTING能够帮助我们更好地利用高通量全基因组测序来发现癌症基因组的遗传改变并为癌症的治疗奠定了基础。该软件还能使我们更好地对肿瘤演变进行追踪,包括复杂的基因重排,如多个染色体间的断裂后重组。”
该文章的第一作者,St. Jude研究所资深研究员Xiang Chen博士补充说:“CONSERTING能够帮助我们发现其他软件不能发现的变异,包括在少部分肿瘤细胞中出现的染色体重排和拷贝数变异。”
研究者通过使用CONSERTING,发现导致儿童白血病,儿童低分化神经胶质瘤及成人恶性神经胶质瘤,视网膜母细胞瘤的致病变异。该软件也可以帮助发现出现在少部分肿瘤细胞中的基因变异,而这些突变也许是一些肿瘤治疗后复发的关键。
CONSERTING软件、使用手册和相关数据可通过www.stjuderesearch.org/site/lab/zhang免费下载获取。St. Jude研究所的研究人员还开发了CONSERTING的云服务,科研人员可以通过上传数据进行分析。
来源:测序中国