1月19日《Nature Genetics》刊登了美国密歇根大学综合癌症中心的研究人员完成的一项超大规模转录组测序数据分析结果。他们汇集了7256个RNA测序样本,总数据量超过43Tb。通过对这些大数据的计算分析,一共发现了9万多条人类基因,相当于目前人类编码基因总数的3倍。其中被称为基因组“暗物质”的非编码基因数目更是占了绝大多数,长非编码RNA基因(lncRNA)的数目近6万条,是目前报道最多的人类长非编码RNA基因数目。比目前国际上最著名的非编码RNA数据库之一,NONCODE数据库中存储的lncRNA数目要多几千条。
此外,该研究也表明,lncRNA在癌症中具有重要的作用,可为改善癌症诊断、预后或治疗,带来新的、潜在的靶标。
该研究的结果已放到名为MiTranscriptome compendium的数据库中,免费供科学界使用。(数据库地址:www.mitranscriptome.org)
参考文章:
The landscape of long noncoding RNAs in the human transcriptome.Iyer MK,et al. Nat Genet. 2015 Jan 19.
http://www.nature.com/ng/journal/vaop/ncurrent/full/ng.3192.html
来源:测序中国