“炎黄一号” 测序数据质量世界第一

医疗器械 来源:果壳网
2015
05/29
17:00
果壳网 医疗器械


2015年5月25日,《自然-生物技术》发表了来自华大基因的“炎黄一号”单倍型组装结果。

2008年,“炎黄一号”一诞生即成为“亚洲第一”——第一个蒙古人种的全基因组测序结果。经过科学家的不懈打磨,到《自然-生物技术》这篇最新论文发表的那一刻,从测序数据质量上来说,“炎黄一号”终于成了“世界第一”!

作为和这项研究有些渊源的基因组学工作者,笔者将尽我所能,解读“炎黄一号”基因组的系列科研和技术进展。以期让大家理解,个人全基因组测序现在究竟进展到了什么地步?这项工作的意义和价值又在哪里?

基因组数据:能用,但还不够好

在这个“千元基因组时代”,个人基因组测序似乎已成了大众消费品。那么,为什么世界顶级的基因组研究机构和测序仪生产商,还在不断的测序更多的个人基因组,还要将个人基因组研究做到目前技术条件下“极致精美”的程度呢?

简单的答案就是,因为目前的基因组数据还不够好,因而也不够好用。

我们研究人类基因组最关心的问题,就是将染色体上所有的基因序列都测序出来,并且定位清楚,简单的说,目标就是将人类基因组从第一个碱基开始,一直到最后一个碱基结束,真正完整的呈现出来。

在基因组研究领域,人们对数据的可信度有一个基本的要求:单个碱基越准确越好,对单个碱基的覆盖深度越多倍越好,对整个基因组测得越完整越好,测序的“缺口”越少越好。

以这些标准看,目前的基因组测序结果,还没有一个是完美的。

人类基因组计划:曾经的“最好”

自从“人类基因组计划”和科学狂人克雷格· 文特尔(Craig Venter)先后公布人类基因组图谱以来,基因组研究进入了全新的纪元。然而,这份图谱只是张“不够完美的参考图”,科学家们很快认识到,我们需要更多人的基因组, 才能真正将遗传与基因组信息应用到健康和临床领域。

但是因为测序基因组太过昂贵,科学家们选择了折衷的思路,那就是后来启动的国际人类基因组单体型图计划( HapMap Project),旨在了解人类遗传的单倍型和单点突变。虽然取得了一定的进展,但是根本问题仍然存在——测序的人类基因组数据太少,质量还不够好。

再后来,454公司测序了诺奖得主詹姆斯·沃森(James Watson)的基因组,并将其公布,但是沃森的基因组从测序质量上来讲,跟“人类基因组计划”公布的还不在一个水平上,所以,大部分科研工作者,还是在使用人类基因组计划所公布的基因组数据作为参考序列。

在2004年公布的“人类基因组计划”的数据中,对单个碱基的覆盖深度是6~10倍的覆盖深度,当时计算的人类基因组总长度约为2.8 G,有341个“缺口”(Gap), N50(可信的组装测序序列)的长度为38.5 Mb,这个长度是人类基因典型长度的1,000倍,应该说,在当时的测序条件下,这样的数据已经是非常好的结果了。早两年文特尔公布的基因组覆盖度为5.1倍,基因组的总长度是2.91G,从2001年发表的那个版本看,“缺口”的数量有数千个,所以从测序数据质量上来讲,较人类基因组计划还是有一定差距,且当时人类基因组计划用的是“逐个克隆法(Clone by Clone)”的定位方法测序,这种方法前期需要大量的工作进行克隆的定位,因此很费时间,而后的测序和分析则相对容易。而文特尔采用“全基因组鸟枪法”测序,这种方法不需要大量的克隆定位,但对用来组装的计算机硬件软件要求很高,且容易出错,好处在于节省了时间,提高了效率。

文特尔(左)和负责“人类基因组计划”的科林斯(右),并肩开启基因组时代的双雄人物 图片来源:time.com单就数据质量来说,人类基因组计划所得到的基因组图谱还是更加准确可靠。

但从上面的描述,我们可以看出几个问题,因为采取的基因组测序策略不同,公布的两个基因组,长度不一,“缺口”的数量不一,测序的质量也不一,从精益求精的角度看,二者都不够完美。

人类基因组:缺点在哪里?

首先,人类基因组还不够精确。人是“二倍体”,也就是有一半遗传物质来自父亲,一半遗传物质来自母亲,且在受精卵形成过程中,还会发生基因重组,这是人类遗传多样性的来源之一。科学家们需要更精确的“单倍型”数据,这样基因组才够“完美”,而这种“完美”正是研究者们追求的目标。

其次,人类基因组还不够“多元”。按照传统的人种分类,人类按照肤色黑白黄棕,被粗分为四大类:尼格罗人种、高加索人种、蒙古人种、澳大利亚人种。基因组测序数据是从高加索人种开始的,“人类基因组计划”是人类的标准参考基因组,也是高加索人种的标准参考基因组。文特尔的基因组,测序对象是他自己,同样是高加索人种。

然而,从基因组研究的角度,为了尽可能地包括各种遗传背景,需要为更多族裔建立自己的参考基因组。

第一个蒙古人种基因组,正是由华大基因团队测序完成。2008年他们在《自然》杂志发表了《一个亚洲人的二倍体基因组测序(The diploid genome sequence of an Asian individual)》, 这就是我们俗称的“炎黄一号”。同时发表的还包括来自尼格罗人种的全基因组测序数据。至此,三种肤色人种的基因组数据总算凑齐了。

2008年的华大论文中,蒙古人种基因组的覆盖深度是36倍,看似比人类基因组计划的10倍覆盖度要高出很多,事实上,蒙古人种基因组测序采用的是短序列二代测序技术,而人类基因组计划和文特尔的基因组采用的是一代测序的长序列测序。虽然炎黄一号也进行了组装,但是非常难以达到人类基因组计划的水平,而且当时二代测序技术准确度难以跟一代测序技术相媲美,所以测序质量也比较低。需要更高的覆盖深度来弥补。

这些技术细节可以简单理解成,虽然蒙古人种基因组的覆盖深度高,但是由于序列的定位可能出现问题,且质量不够高,所以,达到的效果跟10倍覆盖深度的人类基因组计划那个标准图谱在单碱基的准确度上相差不大,从结构变异和单倍型角度看,可能还有一些差距。当然,从技术角度,两套基因组测序都“不够完美”,所以不好下定论,得具体数据具体比较。

炎黄一号:九年磨砺,成就“最好”

自“炎黄一号”的第一阶段结果发表以来,华大基因的科技工作者就开始不断完善“蒙古人种”的基因组图谱。

首先是2009年,华大基因与合作单位的一群年轻研究者在《自然-生物技术》发表了研究论文《构建人类泛基因组序列图谱(Building the sequence map of the human pan-genome)》。利用组装的方法构建出炎黄一号独有的大约5M的基因序列,并且验证了其存在并预测了其功能,而且将炎黄一号的基因组组装提升到新的水平。

2011年,华大基因在《自然-生物技术》上又发表了一篇新论文,“Structural variation in two human genomes mapped at single-nucleotide resolution by whole genome de novo assembly”将炎黄一号的新组装结果与另外一个尼格罗人种的组装结果进行比对,在原有基础上,发现了277,243个新的基因组“结构变异”,同时还发布了为此开发的新的组装流程。

我们可以这么理解这项研究,2008年版本无法发现的基因组结构变异,可以通过2011年的新方法找到,特别是小范围的(≤50 碱基对)和中等范围的(51~200 碱基对)结构变异。因为炎黄一号测的是短序列,所以确实比较难发现大的结构变异(>200 碱基对),这一问题一直困扰着通过短序列高通量测序进行基因组研究的研究者。

2015年5月,华大基因在《自然-生物技术》上发表了“De novo assembly of a haplotype-resolved human genome”通过全基因组鸟枪测序法(WGS)结合全新策略(Fosmid-pooling)的分级组装方法,以及之前的二代测序短序列组装出人类单倍体水平的二倍体基因组。组装出了5.15Gb的二倍体基因组,单倍型的可信N50 为484 kb,还发现了7.49 Mb的独有序列。至此,历时9年的“炎黄一号”基因组已经趋于“完美”,这已是领先于目前已知的所有的人类基因组测序结果的最为完整的基因组图谱。

从2006年“炎黄一号”项目正式启动,到2015年5月25日《自然-生物技术》的最新论文发表。可以说,此时此刻,亚洲人在这一领域,真正领先于世界!

完美的基因组参考序列,意义何在?。

早在十年前,詹姆斯·沃森就敢于发出宣告,“未来所有生物学只有以基因组开始才有希望发展! ”

当初的预言,正在一步步变为现实。

一个真正“完美的”基因组,意义相当深远。

首先,它对遗传学研究至关重要。通过炎黄一号组装的单倍型图,我们可以更为清晰地了解不同基因型之间的连锁关系、遗传特征,进而深入研究基因组重组的机制,基因组的各种修饰与不同单倍型的关系,基因组单倍型结构与基因表达、调控、修饰的关系等等。

热门的表观遗传学也离不开基因组信息。2010年,华大的研究者在《Plos Biology》上发表过“炎黄一号”志愿者的外周血单核细胞DNA甲基化图谱,该图谱的分析是基于之前组装的版本,相信在新的组装版本的推动下,类似研究将更加深入准确。随着下一步研究延伸至志愿者的各种组织(如肌肉、皮肤等),我们将对DNA甲基化的机制和组织特异性的甲基化基因表达有更加深刻的理解。

而对于目前火热的“精准医疗”和“个体化医学”而言,准确的基因组参考序列,将帮助真正“精准”的基因组数据分析。值得庆幸的是,有“炎黄一号”作为蒙古人种的参考序列,我们将离“精准”的目标更加接近。

来源:果壳网

为你推荐

恩凯赛药完成数千万元A++轮融资,加速推进NK细胞免疫产品管线资讯

恩凯赛药完成数千万元A++轮融资,加速推进NK细胞免疫产品管线

近期,恩凯赛药(上海恩凯细胞技术有限公司)宣布完成数千万元A++轮融资,本轮融资由三生制药领投,张科禾润、易津资本等跟投。本轮募集的资金将用于加速推进恩凯赛药在研产品管...

2024-11-22 09:22

CDE:细胞治疗产品临床药理学研究技术指导原则(试行)资讯

CDE:细胞治疗产品临床药理学研究技术指导原则(试行)

本指导原则所涵盖的细胞治疗产品是指来源、操作和临床试验过程符合伦理要求,按照药品管理相关法规进行研发和注册申报,用于治疗疾病的人体来源活细胞产品。

2024-11-21 22:11

又一款针对晚期肺癌的创新药获批上市资讯

又一款针对晚期肺癌的创新药获批上市

日前,根据国家药监局官网信息显示,晨泰医药申报的1类创新药盐酸佐利替尼片(商品名:泽瑞尼)获批上市,用于具有表皮生长因子受体(EGFR)19号外显子缺失或外显子21(L858R)...

2024-11-21 16:04

万泰生物九价HPV疫苗男性临床试验申请获批资讯

万泰生物九价HPV疫苗男性临床试验申请获批

近日,万泰生物发布公告称,公司全资子公司厦门万泰沧海生物技术有限公司(下简称:万泰沧海生物)收到国家药品监督管理局下发的《药物临床试验通知书》(通知书编号:2024LP025...

2024-11-21 13:31

百济神州,达成了一项和解资讯

百济神州,达成了一项和解

近日,百济神州美股发布临时公告宣布,其两家子公司BeiGene USA,Inc 和BeiGene Switzerland GmbH(与百济神州有限公司合称“百济神州”)与MSN Pharmaceuticals,Inc 和MSN...

2024-11-21 08:54

山西公布2023 年国谈药品(竞价药品)同通用名药品(第二批)医保支付标准资讯

山西公布2023 年国谈药品(竞价药品)同通用名药品(第二批)医保支付标准

国谈药品(竞价药品)同通用名药品(第二批)医保支付标准。

2024-11-20 20:40

TPP亚太区总裁叶惠琦:以AI赋能医疗,推动“一人一生一份电子病历”理念中国落地资讯

TPP亚太区总裁叶惠琦:以AI赋能医疗,推动“一人一生一份电子病历”理念中国落地

作为英国NHS(英国国家医疗卫生体系)首选的医疗解决方案与服务供应商,TPP凭借其前沿的理念和创新的技术,正加速在中国市场深耕,推动中国医疗服务的信息化、智慧化进程。

文/张蓉蓉 2024-11-20 15:51

将获超4000万美元现金付款,博奥信2款自免资产授权出海资讯

将获超4000万美元现金付款,博奥信2款自免资产授权出海

日前,博奥信生物宣布与Aclaris Therapeutics就BSI-045B和BSI-502达成全球(除大中华区外)独家授权协议。根据协议条款,博奥信将获得超过4000万美元的现金付款,作为首付款以...

2024-11-20 14:19

中国心梗救治日|欧翎先锋赋能基层药师,共筑基层血脂科学管理资讯

中国心梗救治日|欧翎先锋赋能基层药师,共筑基层血脂科学管理

目前,我国血脂异常患病率较高,但知晓率、治疗率与达标率均处于较低水平,居民血脂管理亟待加强。

2024-11-20 13:12

因美纳宣布扩展TruSight Oncology产品线资讯

因美纳宣布扩展TruSight Oncology产品线

最新解决方案将亮相于分子病理学协会年度会议,以实现对肿瘤的全景变异分析。由因美纳客户主导的研究和分享将提供最新的肿瘤分析证据和相关内容。

2024-11-20 10:01

一家中国Biotech企业反向收购了美股上市公司资讯

一家中国Biotech企业反向收购了美股上市公司

在当今的生物科技领域,Biotech公司正积极探索新的生存与发展之道,或选择“卖身”大药企怀抱,或寻求“联姻”以壮大自身。而在这股潮流中,睿跃生物(Cullgen)却独辟蹊径,通...

2024-11-20 09:21

共创共享眼科智慧!首届泛大湾区眼科学术会议(PGBO·2024)圆满落幕资讯

共创共享眼科智慧!首届泛大湾区眼科学术会议(PGBO·2024)圆满落幕

11 月 15 日至 17 日,由爱尔眼科医院集团、广东省医疗行业协会主办,东莞市医学会眼科分会、暨南大学附属东莞爱尔眼科医院承办的“首届泛大湾区眼科学术会议(PGBO·2024...

2024-11-20 09:16

让急救更便捷,晖致在研新药亮相长城会,期待助力心梗救治资讯

让急救更便捷,晖致在研新药亮相长城会,期待助力心梗救治

11月7—10日,第35届长城心脏病学大会(GW-ICC 2024)暨亚洲心脏大会(ASH 2024)在北京召开。作为全球领先的医疗健康公司企业之一,晖致携在研新款高选择性的P2Y12受体拮抗剂...

2024-11-19 16:51

康弘药业荣获2024中医药传承与创新最佳实践案例奖资讯

康弘药业荣获2024中医药传承与创新最佳实践案例奖

经过激烈角逐,凭借在中医药传承与创新实践方面的卓越表现,康弘药业下属子公司——济生堂药业,从众多参选企业中脱颖而出,成功登榜“2023中国中药企业传承与创新最佳实践案例50”。

2024-11-19 13:19

上海公布2024年9月挂网公开议价超“黄线”、未通过公允性评估、重点监控药品幅度靠前且有一定采购金额的品种资讯

上海公布2024年9月挂网公开议价超“黄线”、未通过公允性评估、重点监控药品幅度靠前且有一定采购金额的品种

近日,上海市医药集中招标采购事务管理所公布了2024年9月挂网公开议价超“黄线”、未通过公允性评估、重点监控药品幅度靠前且有一定采购金额的品种。

2024-11-18 22:09

华东医药创新研发加速,两款GLP-1药物获批脂肪肝相关适应症临床试验资讯

华东医药创新研发加速,两款GLP-1药物获批脂肪肝相关适应症临床试验

由全资子公司中美华东申报的HDM1005注射液(靶向GLP-1 GIP长效激动剂)临床试验申请已获得FDA批准,可在美国开展I期临床试验,适应症为代谢相关脂肪性肝炎(MASH)。

2024-11-18 20:02

美的楼宇科技携制药行业暖通解决方案亮相2024药机展,赋能制药行业绿色智慧升级资讯

美的楼宇科技携制药行业暖通解决方案亮相2024药机展,赋能制药行业绿色智慧升级

11月17日,第65届(2024秋季)中国国际制药机械博览会(以下简称“药机展”)于厦门国际博览中心盛大举办。作为楼宇智慧生态集成解决方案引领者,美的楼宇科技以“以智提质,构...

2024-11-18 15:12

最高6.26亿美元,康诺亚再“出海”一款双抗资讯

最高6.26亿美元,康诺亚再“出海”一款双抗

日前,康诺亚发布公告宣布其子公司成都康诺亚与Platina Medicines Ltd(PML)已订立独家许可协议,授予PML在全球(不包括中国内地、香港、澳门及台湾)研究、开发、生产、注册...

2024-11-18 11:06

万米高空出生的早产儿,如何百日闯关?资讯

万米高空出生的早产儿,如何百日闯关?

凯西提供覆盖从新生儿到老年人的呼吸疾病治疗解决方案,至今已服务了数百万名中国早产儿。

2024-11-18 10:22

华东医药旗下Sinclair多款核心医美产品国内临床取得新进展资讯

华东医药旗下Sinclair多款核心医美产品国内临床取得新进展

其中, MaiLi Precise完成中国临床试验全部受试者主要终点随访;Ellansé®伊妍仕® S型新增适应症和Lanluma® V型均完成中国临床试验全部受试者入组;全新专利成分的真皮注...

2024-11-17 19:20