“外”如探测浩瀚的宇宙,“内”如揭示人体细胞的奥秘,海量的信息必将改变人类社会、改变人类自己。
人类已经逐步进入信息爆炸的时代,各种个人信息、网络行为、生活习惯,甚至各种所谓的隐私、银行账号密码等“机密”信息均无法避免遭遇各种泄露门、监控门事件。肿瘤这个邪恶的幽灵隐藏在体内,时刻准备攫取资源来扩张自己的军队。而我们却对之毫无察觉。 但随着以新一代测序技术为代表的高通量生物检测技术的发展,肿瘤的机密信息也无处遁形,遭遇着前所未有的“信息泄露”,肿瘤的DNA、RNA、蛋白质、代谢物等生物信息都暴露于人类的检测之下。这些海量信息被称为组学信息(omics),如:DNA序列信息是基因组(genomics)、染色质结构和各种基因组修饰是表观遗传组(epigenomics),另外还有转录组、蛋白质组、代谢组等等。从这些泄漏的信息,我们该如何来窥探肿瘤的“隐私”?如何推出更好的对付“肿瘤”的办法?
拿到海量的肿瘤组学数据我们能做什么?首要任务是建立肿瘤的信息档案。就像是地理测绘测绘,首先要用测到的数据把地图绘制出来。目前,几个国际癌症基因组计划,如ICGC(International Cancer Genome Consortium)、TCGA(The Cancer Genome Atlas),都致力于推动肿瘤分子图谱的构建。利用TCGA的数据,可以识别在肿瘤细胞中发生的体突变,并从中识别出影响蛋白质结构与功能的突变位点(Niu et al., Nat Genet 2015),另一项类似的研究从超过7000余对肿瘤/癌旁配对样本中识别出超过47000个非同义突变位点,极大的提高了人们对肿瘤突变谱的认识(Shen et al., Am J Human Genet 2016)。基于突变谱,可以更好的估计靶向药物的潜在应用比例,经计算估计约40%的病人可能会受益于靶向药物(Rubio-Perez et al., Cancer Cell 2015)。
但由于肿瘤的高度异质性以及不同中心采样和检测手段的差异,单个项目所纳入的样本量仍然远远不够,以肝癌为例,在TCGA中有约400例样本,已经是目前公开数据集里样本数最多的了。为了更好的绘制“肿瘤的地图”,必须建立跨更多数据源的大规模图谱。比如本课题组构建的肝细胞肝癌(Hepatocellular Carcinoma,HCC)组学图谱HCCDB,已经收录了约3500例临床样本的基因/miRNA表达数据、约800例DNA甲基化数据、约600例CNV数据(来源于17组研究),目前可提供表达谱的网页浏览服务。多来源/多中心、大规模的组学数据是建立肿瘤信息档案的基础,基于这些收录的数据,我们已经开展了HCC的DNA甲基化图谱分析(Zheng et al. Brief Bioinform 2016),正在进行基于表达谱的HCC分型研究。同时,HCC相关研究人员可以方便的查询分析结果,指导相关的实验设计,提出更加合理的假设。比如某研究人员正在关注HCC肿瘤干细胞的调控机制,他可以用EPCAM、AFP、SPP1等候选基因来查询相关的通路或基因。信息爆炸的时代或者说大数据时代,绘制各种“地图”是实现数据价值的第一步,从多个维度、多个层次构建“肿瘤地图”是以信息技术攻克癌症的基础和关键。类似的,大肠癌也建立了超过4000例样本(来源于18组研究)的大规模数据集,并基于该数据集分析出大肠癌的四个分子亚型,并得到了每个分子亚型所特有的分子和表型特征(Guinney et al. Nat Med 2015)。
有了基础地图之后,我们当然需要将其绘制得更加精细,并利用“先人的知识”对其进行仔细的标注,比如在军事地图上需要标注出关键的制高点、隘口等。这个时候人工智能技术就非常重要了,针对癌症组学数据高维、异质等特性,需要更好机器学习方法对数据进行挖掘和建模,比如聚类(分子分型,如多组学整合聚类方法LRAcluster)(Wu et al. BMC Genomics 2015)、预测(分子标志物),核心调控网络识别(分子机理)(Gu et al. Mol BioSyst 2014))及其可能的调控策略(药物干预)等。由于生命系统高度复杂,组学数据并不能很好的完成“地图标注”的任务,必须要跟专家知识、文献信息有机的结合起来。这对传统基于采样数据的机器学习方法无疑是新的挑战。可以预见,要更好的解读肿瘤的信息,必须建立可融合采样数据和知识数据的新的人工智能方法。深度学习(deep learing)(LeCun et al. Nature 2015)与层级贝叶斯学习(hierarchical Bayesian learning)(Ghahramani. Nature 2015; Lake et al. Science 2015)的结合是否是可行的路径?这些都还有待进一步的研究。
随着生物医学检测技术与人工智能的发展,肿瘤的“机密信息”将不断的被披露,人们将拥有更多肿瘤诊疗的新手段。
参考文献
Ghahramani. Probabilistic machine learning and artificial intelligence. Nature 2015, 421:452-459.
Gu et al. Gene module based regulator inference identifying miR-139 as a tumor suppressor in colorectal cancer. Molecular BioSystems 2014, 10(12):3249-3254.
Guinney et al. The consensus molecular subtypes of colorectal cancer. Nat Med 2015, 21(11):1350-1362.
Lake et al. Human-level concept learning through probabilistic program induction. Science 2015, 350(6266):1332-1339.
LeCun et al. Deep Learning. Nature 2015, 521:436-444.
Niu et al. Protein-structure-guided discovery of functional mutations across 19 cancer types. Nat Genet 2016, 48(8):827-837.
Rubio-Perez, et al. In Silico Prescription of Anticancer Drugs to Cohorts of 28 Tumor Types Reveals Targeting Opportunities. Cancer Cell 2015, 27:382-396.
Shen et al. Proteome-Scale Investigation of Protein Allosteric Regulation Perturbed by Somatic Mutations in 7,000 Cancer Genomes. Am J Hum Genet 2016, EPub.
Wu et al. Fast dimension reduction and integrative clustering of large-scale multi-omics data using low-rank approximation: application to cancer molecular classification. BMC Genomics 2015, 16:1022.
Zheng et al. Genome-wide DNA methylation analysis identifies candidate epigenetic markers and drivers of hepatocellular carcinoma. Brief Bioinform 2016, Epub.
来源:古槿科学网博客 作者:古槿
为你推荐

商务部对原产于美国、印度的进口相关医用CT球管发起反倾销立案调查,同时发起产业竞争力立案调查
产品描述为适用于16排及以上计算机断层扫描(CT)设备的进口医用X射线CT球管以及适配以上球管的管芯(包括单独管芯、球管半成品、完整球管等多种形式)。
2025-04-04 23:10

悦唯医疗完成近亿元A++轮投资,加速重症冠心病诊疗全流程创新器械研发与国产替代
此次融资将主要用于深化冠心病诊疗全流程创新器械和脉动式左心室辅助系统等新产品的研发,以及加速已获准上市的心脏稳定器等产品的市场推广。
2025-04-03 09:28

海尔盈康一生启动孤独症儿童关爱行动,创新罕见病可持续公益新生态
本次活动聚焦孤独症儿童的诊疗,探讨交流AI赋能全流程防治康体系创新、前沿性生物科技诊疗技术等话题,旨在通过生态联盟的力量推动医学研究、科技创新与人文关怀的融合,让“星...
2025-04-03 09:11

《NPJ digital medicine》刊发李冬梅教授团队成果:AI赋能高效识别眼睑肿物
亚太眼整形外科学会主席、中华医学会眼科分会眼整形眼眶病学组副组长李冬梅教授团队携手爱尔数字眼科研究所,在《NPJ digital medicine》(影响因子:12 4)学术期刊发表团队...
文/李林 2025-04-02 10:27

默克全球执行副总裁周虹:合作与创新是默克未来五年战略的两大关键词
近日,德国默克医药健康全球执行副总裁、中国及国际市场负责人周虹带领医药健康中国及国际市场管理团队开启了2025年度首次“中国行”。
2025-04-01 17:11

首个且唯一,阿斯利康PD-L1单抗获FDA批准治疗肌层浸润性膀胱癌
度伐利尤单抗联合吉西他滨和顺铂作为新辅助治疗,随后度伐利尤单抗作为根治性膀胱切除术后的辅助单药治疗,用于治疗肌层浸润性膀胱癌成年患者。
2025-04-01 14:37

全国首个,湖北为脑机接口医疗服务定价
昨日(3月31日),据“湖北发布”消息,湖北省医保局发布全国首个脑机接口医疗服务价格,其中,侵入式脑机接口置入费6552元 次,侵入式脑机接口取出费3139元 次,非侵入式脑机...
2025-04-01 11:03

一款国产创新流感药,获批
近日,据国家药监局官网信息显示,青峰医药下属子公司江西科睿药自主研发的1类创新药玛舒拉沙韦片(商品名:伊速达)正式获批上市,用于既往健康的12岁及以上青少年和成人单纯性...
2025-04-01 10:22

26省联盟药品集采启动,聚焦妇科用药和造影剂
近日,山西省药械集中招标采购中心发布《关于做好二十六省联盟药品集中带量采购品种数据填报工作的通知》,开展相关采购数据填报工作。
2025-03-31 21:48

优时比罗泽利昔珠单抗注射液(优迪革)中国获批,全球首个且唯一双亚型创新药治疗全身型重症肌无力
作为唯一人源化、高亲和力且具备创新修饰结构的IgG4单抗,关键Ⅲ期MycarinG试验证实罗泽利昔珠单抗注射液(优迪革®)较安慰剂显著改善全身型重症肌无力患者的多个临床终点与结局。
2025-03-31 15:58

从手术麻醉到生命全周期护航,麻醉学科发展拓宽生命边界
3月26日,由中华医学会麻醉学分会、中国医师协会麻醉学医师分会等23家学协会共同举办的2025年中国麻醉周学术活动的启动仪式举办,该活动以“生命之重,大医精诚——守生命保驾护...
2025-03-31 15:30

欧狄沃联合逸沃成为中国目前唯一获批的肝细胞癌一线双免疫联合疗法
欧狄沃联合逸沃对比仑伐替尼或索拉非尼,可显著改善不可切除肝细胞癌一线患者的总生存期(OS),客观缓解率(ORR)可改善近3倍,中位缓解持续时间(mDOR)达30个月
2025-03-31 13:45

罗氏制药榜首 “现金牛” 产品罗可适(奥瑞利珠单抗)在华获批:开启多发性硬化症一年两次治疗新时代
罗氏制药今日(3月31日)宣布,其旗下创新药罗可适®(Ocrevus®,通用名:奥瑞利珠单抗注射液 ocrelizumab injection)正式获得中国国家药品监督管理局批准,每六个月静脉输...
2025-03-31 13:39