华大基因一纸关于成立前瞻业务单元,由前华大基因CEO王俊负责探索以人工智能为核心的新业务。一时间,各种猜想、祝福和阴谋论充斥于媒体和社交网络。历经十五年,华大基因在基因组方面的强悍实力早已蜚声海内外,但人工智能?虽然炙手可热,但这真的足以让王俊投入下一个十五年?把目光投向一家美国初创公司,或许这能给我们一些启示。
Deep Genomics,源自多伦多大学的一家创业公司。对人工智能稍有了解的人就能看出这个名字的含义:Deep Genomics = Deep Learning + Genomics。Deep Genomics致力于利用机器学习算法来预测基因组上的突变会如何改变细胞,进而知道会给人体带来什么改变。Deep Genomics的第一个产品是SPIDEX,预测基因组突变对RNA剪切的影响。关于SPIDEX的方法学细节,可以查看2015年1月的Science。机器学习专家、基因组学专家和精准医疗专家组成的团队,让这个公司很快就登上了Nature Biotechnology、科学美国人、WIRED、CBC新闻等学术、科普、科技和传统媒体。
Deep Learning,深度学习,一种模拟人类大脑工作方式的机器学习算法,近年来被广泛用于语音识别、图像识别等海量非结构化数据学习。Google、Facebook、微软等IT巨头在深度学习领域都投入巨资,国内的百度挖来深度学习领域的华人大神余凯成立百度深度学习研究院,随后再引入深度学习巨匠Andrea Ng担任研究院院长。余凯老师今年从百度离职,据悉将在人工智能芯片方面开始创业----可以相信,余凯老师看到了以深度学习为代表的机器学习技术更广阔的应用场景和商业化前景。
通过模拟人脑的工作方式设计和开发人工智能模型和算法一直以来就是人工智能领域的一个重要发展方向。脑科学的发展,让我们知道人类的大脑是通过很多层结构对数据进行抽象和学习的。但传统的神经网络算法,受制于数据量和计算能力,往往只有很少的几层。即便如此,神经网络算法也广泛的用于互联网、工业控制、以及生命科学等诸多领域。随着以分布式存储和计算、GPU和MIC等众核计算技术在最近十来年的神速进步,以及互联网在采集数据方面的强大能力,人们开始研究如何实现有更复杂的层次结构,可以处理更复杂的数据,尤其是非结构化数据的机器学习算法。深度学习中所谓的深度就来自这复杂的层次结构,让人觉得是一个深不见底的黑洞。
如前所述,深度学习在语音识别、图像识别等领域取得了巨大的成功,让这些之前只存在于科幻电影中的技术迅速地步入大众生活。但在生命科学领域,这个被宣称正在快速从实验科学变为理论科学、数据科学的领域,深度学习并没有带来革命性的变化,零星的科研论文出现在生物信息学和基因组学的学术期刊上,波澜不惊。相对于图像数据和语音数据,生命科学数据获取的高成本使得数据积累量还远远满足不了一般意义上的深度学习模型的需求,而商业模型的不成熟也阻碍了商业机构在这方面的投入。
Deep Genomics 在技术方面的工作已经发表在了今年一月份的Science和去年6月份的Bioinformatics上,最新的工作即将在Nature Biotechnology上发表。例如,在Bioinformatics上发表的文章中,主要的数据是11019份小鼠的可变外显子(alternative exons)的RNA-Seq数据,然后据此构建深度神经网络来预测组织间的剪切模式。显然,使用小鼠和局限于外显子,大幅度的降低了构建大规模训练数据集的成本。一万多份样本,在图形、机器感知等领域还是很小的样本,但在生命科学领域,尤其是高通量组学领域,已经算得上是不小的样本量了。但这并不是高不可攀,安徽医科大学发表在Nature Genetics上的银屑病项目也对约两万人的样本进行了目标区域捕获测序。对这样规模的数据构建深度学习模型,在模型设计和计算效率上都不存在太大的困难。
随着基因组学技术在医学,尤其是诊断领域的市场不断扩大,华大基因已经从一家发不出工资的体制外科研机构走向基础研究和商业化并重的行业巨头。从买来无以伦比的测序能力,“工业化生产”的基因组学论文,到收购Complete Genomics进军行业上游获得有自主知识产权的基因组数据产出能力。下一步,如何让从这些数据中挖掘出更有价值的东西,人工智能是不可或缺的工具。
Deep Genomics走出了人工智能和基因组数据整合商业化的一步,华大基因会在这条道路上前进多远?
十五年,或许还走不完这条路。
来源:biodata 微信公众号 作者: 陈钢
为你推荐

《NPJ digital medicine》刊发李冬梅教授团队成果:AI赋能高效识别眼睑肿物
亚太眼整形外科学会主席、中华医学会眼科分会眼整形眼眶病学组副组长李冬梅教授团队携手爱尔数字眼科研究所,在《NPJ digital medicine》(影响因子:12 4)学术期刊发表团队...
文/李林 2025-04-02 10:27

默克全球执行副总裁周虹:合作与创新是默克未来五年战略的两大关键词
近日,德国默克医药健康全球执行副总裁、中国及国际市场负责人周虹带领医药健康中国及国际市场管理团队开启了2025年度首次“中国行”。
2025-04-01 17:11

首个且唯一,阿斯利康PD-L1单抗获FDA批准治疗肌层浸润性膀胱癌
度伐利尤单抗联合吉西他滨和顺铂作为新辅助治疗,随后度伐利尤单抗作为根治性膀胱切除术后的辅助单药治疗,用于治疗肌层浸润性膀胱癌成年患者。
2025-04-01 14:37

全国首个,湖北为脑机接口医疗服务定价
昨日(3月31日),据“湖北发布”消息,湖北省医保局发布全国首个脑机接口医疗服务价格,其中,侵入式脑机接口置入费6552元 次,侵入式脑机接口取出费3139元 次,非侵入式脑机...
2025-04-01 11:03

一款国产创新流感药,获批
近日,据国家药监局官网信息显示,青峰医药下属子公司江西科睿药自主研发的1类创新药玛舒拉沙韦片(商品名:伊速达)正式获批上市,用于既往健康的12岁及以上青少年和成人单纯性...
2025-04-01 10:22

26省联盟药品集采启动,聚焦妇科用药和造影剂
近日,山西省药械集中招标采购中心发布《关于做好二十六省联盟药品集中带量采购品种数据填报工作的通知》,开展相关采购数据填报工作。
2025-03-31 21:48

优时比罗泽利昔珠单抗注射液(优迪革)中国获批,全球首个且唯一双亚型创新药治疗全身型重症肌无力
作为唯一人源化、高亲和力且具备创新修饰结构的IgG4单抗,关键Ⅲ期MycarinG试验证实罗泽利昔珠单抗注射液(优迪革®)较安慰剂显著改善全身型重症肌无力患者的多个临床终点与结局。
2025-03-31 15:58

从手术麻醉到生命全周期护航,麻醉学科发展拓宽生命边界
3月26日,由中华医学会麻醉学分会、中国医师协会麻醉学医师分会等23家学协会共同举办的2025年中国麻醉周学术活动的启动仪式举办,该活动以“生命之重,大医精诚——守生命保驾护...
2025-03-31 15:30

欧狄沃联合逸沃成为中国目前唯一获批的肝细胞癌一线双免疫联合疗法
欧狄沃联合逸沃对比仑伐替尼或索拉非尼,可显著改善不可切除肝细胞癌一线患者的总生存期(OS),客观缓解率(ORR)可改善近3倍,中位缓解持续时间(mDOR)达30个月
2025-03-31 13:45

罗氏制药榜首 “现金牛” 产品罗可适(奥瑞利珠单抗)在华获批:开启多发性硬化症一年两次治疗新时代
罗氏制药今日(3月31日)宣布,其旗下创新药罗可适®(Ocrevus®,通用名:奥瑞利珠单抗注射液 ocrelizumab injection)正式获得中国国家药品监督管理局批准,每六个月静脉输...
2025-03-31 13:39

三生有幸,医者仁心:三生制药向全体医药工作者致敬!
3月30日是国际医师节,由三生制药公益支持的以“三生有幸,医者仁心”为主题的公益活动,携手20位医生代表,以寄语海报的形式,共同向全体医护人员表达诚挚的祝福与关爱。
2025-03-30 17:38

新版药典自2025年10月1日起实施
3月25日,国家药监局官网发布《国家药监局 国家卫生健康委关于颁布2025年版的公告(2025年第29号)》,2025年版《中国药典》自2025年10月1日起施行。
2025-03-30 17:07

向C端发力,华大集团首届健康同行合作伙伴大会圆满举行
3月29日,以“科技普惠,健康生活”为主题的华大集团首届健康同行合作伙伴大会在华大时空中心成功举办,通过报告演示、展台展示等方式,首次系统性地向外界展示运用生命科学前沿...
2025-03-30 10:38

广州试点创新药械“医保+商保”同步结算
本次试点依托国家医保信息平台,在22家试点医院实现医保+商保一站式同步结算,通过提供“商业保险创新药械结算清单”,商保理赔金额将一目了然,市民只需支付医保和商保报销后的...
2025-03-28 18:41

揽入首付款2亿美元,恒瑞医药就一款II期临床药物与默沙东达成新合作
近日,恒瑞医药发布公告称,公司与默沙东达成协议,将恒瑞医药的脂蛋白(a)[Lp(a)]口服小分子项目(包括名为HRS-5346的先导化合物)有偿许可给默沙东,默沙东将获得HRS-5346在大...
2025-03-28 16:24