华大基因一纸关于成立前瞻业务单元,由前华大基因CEO王俊负责探索以人工智能为核心的新业务。一时间,各种猜想、祝福和阴谋论充斥于媒体和社交网络。历经十五年,华大基因在基因组方面的强悍实力早已蜚声海内外,但人工智能?虽然炙手可热,但这真的足以让王俊投入下一个十五年?把目光投向一家美国初创公司,或许这能给我们一些启示。
Deep Genomics,源自多伦多大学的一家创业公司。对人工智能稍有了解的人就能看出这个名字的含义:Deep Genomics = Deep Learning + Genomics。Deep Genomics致力于利用机器学习算法来预测基因组上的突变会如何改变细胞,进而知道会给人体带来什么改变。Deep Genomics的第一个产品是SPIDEX,预测基因组突变对RNA剪切的影响。关于SPIDEX的方法学细节,可以查看2015年1月的Science。机器学习专家、基因组学专家和精准医疗专家组成的团队,让这个公司很快就登上了Nature Biotechnology、科学美国人、WIRED、CBC新闻等学术、科普、科技和传统媒体。
Deep Learning,深度学习,一种模拟人类大脑工作方式的机器学习算法,近年来被广泛用于语音识别、图像识别等海量非结构化数据学习。Google、Facebook、微软等IT巨头在深度学习领域都投入巨资,国内的百度挖来深度学习领域的华人大神余凯成立百度深度学习研究院,随后再引入深度学习巨匠Andrea Ng担任研究院院长。余凯老师今年从百度离职,据悉将在人工智能芯片方面开始创业----可以相信,余凯老师看到了以深度学习为代表的机器学习技术更广阔的应用场景和商业化前景。
通过模拟人脑的工作方式设计和开发人工智能模型和算法一直以来就是人工智能领域的一个重要发展方向。脑科学的发展,让我们知道人类的大脑是通过很多层结构对数据进行抽象和学习的。但传统的神经网络算法,受制于数据量和计算能力,往往只有很少的几层。即便如此,神经网络算法也广泛的用于互联网、工业控制、以及生命科学等诸多领域。随着以分布式存储和计算、GPU和MIC等众核计算技术在最近十来年的神速进步,以及互联网在采集数据方面的强大能力,人们开始研究如何实现有更复杂的层次结构,可以处理更复杂的数据,尤其是非结构化数据的机器学习算法。深度学习中所谓的深度就来自这复杂的层次结构,让人觉得是一个深不见底的黑洞。
如前所述,深度学习在语音识别、图像识别等领域取得了巨大的成功,让这些之前只存在于科幻电影中的技术迅速地步入大众生活。但在生命科学领域,这个被宣称正在快速从实验科学变为理论科学、数据科学的领域,深度学习并没有带来革命性的变化,零星的科研论文出现在生物信息学和基因组学的学术期刊上,波澜不惊。相对于图像数据和语音数据,生命科学数据获取的高成本使得数据积累量还远远满足不了一般意义上的深度学习模型的需求,而商业模型的不成熟也阻碍了商业机构在这方面的投入。
Deep Genomics 在技术方面的工作已经发表在了今年一月份的Science和去年6月份的Bioinformatics上,最新的工作即将在Nature Biotechnology上发表。例如,在Bioinformatics上发表的文章中,主要的数据是11019份小鼠的可变外显子(alternative exons)的RNA-Seq数据,然后据此构建深度神经网络来预测组织间的剪切模式。显然,使用小鼠和局限于外显子,大幅度的降低了构建大规模训练数据集的成本。一万多份样本,在图形、机器感知等领域还是很小的样本,但在生命科学领域,尤其是高通量组学领域,已经算得上是不小的样本量了。但这并不是高不可攀,安徽医科大学发表在Nature Genetics上的银屑病项目也对约两万人的样本进行了目标区域捕获测序。对这样规模的数据构建深度学习模型,在模型设计和计算效率上都不存在太大的困难。
随着基因组学技术在医学,尤其是诊断领域的市场不断扩大,华大基因已经从一家发不出工资的体制外科研机构走向基础研究和商业化并重的行业巨头。从买来无以伦比的测序能力,“工业化生产”的基因组学论文,到收购Complete Genomics进军行业上游获得有自主知识产权的基因组数据产出能力。下一步,如何让从这些数据中挖掘出更有价值的东西,人工智能是不可或缺的工具。
Deep Genomics走出了人工智能和基因组数据整合商业化的一步,华大基因会在这条道路上前进多远?
十五年,或许还走不完这条路。
来源:biodata 微信公众号 作者: 陈钢
为你推荐

带状疱疹疫苗“遇冷”,百克生物2024年净利润腰斩
近日,国内疫苗龙头企业百克生物发布2024年年报,数据显示,其报告期内实现营收12 29亿元,同比下降32 64%;归属于上市公司股东的净利润2 32亿元,同比下降53 67%。对于营收...
2025-04-23 12:59

重庆常用药联盟接续集采中选结果
近日,重庆常用药联盟接续集采中选情况公布,该联盟由重庆牵头,联合湖北、广西、海南、贵州、云南、青海、宁夏、新疆及新疆生产建设兵团等十省(区、市)开展的药品集中带量采...
2025-04-21 18:48

全周期智控慢病,诺和诺德与京东健康开启战略合作
2025年4月21日,全球领先的生物制药公司诺和诺德与京东健康在北京正式签署战略合作协议,标志着双方在糖尿病和体重管理领域的合作进入新阶段。依托诺和诺德百年深耕慢病领域的专...
2025-04-21 15:57

康方生物1类新药依若奇单抗上市申请获批,用于中重度斑块状银屑病成人患者
该药是我国第一个且唯一获批上市的IL-12 IL-23“双靶向”单克隆抗体新药,是康方生物自身免疫性疾病领域首个获批上市的一类新药。
2025-04-21 13:39

阿斯利康乳腺癌1类创新药卡匹色替片中国获批
该药适用于联合氟维司群用于转移性阶段至少接受过一种内分泌治疗后疾病进展,或在辅助治疗期间或完成辅助治疗后12个月内复发的激素受体(HR)阳性、人表皮生长因子受体2(HER2)...
2025-04-21 11:02

辉瑞宣布终止一款口服GLP-1减肥药的临床开发
近日,辉瑞在其官网宣布,决定终止开发口服胰高血糖素样肽-1受体(GLP-1R)激动剂Danuglipron(PF-06882961),原因系在一项有关用药剂量的临床试验中,一名患者出现了可能由该...
2025-04-21 10:29

福建省医保局印发单列门诊统筹支付医保药品目录(2024年版)
根据2024年6月发布的《福建省医保药品单列门诊统筹支付管理办法(试行)》,为了让参保患者无需住院、在门诊就医也能用上国家谈判药品、享受医保待遇,将适用于门诊治疗、使用周...
2025-04-20 13:34

首批中国消费名品名单,医药健康企业有哪些?
近日,工业和信息化部办公厅发布首批中国消费名品名单,分为中国消费名品名单和中国消费名品成长企业名单。首批中国消费名品名单共包括93个企业品牌和43个区域品牌。中国消费名...
2025-04-20 11:17

携手共绘“个性化近视手术”新蓝图:爱尔眼科与爱尔康启动100家医院全光塑技术战略合作
双方将以技术共享为核心,以人才培养为支撑,以科研协作为纽带,全力推进屈光手术标准化诊疗体系建设,加速前沿技术在临床领域的普及应用
文/ 屈慧莹 2025-04-19 23:35

CDE:简化港澳已上市传统口服中成药内地上市注册审批申报资料及技术要求
允许香港、澳门特区本地登记的生产企业持有,并经香港、澳门特区药品监督管理部门批准上市且在香港、澳门特区使用15年以上,生产过程符合药品生产质量管理规范(GMP)要求的传统...
2025-04-18 18:54

君德医药完成近亿元A轮融资,加速推进创新药械组合平台建设与产品上市
本轮融资主要用于首个减重口服器械的注册及生产销售,以及加速多个核心创新药械组合技术平台的产品管线研发进程。
2025-04-18 14:34

礼来首个小分子口服GLP-1RA药物orforglipron 3期临床研究成功
Orforglipron是首个成功完成3期临床研究的小分子GLP-1类药物,各剂量组平均A1C降幅为1 3%至1 6%
2025-04-18 14:12