华大基因CEO王俊:破解基因大数据可实现精准医疗

医疗健康 来源:腾讯科技 作者:刘亚澜
2015
04/22
14:22
腾讯科技
作者:刘亚澜
医疗健康

4月21日,由中国企业家俱乐部主办的2015年中国绿公司年会在沈阳举行。华大基因CEO王俊出席大会,并作了题为“基因、大数据与人工智能”的演讲。

王俊从基因的存储原理、基因测试大数据和人工智能深度学习等角度说明了保持健康,应该不是一个感性的意愿,更重要的是理性选择,这种理性选择是基于数据基础之上,基于人工智能的判断,是对基因的了解基础上形成的。

他将基因组比喻为一个个程序,每个基因是程序运行的一个功能模块。因为一个基因所能完成的只是一个功能,只有将众多基因联合起来才能寻找到不同的生存策略。而优质基因的存储对于医学、美容等都有深刻意义。同时他还提到目前基因大数据的情况,虽然目前成本很高,但他有信心未来基因数据的价值会远大于产生基因数据的成本,到那时,测序就会免费了。

王俊说:“基因蕴藏着所有生老病死的规律,如果从基因谈健康,必须要学会对人的基本状况的预测及预防,而不是简单治疗。”精准医疗对于医疗行业有非常大的改变,其概念核心点把人群细分,对其治疗、诊断要精准,对其个体化的行为和数据要有非常精准的解读,以给出一个精准的、对应化的解决方案。

以下为王俊演讲实录精编:

很高兴在讲基因的相关事情,我改了一下我这个题目,原来讲基因改变世界,我改了一下题目,把它变成BGI,华大基因的缩小是BGI,给一个新的诠释,华大要做三件事,第一件事就是B,做大数据,G是做基因,I是做人工智能。

基因

先从G基因讲起。生命本身是数据化的,我们可能习惯了以硅为基础的,忘记了以碳为基础的生命运营规则,大家可能很难想象,为什么这个生命体本身也是一种计算,为什么本身也是数字化的。

如果把全世界所有的图书,我们看见的书,都用DNA的方式来存储,可以存在巴掌大小的DNA里面,所有的全世界图书管理的书,都可以放在巴掌大小的DNA里面,可以存储多少年呢?上千万年。任何一个现在的计算机,无论光盘还是硬盘介质都不可以,但现在DNA可以存储上千万年,是自然界里面最高效的最持久的存储形式。

让我们假想整个宇宙是一个大的计算机,我们每个人,每个个体只不过是在那儿运行的一个程序。我们所说的基因组,是一个完整的程序,每个基因是程序运行的一个功能模块,就像写计算机一样,写一个功能模块,这一个代码是为了执行一个功能。

再往前追溯的时候,有一本书叫《自私的基因》,追溯在最原始的十几亿年前,在原始汤的形态存在的时候,基因是以分子形式存在,这些东西要不断扩张自己。如果写出一段好的代码,会经常把这段代码用到不同的程序体系里。为什么用到不同程序,因为它好,这边要用到,那边也要用到。一个基因本身最重要的事情就是不断扩张自己。

而如果说基因本身是自私的,在往前走的时候就会发现可能需要合作。因为一个基因所能完成的只是一个功能,如果把两个基因合起来,三个基因合起来,五个基因合起来,一堆基因合起来,就可能寻找到不同的生存策略。

我们现在看见的大千世界,每个物种,事实上是各种基因的不同组合,或者反过来讲,是这些基因的组合所采取的不同的生存策略。这种生存策略是不是成功,它的判定的唯一标准就是环境,你如果适应环境,你就会有更多的机会传播后代。你有更多的机会传播后代,你的基因就得到扩张,在所谓的基因池里面就不断增加你的份额。

你的基因的一半来自于父亲,基因的另外一半来自于母亲,除了父母之间的重组交换之外,因为这个东西本来不同的组合会产生不同的个体,还有一个非常重要的东西,就是除了父母之间的重组交换,在每一代里面,这个孩子跟父母之间会有60到100个基因突变,很多人都不知道这60到100个基因突变里面到底是一些什么东西。

以肿瘤细胞为例,肿瘤细胞就像是写程序的黑客一样,只要他写变了,这个程序变成不断扩张,它的适应性比其他细胞都要强,所以他不断的往前走变成了肿瘤。我们去看最后一个肿瘤细胞,其实如果你不断往前追溯,你都可以追溯到受精卵细胞,也就是说,你的生命的起源。个体生命起源就是一个细胞——受精卵细胞,受精卵细胞在不断进行分化和变成一代一代的时候,都会累计各种各样不同的突变。

大数据

生命科学已经不再像以前在简单的在实验室里面做实验,或者是观察科学。从基因开始一直到表型,是一个巨大的海量数据的输入,这些数据的输入需要起码做到一百万人,比如身高,对身高基因的判断,身高显然是遗产,在营养均衡的情况下,显然是遗传,到底跟哪个基因有关系,现在不清楚,需要多少人弄清楚,需要一百万人,如果一百万的基因数据和他的身高数据,我们可以很准确的把他身高给预测出来。

测一百万人要花多少钱呢?我们在1999年做第一个人类基因组计划的时候,花了10亿美金,测一个人的基因图谱序列,2007年测定一个亚洲人基因图谱序列的时候花了三千万人民币。我们在今年6月份,因为我们自己的知识产权,我们可以做到三千块钱人民币,三千块钱可以把一个人的完整基因全部读出来,这个数字还会往下降,降到什么时候可以不要钱呢?五年?三年?还是今年就可以不要钱?事实上真正所谓这件事情的拐点,是在于我们如何能够转化这个数据本身的价值。如果这个数据的价值远大于产生这个数据的成本,测序就会不要钱了。

除了基因的数据之外,还要收集很多别的数据,比如说物联网数据。把所有的这些数据全部都搁在一起,和你基因合在一起的时候,我们才能得到更多答案。而且数据的可视化会成为很大的问题,这些数据都是呈EB级别的数据,怎么让老百姓看懂是非常大的问题,最终还需把基因数据全部连成网络。

人工智能

最后一个可以讲的就是人工智能,我们做了一个尝试,小米是中国饭桌上最常见的食物之一,我们做了几千株的小米,小米有各种各样刚才我讲的大型数据,用人工智能的方法训练,先把所有大数据收集,做人工智能的深度学习,最后到一种什么准确性,可以到任何一株小米。我测一下它的基因,可以准确猜出在这片地里面它长出来什么样,准确性可以达到90%。

一个孩子刚出生的时候,把脐带、胎盘各种各样干细胞存起来,那时候是最好的程序运行的状态,那些可以用来做各种各样的东西,可以用来修复干细胞,修复神经细胞,肌肉细胞,白血病各种各样的东西。

有人说皮肤干细胞保存,岁数大了,也没脐带血了,胎盘也早没了,这个时候还能不能存?越年轻的时候存越好,因为存的细胞是那个时候生命体信息,比如皮肤,皮肤细胞可以用于美容。

脂肪干细胞存起来以后,可以开始我们叫为生命保驾护航了,干细胞的注射、抗衰老,很多东西,抗衰老就是在你老年的时候,运行一个年轻程序,就抗衰老了。

保持健康,应该不是一个感性的意愿,更重要的是理性选择,这种理性选择是基于数据基础之上,基于人工智能的判断,是对基因的了解基础上形成的。

来源:腾讯科技   作者:刘亚澜

为你推荐

四同药品价格治理已基本实现,正建设全国挂网药品价格一览表资讯

四同药品价格治理已基本实现,正建设全国挂网药品价格一览表

目前,我们正在建设全国挂网药品价格一览表,全量汇总展示各地挂网价格信息并对首涨、高涨幅等异常价格行为予以标识,敦促各地持续纠正不合理的挂网高价。

2025-01-18 12:15

关于丙类药品目录,国家医保局最新的思考与规划,2025年发布第一版资讯

关于丙类药品目录,国家医保局最新的思考与规划,2025年发布第一版

丙类目录与每年的基本医保药品目录调整同步开展,计划于今年年内发布第一版。

2025-01-18 11:34

2025年全国80%左右医保统筹地区基本实现即时结算,2026年底全部实现即时结算资讯

2025年全国80%左右医保统筹地区基本实现即时结算,2026年底全部实现即时结算

1月16日,国家医疗保障局办公室正式对外发布《关于推进基本医保基金即时结算改革的通知》。根据通知,以全国统一的医保信息平台为支撑,2025年全国80%左右统筹地区基本实现即时...

2025-01-18 11:20

2024年底,60岁及以上人口3.1亿,占全国人口的22.0%资讯

2024年底,60岁及以上人口3.1亿,占全国人口的22.0%

年末全国人口(包括31个省、自治区、直辖市和现役军人的人口,不包括居住在31个省、自治区、直辖市的港澳台居民和外籍人员)140828万人,比上年末减少139万人。全年出生人口954...

2025-01-17 14:56

赛诺菲荣膺“杰出雇主2025”桂冠,连续五年傲立榜首资讯

赛诺菲荣膺“杰出雇主2025”桂冠,连续五年傲立榜首

作为10多年来首个且唯一连续五年荣获此殊荣的企业,赛诺菲再次彰显了其在企业文化、人才战略、多元发展及员工培养等方面的卓越成就。

2025-01-17 11:02

又一款国产三代EGFR-TKI抑制剂获批上市资讯

又一款国产三代EGFR-TKI抑制剂获批上市

昨日(1月16日),据国家药监局官网显示,奥赛康药业的1类创新药利厄替尼片(limertinib ASK120067,商品名:奥壹新)获批上市,用于治疗既往接受表皮生长因子受体酪氨酸激酶抑制...

2025-01-17 10:31

增辉生命,默沙东中国再度荣膺“中国杰出雇主”资讯

增辉生命,默沙东中国再度荣膺“中国杰出雇主”

1月16日,由全球权威的杰出雇主调研机构(Top Employers Institute)颁布的“杰出雇主2025”榜单正式揭晓

2025-01-16 22:48

CDE:放射性治疗药物申报上市临床风险管理计划技术指导原则资讯

CDE:放射性治疗药物申报上市临床风险管理计划技术指导原则

本指导原则将针对上市后临床风险管理计划、说明书中安全性相关内容、 患者指导手册的撰写提供具体指导意见。

2025-01-16 20:41

全球首款狂犬病双抗药物国内申报上市资讯

全球首款狂犬病双抗药物国内申报上市

日前,据国家药监局药审中心网站显示,智翔金泰的1类新药斯乐韦米单抗在国内申报上市。

2025-01-15 17:02

国家市场监督管理总局发布《医药企业防范商业贿赂风险合规指引》资讯

国家市场监督管理总局发布《医药企业防范商业贿赂风险合规指引》

本指引所称的商业贿赂, 是指采用财物或者其他手段贿赂交易相对方的工作人员、 受交易相对方委托办理相关事务的单位或者个人、 利用职权或者影响力影响交易的单位或者个人,...

2025-01-14 23:38

阿斯利康与宜联生物达成临床研究合作,共同探索联合治疗创新方案资讯

阿斯利康与宜联生物达成临床研究合作,共同探索联合治疗创新方案

双方将共同启动一项多中心、开放性、I Ib期研究,旨在评估两款药物联合治疗在实体肿瘤患者中的安全性、有效性和药代动力学。

2025-01-14 18:36

医疗科技国际化之路:新加坡如何提供全链条支持?资讯

医疗科技国际化之路:新加坡如何提供全链条支持?

随着中国医疗科技领域的快速发展,越来越多的企业具备了国际化发展的能力,正在“走出去”开辟新的市场。

2025-01-14 15:56

NVIDIA与多家行业顶尖机构达成深度合作,共促医疗健康产业蓬勃发展资讯

NVIDIA与多家行业顶尖机构达成深度合作,共促医疗健康产业蓬勃发展

在日前举办的摩根大通医疗健康大会上,NVIDIA 宣布与多家行业领先机构达成合作,这类新的合作旨在通过加速药物发现、提升基因组研究,以及利用代理式和生成式 AI 开创先进医...

2025-01-14 13:26

老牌上市药企终止PD-1项目,计提资产减值准备1.75亿元资讯

老牌上市药企终止PD-1项目,计提资产减值准备1.75亿元

近日,丽珠医药集团发布公告称,对公司及下属子公司截至2024年12月31日合并报表范围内存在减值迹象的资产进行了减值测试,并对其中存在减值迹象的资产相应计提了减值准备。

2025-01-14 10:13

尊享e生2025升级:首次全场景放开外购药械,医院药品覆盖数量再增资讯

尊享e生2025升级:首次全场景放开外购药械,医院药品覆盖数量再增

1月13日,众安保险举办“与10光,共生长”尊享e生十周年产品升级发布会,正式发布尊享e生2025版,并推出众安健康险未来将主打的两大产品系列——面向健康人群的“尊享系列”,以...

2025-01-13 20:17

PLA材料的医美应用:安全与效果的双重考验资讯

PLA材料的医美应用:安全与效果的双重考验

聚乳酸PLA,作为医美行业面部填充剂历经了3个时代大约20多年的发展,大体可分为1 0、2 0、3 0三个不同的时代;即1 0-结晶片状;2 0-普遍表面粗糙的多孔微球或实心微球;3 ...

2025-01-13 19:53

国家医保局:开展2025年定点医药机构违法违规使用医保基金自查自纠工作,肿瘤类、重症医学类、麻醉类、零售药店典型问题清单资讯

国家医保局:开展2025年定点医药机构违法违规使用医保基金自查自纠工作,肿瘤类、重症医学类、麻醉类、零售药店典型问题清单

2025年3月底前,各级医保部门根据本地化问题清单,对辖区内所有定点医疗机构和定点零售药店2023-2024年医保基金使用情况开展自查自纠。2025年4月起,国家医保局将对全国定点医药...

2025-01-13 17:32

全球首个超长效PCSK9单抗获批上市资讯

全球首个超长效PCSK9单抗获批上市

瑞卡西单抗注射间隔可长达8周,突破了目前国内外已获批的PCSK9单抗需要每2周、4周或6周的注射频次。

2025-01-13 13:17

好大夫正式牵手蚂蚁集团,共同推进“AI+医疗”创新资讯

好大夫正式牵手蚂蚁集团,共同推进“AI+医疗”创新

蚂蚁集团收购好大夫在线尘埃落定。1月11日,在2025年好大夫峰会上,双方在收购完成后首度携手亮相。好大夫在线创始人王航现场表示,共同的使命和愿景让双方走到了一起,后续好大...

2025-01-11 18:05

创新给药机制,全球首个口服GLP-1RA诺和忻(司美格鲁肽片)在中国全面上市资讯

创新给药机制,全球首个口服GLP-1RA诺和忻(司美格鲁肽片)在中国全面上市

今日(1月11日),全球领先的生物制药公司诺和诺德宣布,全球首个口服胰高糖素样肽-1受体激动剂(GLP-1RA)——诺和忻®(司美格鲁肽片)在中国全面上市。诺和忻®以便利的口服...

2025-01-11 17:56