近两年来受市场热捧的的大数据概念,时至今日依然炙手可热,在各行业不断地被重复提及,连创业者的商业计划的最终落脚点,也往往和大数据密切关联,只不过大数据被暂时放在未来的长远规划或发展终极目标中。
从最初像发现金子一般,对大数据价值的无比兴奋雀跃,到现在激情退去后,人们开始静心思考,到底如何将庞大的数据转化为有用的信息,实现价值。也许,借助外联设备收集准确可靠的数据已非难事,但将数据分析后形成标准化信息,真正为各行业服务,仍是一条艰辛且充满挑战的发展道路。
在医疗行业,最引人注明的莫过于基因行业以及健康大数据。伴随着2000年以前,以IIIumina、赛默飞(Thermo Fisher Scientifitc)、罗氏(Roche)为代表的高端基因测序与分析设备制造商,在基因行业的率先崛起,生物基因组测序随即敞开大门。
首先是在科研领域的大肆兴起:测序某物种的全基因组,结合生物信息学,比对不同物种基因组序列,解读基因组信息,发现变异基因与挖掘功能基因、构建遗传图谱、研究群体进化、进行全基因组的关联分析,为临床应用或基础研究提供坚实的理论基础。其中,最着名的实例即1990年正式启动的人类基因组计划,由美、英、法、德、日和中国共六国科学家,花费38亿美元、耗时10余年,完成人类基因组草图的绘制工作。
2003年,在有了人的单个基因组序列后,科学家发现还不足以破解人类自身与疾病机理的奥秘,于是产生了以人基因组序列做参考,比对其他生物与病种基因的多样本测序思路。之后美国国家基因组研究院提出把全基因组测序降至1000美元,从而引发了基因行业内各家测序技术的激烈角逐,测序成本不断降低,基因测序技术最终得到突飞猛进的发展。
纵观基因行业整个产业链的上下游,从为收集数据创造条件的设备耗材供应商,如IIIumina、Roche、Life Tech等,到国内中游企业的测序服务机构,如华大基因、药明康德、诺禾致源等,再到下游的生物信息分析企业,以提供大数据云端存储、解读与共享服务为主,最终流向基因检测产品的供应终端。简单说,形成了从设备到大数据到应用的完整产业链条。
注:该图摘自罗奇斌在网易未来科技峰会上的演讲PPT
如果说产业上游的测序设备与耗材已经被国际寡头所垄断,那么基因分析解读与产品提供的下游与终端市场,依然是一片广阔的蓝海。
定位下游,连接中游和终端
专注于基因数据分析的北京奇云诺德就是为数不多的公司之一。在2015网易未来科技峰会上,奇云诺德CEO罗奇斌概括出,国内产业中游的第三方测序服务供应商大于100多家,终端基因检测产品提供商也大于100多家。然而处于中游和终端之间的下游企业,却屈指可数,除了奇云诺德,在国内有基云惠康、聚道科技、L3等创新公司,国外有Seven Bridges Genomics、Foundation Medicine、GeneDock、DNA Nexus等。
为什么出现这样的分布格局呢?罗奇斌告诉动脉网,首先基因行业的特殊性决定了,企业的生存与发展不是拼用户、拼销售量,而是基于技术创新,技术能决定企业从红海到蓝海能切多深,也决定了企业向上下游延伸的广度范围。不难发现,基因行业的领导者大部分是博士,高学位行业表明企业发展的指标将转移为技术创新能力。所以这样的高门槛,让基因数据分析的下游企业不可能大规模产生。
至于终端基因检测产品公司的相对盛产,罗奇斌认为这些公司大都聚集于基因检测预防领域,因为相比诊断类企业需要历经卫计委和CFDA的双重审批,以解读基因检测报告为指导的健康预防类项目较容易展开。此外也因为行业发展初期,所以乱象丛生不可避免。
可以看出,技术门槛相对较高,将限制更多企业参与,也限制行业发展。为打破困境僵局,2014年10月,罗奇斌成立了北京奇云诺德信息科技有限公司(以下简称奇云诺德),想通过为终端企业提供各种生物信息解决方案,包括方案设计、流程构建、云端计算上提供一体化服务,飞跃式提高企业技术纵深能力,并帮助终端企业连接中游企业,打通产业链,让欲跨行的传统企业或有意拓展基因产品业务的公司实现迅速的轻快转型。
在奇云诺德构建的一站式生物信息大数据平台上,有为科研和医疗领域用户提供的一系列大数据产品,包括基因数据发动机、大数据挖掘软件、数据可视化工具以及订制化流程。不论客户关注的领域是人类疾病研究、动植物基因组或者微生物基因组,奇云诺德都将基因研究全面覆盖。
客户只需提供项目的设计需求以及实验样品,奇云诺德就能在云端实现自动化运算,生成自动化的工作流程和项目管理,为客户选择最优化的一体式生物信息解决方案。目前,和奇云诺德合作,参与研究的机构有中科院北京基因研究所、清华大学医院和德国Biomax生物信息公司。所以全面的生物信息分析应用,结合灵活、可定制的数据分析解决方案,最后以可交互、可视化的操作界面,向客户呈现最终的产品原型。
奇云诺德除了自主研发生物信息应用与解决方案,还构建了生物信息电商平台,让行业中所有的生物信息专家将其自行开发的应用和流程部署到生物信息大数据平台上。罗奇斌告诉动脉网,在奇云诺德的帮助下,未来会出现越来越多的基因检测公司,以及更多更好的基因产品。
“奇云诺德做的事情就是将产品生产的成本降低,通过生物信息大数据平台,以及平台上数据分析的搜索引擎,让传统生物公司迅速找寻到合作伙伴,快速建立企业联系,可能过去一种产品,五个人要研发一年,现在一个人研发一星期就出来了。”罗奇斌说。
将量化的生命,再深入细化
原华大基因的王俊曾提出生命是可以量化的,而奇云诺德就将量化的数据进行深入的细化。罗奇斌在大会上展示了他将大健康数据分为四大类:基因数据、医疗数据、环境数据和行为数据,分别占比20%,10%,20%和50%。行为数据的比例最大,为50%,比如人每天花5分钟时间上楼梯,而不是坐电梯,就属于行为数据,而目前很多的可穿戴设备就在记录人体的行为数据,未来物联网主要针对的就是健康和疾病预防类的数据,而非医疗类数据。
注:该图摘自罗奇斌在网易未来科技峰会上的演讲PPT
奇云诺德的旗下还有基因空间的业务,这和罗奇斌的科学博客名字完全相同。他告诉动脉网,基因空间目前在做一件事情,就是排行,将基因行业的企业、产品、人物和资讯全部做一排行。因为现在信息冗杂,又过于零散,他想将所有信息进行汇总,筛选出最有价值的信息。比如,搜集每一条资讯在各大网站平台的阅读量和关注度,通过数学模型算出排行,所以用户只需要关注基因空间排名靠前的精选资讯就够了,因为那一定是最具代表性、最有意义的新鲜内容。按照同样逻辑,用人工智能方法,或机器学习方法分析企业业务数据,作出行业排名。通过将碎片化的资源整合到平台,基因空间帮助企业进行技术和产品的无缝对接。
针对基因数据,如何实现由数据转化为信息?罗奇斌举了将基因数据指导药物研发的案例。2015年,美国奥巴马提出重点发展精准医疗,中国也于今年3月提出启动精准医疗计划 ,预计在2030年前投入600亿元。这对于传统药企来说,绝对是巨大的政策利好,由此也形成药企加大个性化药物的研发投入,由生产化学药逐渐向靶向药过渡的趋势。
但药物研发行业的普遍特点是大投入、高风险与高收益,奇云诺德为此已建立专业的数据库,避免药企重头做起,不仅节省研发时间,也减少研发投入,降低风险的同时,获得更高的投入产出比。目前,奇云诺德的数据库涵盖了100多种单基因病、30多种重要癌症肿瘤、重大心血管疾病、慢性疾病、疾病诊断标志基因、疾病预后标志基因、药物标志基因等医疗疾病和基因数据,具有标准化数据格式、数据加密、异地备份、多维度数据采集、实时更新与全部数据人工审阅的众多特点。
预测先机,提前布局
罗奇斌认为,由数据库形成信息库,由信息库转化为知识库,再从知识库中提炼出对企业有价值的内容,实现知识向产品的成果转化。而实际上,在这个过程中,产品转化的速度缓慢与效率低下,已成为制约行业发展的关键性瓶颈了。
“中国的产业转化率与科技转化率为10%,而美国是40%,欧洲发达国家转化率都是30%~40%,可见中国还有很大的增长空间。”罗奇斌介绍。奇云诺德的目标,就是解决技术服务产品化,提高产品的转化速度。
为了培养更多合格的基因行业的产品经理,罗奇斌发起了基因黑客训练营活动。他曾表示,基因行业缺乏正规的产品经理培训机构,奇云诺德就想以公益的方式建立起培养体系,弥补行业空白。
山寨当道的中国不缺技术,但缺包装设计后的产品,罗奇斌表示,一个产品经理和一个技术工程师差别非常大,中国大部分人关注于技术,却鲜有国际化的产品,所以产品经理将是中国下一步最稀缺的人才。奇云诺德就是要提前培养人才,他表示基因黑客训练营目前在MVP的阶段,希望能够建立起标准化的训练体系,这样未来就能实现每月输送出上百名产品经理了。可见,奇云诺德利用技术工具将大数据变为小数据,将小数据变为有价值的信息,将有价值的信息抽取出来变为知识,让知识流动起来产生价值,罗奇斌认为做到这些还不够,还要亲自为企业培养能将知识转化为最终产品的人才,闭合最后的一环。
其实,罗奇斌的远见意识不仅体现在人才的储备上,可以说奇云诺德从一开始就在下一盘深谋远虑的大棋局。
虽然现在针对个人的基因测序还未形成气候,但随着测序成本的不断降低,累积的基因数据将不断攀升,基因数据的大规模爆发与产出将是迟早的事,而一旦开始出现个人基因测序的苗头,正如燎原的星星之火一样,会很快以指数级爆发出洪量数据,可能也就几个月的时间,如果到那时再梳理数据,归纳信息,一定为时已晚,没有技术储备的中国,可能马上会陷入信息化混乱时代。
“我们预料三年内就会进入基因数据的信息化时代,所以现在就要提前5年开始布局。”罗奇斌说。
罗奇斌 介绍
《互联网+》丛书联合作者和《互联网+基因空间》主编。中信出版社《互联网+医疗》联合作者。贝壳社BioMan成员。基因空间微信公众号和基因世界APP的内容主编,同时担任国内多家知名生物科技网站专栏作者。曾在中科院北京基因组研究所从事项目研发工作,担任过易科学生物信息学顾问以及“和君医药医疗健康沙龙”专家委员会委员。中国康复技术转化及发展促进会成员。
2004年汕头大学毕业进入基因行业。2007年获得浙江大学沃森研究院生物信息学硕士学位,同年进入中科院基因组研究所(华大基因前身)从事生物信息算法应用研究。2008年赴慕尼黑工业大学生物信息学系攻读博士学位,专注于二代测序技术和互作网络在基因数据中的应用,至今在基因领域的国际期刊上合作发表论文7篇。2014年离开中科院创办奇云生物 (QY Genomics)和奇云诺德 (QY NODE)。(动脉网vcbeat)
来源:动脉网 作者:张楠