2016年8月11日,IBM Watson for Oncology落地中国,这是一个癌症诊断机器人。IBM Watson可以在17秒内,阅读3469本医学专着,248000篇论文,69种治疗方案,61540 次实验数据,106000份临床报告,并根据医生输入的病人指标信息,最终提出优选的个性化治疗方案。
随着技术领域的发展与合并,新的生物医学前沿正在不断交融。一类新兴的学科正在兴起,它横跨人工智能、大数据与医疗领域,收集、归纳所有的健康数据,并经过计算与整合,给出医生以更准确的诊断结果和更完备的治疗方案。
这个学科叫做医疗大数据。
在展开盘点之前,我们先讨论两个“为什么”。
在医疗大数据产业中,近年来的热点无疑是影像数据分析公司。为什么?
第一,影像数据获取更容易。相比于病历数据动辄三五年的时间跨度,影像学数据则只是 “一秒钟”。对于数据公司而言,获得上百万张片子难度不算很大,但是有几十万份完整的结构化的病人病历就不容易了。
第二,影像数据处理难度更小。一份病历要包含的信息至少有病史、病人信息、症状、治疗手段、愈后恢复等方面,而影像学的数据就是一张片子。
第三,影像数据重要。影像检测信息是最直观反映病人病情信息的数据,也是医生确定治疗方案的最直接依据。
在中国,医疗图像智能诊断的需求来得尤为迫切。为什么?
第一,影像科医疗资源在中国非常短缺。
相比发达国家,中国影像科医疗资源短缺严重。一方面,医学影像的阅读需要长时间专业经验的积累,也就是说影像科医生的培养周期相对较长;另一方面,影像科在医院内部地位、收入不高,愿意从事影像学的医生越来越少。
而智能影像检测软件能从效率与精度两个方面改善这样的局面。智能软件可以快速处理片子,甚至比医生更快,还可以减少人为操作的误判率。美国哈佛医学院参与的智能诊断临床试验显示,人工智能辅助医生进行乳腺癌诊断可以将误诊率从 4% 降低到 0.5%。
第二,第三方检测机构在近年的兴起。
第三方检测机构在这里是指独立于医院体系的医学影像中心,比如如上海全景这样的企业。相比于医院内的检测,第三方检测机构的效率更高,可以充分利用社区资源,不牵扯医生利益,是大势所趋。今年全国各省市陆续放开了独立医学影像中心的政策限制,其中江西省行动最快,上半年已经批准了三家独立医学影像中心。
第三方检测机构想要开展影像检测业务,必须取得资质认证,资质认证包括一定级别的器材与人员。而专业人员培训周期长,智能图像诊断的需求就一下子上来了。
盘点了 5 家世界范围内最值得关注的医疗影像数据公司,主要评价标准如下:
数据占有量
针对细分领域前景
创始人背景
临床机构合作情况
以及目前公司业务进展。
其中,我们把 “数据占有量” 放在权重更大的位置上,原因在于:我们认为,系统、广泛的数据库带给数据公司的意义是难以估量的。智能诊断系统把数据库作为训练的样本,训练库越大,得到的诊断建议也就越准确。医学诊断和人种、生活习惯以及基因有很大的相关性,更需要覆盖广泛的数据库才能实现精准诊断。
1. IBM Watson
2016 年 8 月初,利用 IBM Watson 的人工智能系统,日本东京大学的科学家们仅用不到十分钟的时间就诊断出一位六十岁女性患有罕见的白血病。就在几个月前,该女性曾被医院误诊。
Watson 通过对比 2000 万份癌症研究论文,做出了准确的医学诊断,并同时建议了可行的治疗方案。2016 年 8 月 12 日,IBM 宣布 Watson 将登陆中国,与 21 所医院展开合作,为癌症患者提供更精准的个性化服务。
IBM 在人工智能领域深耕多年。早在 2006 年,IBM 就开始了 IBM Watson 的内部试验。《IBM官方认知医疗白皮书》这样描述:“ Watson 可处理大量医学文献、临床资料和病患医疗记录,并对单个病患提出适当的治疗方案,它还可对临床医生的系列问题提供基于证据的答案。通过节省医师的研究时间。”
【企业亮点】
第一,IBM 旗下,技术、资源优势明显。IBM 公司的专利数量惊人,截止今年上半年,获批专利数达到了 3617 项,是同时期 Google 的两倍、苹果的三倍。同时,IBM 还给 Watson 准备了 40 亿美元用于收购,可谓是“别人家的孩子。”
第二,并购企业得来丰厚资源。2015 年 10 月,IBM 宣布以 10 亿美元收购医疗影像分析公司 Merge Healthcare。2016 年 2 月,IBM 又斥资 26 亿美元收购医疗数据公司 Truven Health Analytics。其中,Merge Healthcare 为 IBM 带来了 7500 家包括临床研究机构、大型药厂在内的客户源,以及丰富的医疗图像处理经验。而 Truven Health Analytics 所带来的收益包括 5000 名数据科学家、流行病学家、政策专家和医疗健康咨询师在内的高价值员工,以及诸如美国联邦政府在内的重要客户。
第三,数据量领先。在一系列收购之后,IBM Watson 称其数据库已成为全球最大的非政府医疗健康数据库——包括 1 亿份患者病历,3000 万份影像数据以及 2 亿份保险记录,数据总量超过 60 万 TB,覆盖人数约 3 亿。
值得一提的是,Watson 不仅仅是数据库,人工智能的发展将让它成为一流的癌症专家。自 2012 年起,IBM Watson 已与美国斯隆凯特琳癌症中心开展了四年的合作,共同开发癌症智能诊断项目 Watson Oncology。斯隆凯特琳的癌症专家们训练 Watson 阅读大量的医学报告和论文,帮助 Watson 快速建立起肿瘤学的基础知识储备。Watson 可以整合病人的各项信息,如病史、基因测序结果等到数据库里,与以往病例进行匹配,最终给出诊断结果和个人化的治疗方案。
【面临挑战】
在 IBM Watson 研发的早期,其医学数据来自医学论文、研究报告等,不是实际的临床数据,因此做出的诊断是相对标准化的决策,达不到精准的判断。为此,IBM 大刀阔斧收购 Merge Healthcare、Explorys 等大数据公司,一部分原因就是为了收集高附加值的临床数据,以丰富 Watson 的数据库。
其次,对于人工智能检测是否值得信赖,机器究竟能否代替人类,医学界仍在争论中。IBM 积极推动与医疗机构的合作不仅是为了测试、增强 IBM Watson 的实际功能,也是在培养医疗行业对人工智能的使用习惯。
2. DeepMind
没错,就是创造了 AlphaGo 的那家公司。DeepMind 于 2014 年被 Google 收购,现在,他们已经不满足于仅仅让人工智能来下下棋了,而要将人工智能推向医疗领域。DeepMind 切入的领域,是眼科疾病的早期诊断。
视力问题的诊断往往要借助光学相干断层扫描,即利用散射光生成视网膜的高清 3D 图像来帮助医生诊断。但问题是:
一、有经验的眼科医生所要面临的片子太多,处理起来负荷重,有时难免出现遗漏。
二、对于年轻医生来讲,阅读视网膜图像需要丰富的经验,他们没有能力独自做出诊断。
三、眼部的异常症状有时并不单单是由眼部疾病引起的,如高血压也会引起视网膜和视神经病变,因此需要更多的经验与更为复杂的数据模型。
【企业亮点】
第一,背靠谷歌,资金充沛。DeepMind 在 2014 年被谷歌以 4 亿美元收购。
第二,人才济济。目前 DeepMind 有约 100 名全职员工,顶级学术期刊经常露脸,科研实力甚至不弱于顶尖大学。Google 为了防止竞争对手挖墙脚,官网没有放出完整员工名单,这引得外界纷纷通过 LinkedIn 、博客等工具来揭秘这支神秘的团队。
第三,拥有落地数据源。2016 年,DeepMind 与伦敦的墨菲眼科医院合作,开始进行大数据处理影像数据的尝试。在项目中,DeepMind 的软件将会学习超过一百万份眼部扫描资料,从而帮助医生确诊,并判断相关的早期症状。
如前文所说,眼部的异常症状有时并不单单是由眼部疾病引起的,比如高血压、糖尿病都会引发视觉障碍。根据美国国家糖尿病委员会的报告,糖尿病患者比非糖尿病患者的失明几率高 25 倍。DeepMind 和墨菲眼科医院的合作,可以攻克这个问题,能够发现早期糖尿病在眼部影响会引起哪些异常。
3. DeepCare
作为国内少数几家可以对标 Flatiron、DeepMind 的深度学习大数据公司,成立于 2016 年 1 月的 DeepCare 值得关注。DeepCare 主攻的方向是胸肺部 CT 的智能影像诊断:用大量的胸肺部影像训练深度学习模型,加上患者的年龄、性别、症状和确诊疾病等信息,形成结构化的数据库。
并且,DeepCare 能做到对每一个新录入数据库的病人进行算法自动匹配,寻找出影像数据相似的病人,帮助医生做出更准确的判断。
【企业亮点】
第一,合作医疗机构,数据库庞大。与 Deepmind 类似,目前,DeepCare 已经和北京数家三甲医院展开了合作,用来训练算法的影像数据已经达到了百万张的数量级别。
第二,创始团队优异。创始人及首席科学家丁鹏博士毕业于达特茅斯大学,在深度学习领域有着丰富的科研背景,另一位创始人刘圣本科毕业于伯克利,之前在美国有两次创业的经历。DeepCare 公司目前的员工中还包括多位在人工智能算法领域和临床影像学领域深耕多年的专家。
【面临挑战】
DeepCare 目前面临的主要问题是数据的标注和结构化。现在的医疗影像上是没有对病灶进行标注的,DeepCare 需要组织专业的医生对图像进行系统性的整理和标注,这里面需要大量的人工基础。目前,DeepCare 正致力于将人工流程标准化。
4. Enlitic
让毫无医疗背景的软件工程师们来对专业医生的 X 光片评头论足,并告诉他诊断结果,而医生们开心的接受了。这可能吗?Enlitic 正在把这一幕变成现实。
在 Enlitic 创始人 Jeremy Howard 的 TED 演讲上,他展示了计算机是如何通过深度学习算法对癌症病人的生存率进行预测的。Jeremy Howard 曾担任数据分析竞赛公司 Kaggle 的 CEO,这家公司因组织全世界最大的大数据分析和建模比赛而闻名。
Enlitic 的核心技术是深度学习,即让计算机接受大量的数据训练,具备识别图像、分析图像的能力,再将分析的结果呈现给医生。
“放射科医生都是想象家。” Howard 介绍说:“他们面对二维的图像,要在脑中形成三维的模型,并且对其中微小的细节保持高度敏感。Enlitic 将帮他们做这件事。”
这个工程师让计算机发现了专业医学学者都没有突破的课题,在肿瘤图像的检测中,计算机发现在确诊过程中,肿瘤细胞周围的正常细胞的特征和肿瘤细胞本身一样重要。而在以往,医学上只检测肿瘤细胞。
目前,Enlitic 获得三轮总共 1500 万美元的投资。最近的一次 B 轮融资,是在 2015 年 10月,融资额超过1000 万美元。但 Enlitic 还没有实现盈利。
【企业亮点】
第一,临床试验效果良好。在一项 X 光片诊断对比试验中,Enlitic 与放射科专家团分别读片,并给出诊断。结果,Enlitic 的准确度比专业医生高出 50-70%,而且诊断用时仅是医生的 1/50000。甚至,当骨裂面积小到只占到整张 X 光片 0.1% 时,Enlitic也能准确识别出来。
第二,业内认可。这家成立于 2014 年的公司,在第二年就登上了麻省理工科技评论(MIT Technology Review)“全球 50 家最聪明的公司”榜单,排名 39。
第三,业务模式创新。不再作为医疗工具卖给医院授权给医院,而是参与利润分成。Capital Health 与 Enlitic 之间达成了深度合作,Capital Health 向 Enlitic 提供 X 光片训练数据和专家顾问,而 Enlitic 则提供完整的人工智能解决方案,并参与医院利润分成。
第四,覆盖广泛。目前 Enlitic 覆盖澳大利亚 Capital Health 旗下超过 51 家放射诊所,下一步计划随 Capital Health 拓展亚洲业务进入亚洲市场。
5. Arterys
Arterys 是一家提供 SaaS 服务的创业公司,主营业务是为医疗机构提供更精准的 3D 心血管影像,并提供量化分析。
Arterys 在 2016 年 3 月完成 A 轮融资,共融得 1200 万美元,由 Emergent Medical Partners 和 GE 领投。
【企业亮点】
第一,针对心血管疾病,市场极大。根据统计,心血管疾病是世界范围内的头号杀手。在美国,每年就有约 80 万人死于心血管疾病,占到了死亡总数的三分之一。而中国的情况更为严重——近 3 亿病患,死亡人数超过疾病死亡总数的 40%。
第二,精准,无创的检测技术。Arterys 能够提出提出了方案——无创、精准地得知血流信息:病人只需要花十分钟做一次核磁共振,Arterys 的系统将会把数据送到云端进行处理。之后,通过深度学习的方法,电脑可以对核磁共振影像中的七维信息(空间三维、时间一维、血流方向三维)进行分析,计算出量化的全面的血流信息。
要知道传统的无创检测,诸如心电图、超声心动图、心血管磁共振等都无法得到病人准确的血流信息。而精确的检测方法如冠状动脉造影等则存在一定危险性,并且价格昂贵。
第三,与行业巨头开展深入合作。2015 年,Arterys 公司与 GE 达成战略伙伴关系。作为全球核磁共振仪器的主要提供商,GE 占据了全球 26% 的市场,仅次于西门子。GE 表示,他们将安装 Arterys 系统在最新的核磁共振仪上。
文/深蓝DeeperBlue(微信号 deeperbluetech)
来源:深蓝DeeperBlue(微信号 deeperbluetech) 作者:贺冠华 加辰 房宫一柳