“阿尔法狗就这么下出个碾压式的3:0,开发者们也很震惊。”在芝加哥大学就读经济金融双博士的陈宽,早在2011年便在经济领域接触人工智能和深度学习。
“它使原本大家觉得还要几十年才能成熟的技术,成为了现实。”他感叹道,“深度学习效率的提升就像自行车变成了汽车。”
搭着深度学习这列快车,2015年初,陈宽成立推想科技,正式进军医疗行业创业,利用影像识别算法模型,为医生提供辅助诊断方案。
其原理为一部分影像数据作为测试数据,而模型学习剩余部分数据(训练数据),诊断测试数据,生成初级诊断报告,最后与医生正确的诊断报告做对比,得出诊断的准确率。
去年9月,在肺部X光的诊断环境中,最后生成诊断报告与医生的诊断报告匹配率在90%以上。“换一个测试环境,换一家医院的数据,结果可能又不一样。”
目前,推想科技已有的诊断模型数据源涵盖与心肺相关的超10种X光影像,如心影增大、肺部积液、肺炎等。
注: 陈宽已确认文中数据真实无误,铅笔道愿与他一起为内容真实性背书。
脚踏两只船
陈宽刚参加完硅谷的一个创业比赛,台下坐着Reid Hoffman(LinkedIn创始人)等科技圈大拿。第二天,他匆忙飞回芝加哥大学上课,听诺贝尔奖教授James Heckman 讲授计量经济学里的Bias Correction……
彼时,正在芝加哥大学就读经济金融双博士的陈宽,经常徘徊在创业与学术之间,“觉得两个世界差得非常远”。
在做学术之余,他尝试寻找创业机会。“我从高中起,就陆续做过项目,赚过一些小钱。”
2011年,陈宽在经济领域接触到人工智能和深度学习,他感觉这些技术的应用场景可以更加广泛。“人工智能最早应用在金融行业,到2013年,美国超过70%的二级市场交易都是由计算机自动完成的。”
他打算在美国试水。2012年,他和朋友根据Twitter上网民发布的状态数据,建立模型来预测奥巴马和罗姆尼的大选结果。“人工智能和深度学习能最大程度把特定场景中的数据关联性挖掘出来。”
期间,美国很多媒体企业找上门来,愿意花钱购买他们的成果,把数据可视化展现在媒体平台上。
陈宽有些吃惊,“随便做的一个模型,没想到还能赚钱”。他决定继续在里面挖掘机会。此后,一有时间他便参加美国和国内的创业活动。
他常常一个人,一只包,一台MacAir,逮住机会就和别人去聊,展示模型Demo。“我觉得技术背景的人创业,最大的瓶颈是不接地气。陷在小圈子里闭门造车,自己觉得产品很炫酷,推出后可能离市场十万八千里。”
深入了解后,他更倾向于国内市场。“每次放假都跑回来了解形势,觉得国内市场还没那么饱和,机会更多。”
2014年暑假结尾,在深圳的一次闭门会议上,陈宽打开电脑展示一系列算法模型,包括深度学习、人脸识别等。在场的一位放射科医生表示很感兴趣,并提议“这些技术能否做成医疗影像的辅助诊断产品?”
当时,陈宽没太在意。“接触的行业太多了,金融、政府、农业、安保等,一时拿不定主意要应用于哪个行业。”
12月底,他返回美国修完一学期的课程后,再次回国摸索方向。巧合的是,某医院负责信息部门的高层再次提出同样的需求。“两个渠道认识的人,诉求一模一样,这可能是真实存在的需求。”
当时,陈宽距离博士毕业还差一篇论文。回美国完成学业还是立马创业?他曾摇摆不定。
最终,他留了下来。“把深度学习用于医疗影像诊断,既贴近市场需求,又可以持续做研究。”他笑道,“很幸运找到这样的契合点,相当于脚踏两只船。”
2015年年初,陈宽在深圳成立推想科技。
替代医生的重复劳动
影像诊断涉及多种病种,陈宽打算通过调研确定从何处切入。
和医生们打起交道,他觉得国内的放射科医生很苦,早上8点上班,忙到晚上10点还在写诊断报告。“中午和医生聊天,他们一边吃盒饭,一边看片子。”
一个放射科医生可能每天要写300~400份诊断报告。“如果是CT,照一次就200多张影像,要换角度来回看。”
医院基本依靠医生人工诊断,医生要对诊断报告签字负责。他可能到下午疲劳,注意力不集中,片子上的症状看漏了,容易产生误诊。“患者再过几个月来复查,可能就是患症晚期了。”
此外,医生们还要承受科研、资质考试等压力。
放眼整个行业,大多数医院的放射科医生资源稀缺。“深圳一家较大型社区医院,放射科医生不到十位,每天可能面对几百个病人。”
陈宽发现,医生们每天诊断的病症80%以上为常规病,而这些病症相通性高,诊断对于人的依赖性较弱。“其余的疑难杂症,需要医生根据经验联想来诊断。这种非正常状态的东西,再好的机器学习模型也很难模拟出来。”
他决定先从肺炎、肺积液等X光诊断常见病切入,用算法模型来代替医生的重复劳动。“先帮他们解决小问题,让他们有时间解决更难的问题。”
首先,他需要与医院合作,利用医院的影像数据验证技术的可行性。“光有模型不行,还要用海量数据去验证准确率,需要医院有较大的门诊量和足够高的诊断水平。”
但出师不利,他经常被医生扫地出门。“有些医院没听说过这些技术,还有医院采购了国外的辅助诊断设备,但因为准确率低,闲置一旁不使用。”
陈补充道,“包括IBM、R2 Technology均曾高调进入中国市场,但都不成功,很大原因是他们的数据源是基于美国人的,和中国人相差挺多的。”
于是,他一遍一遍给医生灌输技术理念。此外,陈宽找到其它临床科室的医生,各个击破。“医院里使用影像技术的不只放射科,相关部门我都去尝试说服。”
过程中,偶尔碰到反馈较好的医院,陈宽就在附近找个宾馆直接住下,一大早跑去接着聊。
如此,他还是一个人,一只包,奔波半年,跑了近40家医院,最终与几家医院达成合作。因双方签有保密协议,合作医院名字暂不透露。
90%诊断准确率
与医院谈判的同时,陈宽和美国的朋友不断在优化算法模型。“算法从12年起便在优化,但还需要花几个月时间针对医疗行业特点做调整和改变。”
7月,陈宽组建起小型团队,将他们开发出的一组算法模型拿到合作医院做测试。“还没有所谓的界面,只是技术人员能使用的一个程序。”
他把所需的肺部X光影像留一部分作为测试数据,相当于让模型学习剩余部分的影像数据(训练数据),然后诊断测试数据,最后与医生正确的诊断报告做对比。
第一个月,影像数据放进去,却未跑出结果。其中最大的挑战是图像识别的准确率。
陈宽的模型中部分使用的是开源的图像数据库“ImageNet”,其模型是基于低分辨率数据源优化的,识别的准确率能达到97%,而X光影像数据量大且非常高清。
一边是模型,一边是数据,他要在其中寻找平衡点。“一个模型识别的参数超过一亿,如颜色反差、边角、形态等,要在尽量不损耗画质的情况下处理图像。”
除优化算法调整模型外,陈宽还加强了数据清洗、整理功能。
在已有模型的基础上,根据医疗行业的特点,他们需把结果转化为文字报告。
大约两个月后,在肺部X光的诊断环境中,最后生成诊断报告与医生的诊断报告匹配率在90%以上。“换一个测试环境,换一家医院的数据,结果可能又不一样。”
陈宽对结果感到吃惊。“一个月前的诊断基本还是乱猜。”
随后,他带着算法模型去更多医院做测试。“吃喝拉撒睡都在医院,跟医生们打成一片。”
期间,模型会遇到各种问题干扰。比如一部分训练数据跑到测试数据里面,导致结果不准确。“相当于这个病人来了两次医院,这样的模型诊断的不是病变,而是两次的病症相似度。”
针对此情况,陈宽带着团队在测试前先去除相同数据,然后让模型重新学习。
更多时候,团队的精力花费在完善模型上。例如,医生诊断肺炎患者有没有肺部积液,还要考虑其有无家族肺癌病史等其它因素。“不同病症之间的关联性需要不断挖掘,模型随之升级。”
最终,陈宽希望算法模型可转化为产品,帮助医生生成初级诊断报告。“医生如果不满意,可在此基础上做修改;如果满意可直接使用。”
今年2月,陈宽接触到英诺天使基金。过去两年,英诺一直在布局人工智能领域,恰好医疗行业也有所涉猎。基于此,双方很快达成融资意向,推想科技获得英诺天使基金1100万天使轮融资,此外还有部分个人投资者跟进。
目前,推想科技已有的诊断模型涉及数据源涵盖与心肺相关的超10种X光影像,如心影增大、肺部积液、肺炎等。
来源:铅笔道(微信号:pencilnews) 作者:薛婷