“阿尔法狗就这么下出个碾压式的3:0,开发者们也很震惊。”在芝加哥大学就读经济金融双博士的陈宽,早在2011年便在经济领域接触人工智能和深度学习。
“它使原本大家觉得还要几十年才能成熟的技术,成为了现实。”他感叹道,“深度学习效率的提升就像自行车变成了汽车。”
搭着深度学习这列快车,2015年初,陈宽成立推想科技,正式进军医疗行业创业,利用影像识别算法模型,为医生提供辅助诊断方案。
其原理为一部分影像数据作为测试数据,而模型学习剩余部分数据(训练数据),诊断测试数据,生成初级诊断报告,最后与医生正确的诊断报告做对比,得出诊断的准确率。
去年9月,在肺部X光的诊断环境中,最后生成诊断报告与医生的诊断报告匹配率在90%以上。“换一个测试环境,换一家医院的数据,结果可能又不一样。”
目前,推想科技已有的诊断模型数据源涵盖与心肺相关的超10种X光影像,如心影增大、肺部积液、肺炎等。
注: 陈宽已确认文中数据真实无误,铅笔道愿与他一起为内容真实性背书。
脚踏两只船
陈宽刚参加完硅谷的一个创业比赛,台下坐着Reid Hoffman(LinkedIn创始人)等科技圈大拿。第二天,他匆忙飞回芝加哥大学上课,听诺贝尔奖教授James Heckman 讲授计量经济学里的Bias Correction……
彼时,正在芝加哥大学就读经济金融双博士的陈宽,经常徘徊在创业与学术之间,“觉得两个世界差得非常远”。
在做学术之余,他尝试寻找创业机会。“我从高中起,就陆续做过项目,赚过一些小钱。”
2011年,陈宽在经济领域接触到人工智能和深度学习,他感觉这些技术的应用场景可以更加广泛。“人工智能最早应用在金融行业,到2013年,美国超过70%的二级市场交易都是由计算机自动完成的。”
他打算在美国试水。2012年,他和朋友根据Twitter上网民发布的状态数据,建立模型来预测奥巴马和罗姆尼的大选结果。“人工智能和深度学习能最大程度把特定场景中的数据关联性挖掘出来。”
期间,美国很多媒体企业找上门来,愿意花钱购买他们的成果,把数据可视化展现在媒体平台上。
陈宽有些吃惊,“随便做的一个模型,没想到还能赚钱”。他决定继续在里面挖掘机会。此后,一有时间他便参加美国和国内的创业活动。
他常常一个人,一只包,一台MacAir,逮住机会就和别人去聊,展示模型Demo。“我觉得技术背景的人创业,最大的瓶颈是不接地气。陷在小圈子里闭门造车,自己觉得产品很炫酷,推出后可能离市场十万八千里。”
深入了解后,他更倾向于国内市场。“每次放假都跑回来了解形势,觉得国内市场还没那么饱和,机会更多。”
2014年暑假结尾,在深圳的一次闭门会议上,陈宽打开电脑展示一系列算法模型,包括深度学习、人脸识别等。在场的一位放射科医生表示很感兴趣,并提议“这些技术能否做成医疗影像的辅助诊断产品?”
当时,陈宽没太在意。“接触的行业太多了,金融、政府、农业、安保等,一时拿不定主意要应用于哪个行业。”
12月底,他返回美国修完一学期的课程后,再次回国摸索方向。巧合的是,某医院负责信息部门的高层再次提出同样的需求。“两个渠道认识的人,诉求一模一样,这可能是真实存在的需求。”
当时,陈宽距离博士毕业还差一篇论文。回美国完成学业还是立马创业?他曾摇摆不定。
最终,他留了下来。“把深度学习用于医疗影像诊断,既贴近市场需求,又可以持续做研究。”他笑道,“很幸运找到这样的契合点,相当于脚踏两只船。”
2015年年初,陈宽在深圳成立推想科技。
替代医生的重复劳动
影像诊断涉及多种病种,陈宽打算通过调研确定从何处切入。
和医生们打起交道,他觉得国内的放射科医生很苦,早上8点上班,忙到晚上10点还在写诊断报告。“中午和医生聊天,他们一边吃盒饭,一边看片子。”
一个放射科医生可能每天要写300~400份诊断报告。“如果是CT,照一次就200多张影像,要换角度来回看。”
医院基本依靠医生人工诊断,医生要对诊断报告签字负责。他可能到下午疲劳,注意力不集中,片子上的症状看漏了,容易产生误诊。“患者再过几个月来复查,可能就是患症晚期了。”
此外,医生们还要承受科研、资质考试等压力。
放眼整个行业,大多数医院的放射科医生资源稀缺。“深圳一家较大型社区医院,放射科医生不到十位,每天可能面对几百个病人。”
陈宽发现,医生们每天诊断的病症80%以上为常规病,而这些病症相通性高,诊断对于人的依赖性较弱。“其余的疑难杂症,需要医生根据经验联想来诊断。这种非正常状态的东西,再好的机器学习模型也很难模拟出来。”
他决定先从肺炎、肺积液等X光诊断常见病切入,用算法模型来代替医生的重复劳动。“先帮他们解决小问题,让他们有时间解决更难的问题。”
首先,他需要与医院合作,利用医院的影像数据验证技术的可行性。“光有模型不行,还要用海量数据去验证准确率,需要医院有较大的门诊量和足够高的诊断水平。”
但出师不利,他经常被医生扫地出门。“有些医院没听说过这些技术,还有医院采购了国外的辅助诊断设备,但因为准确率低,闲置一旁不使用。”
陈补充道,“包括IBM、R2 Technology均曾高调进入中国市场,但都不成功,很大原因是他们的数据源是基于美国人的,和中国人相差挺多的。”
于是,他一遍一遍给医生灌输技术理念。此外,陈宽找到其它临床科室的医生,各个击破。“医院里使用影像技术的不只放射科,相关部门我都去尝试说服。”
过程中,偶尔碰到反馈较好的医院,陈宽就在附近找个宾馆直接住下,一大早跑去接着聊。
如此,他还是一个人,一只包,奔波半年,跑了近40家医院,最终与几家医院达成合作。因双方签有保密协议,合作医院名字暂不透露。
90%诊断准确率
与医院谈判的同时,陈宽和美国的朋友不断在优化算法模型。“算法从12年起便在优化,但还需要花几个月时间针对医疗行业特点做调整和改变。”
7月,陈宽组建起小型团队,将他们开发出的一组算法模型拿到合作医院做测试。“还没有所谓的界面,只是技术人员能使用的一个程序。”
他把所需的肺部X光影像留一部分作为测试数据,相当于让模型学习剩余部分的影像数据(训练数据),然后诊断测试数据,最后与医生正确的诊断报告做对比。
第一个月,影像数据放进去,却未跑出结果。其中最大的挑战是图像识别的准确率。
陈宽的模型中部分使用的是开源的图像数据库“ImageNet”,其模型是基于低分辨率数据源优化的,识别的准确率能达到97%,而X光影像数据量大且非常高清。
一边是模型,一边是数据,他要在其中寻找平衡点。“一个模型识别的参数超过一亿,如颜色反差、边角、形态等,要在尽量不损耗画质的情况下处理图像。”
除优化算法调整模型外,陈宽还加强了数据清洗、整理功能。
在已有模型的基础上,根据医疗行业的特点,他们需把结果转化为文字报告。
大约两个月后,在肺部X光的诊断环境中,最后生成诊断报告与医生的诊断报告匹配率在90%以上。“换一个测试环境,换一家医院的数据,结果可能又不一样。”
陈宽对结果感到吃惊。“一个月前的诊断基本还是乱猜。”
随后,他带着算法模型去更多医院做测试。“吃喝拉撒睡都在医院,跟医生们打成一片。”
期间,模型会遇到各种问题干扰。比如一部分训练数据跑到测试数据里面,导致结果不准确。“相当于这个病人来了两次医院,这样的模型诊断的不是病变,而是两次的病症相似度。”
针对此情况,陈宽带着团队在测试前先去除相同数据,然后让模型重新学习。
更多时候,团队的精力花费在完善模型上。例如,医生诊断肺炎患者有没有肺部积液,还要考虑其有无家族肺癌病史等其它因素。“不同病症之间的关联性需要不断挖掘,模型随之升级。”
最终,陈宽希望算法模型可转化为产品,帮助医生生成初级诊断报告。“医生如果不满意,可在此基础上做修改;如果满意可直接使用。”
今年2月,陈宽接触到英诺天使基金。过去两年,英诺一直在布局人工智能领域,恰好医疗行业也有所涉猎。基于此,双方很快达成融资意向,推想科技获得英诺天使基金1100万天使轮融资,此外还有部分个人投资者跟进。
目前,推想科技已有的诊断模型涉及数据源涵盖与心肺相关的超10种X光影像,如心影增大、肺部积液、肺炎等。
来源:铅笔道(微信号:pencilnews) 作者:薛婷
为你推荐

华东医药2025年一季度业绩出炉,创新产品持续发力
2025年第一季度内公司实现营业收入107 36亿元,同比增长3 12%;实现归属于上市公司股东的净利润9 15亿元,同比增长6 06%;实现扣非归母净利润8 97亿元,达到历史最好水平,同比增长7 04%。
2025-04-24 21:53

医药如何数智化?医药工业数智化转型实施方案(2025—2030年)发布
研发推广一批智能制药设备、检测设备,开发一批“小快轻准”医药工业软件或系统。支持创建医药工业数智技术应用验证与中试平台,集成推进共性技术攻关、软硬件适配验证测试、计...
2025-04-24 18:26

全球顶尖专家共话尿路上皮癌诊疗领域的新突破——第三届泌尿肿瘤临床研究大会会后会成功举办
2025年4月24日,北京——,“第三届泌尿肿瘤临床研究大会会后会”在北京成功举办。本次会议以“全球专家共话尿路上皮癌”为主题,汇聚了来自中外的顶尖泌尿肿瘤专家,围绕尿路上...
2025-04-24 16:26

全国预防接种日:“健康中国家,疫苗护万家”健康社区“免疫行动”促进计划启动
由新华网主办,中国医药卫生文化协会疫苗与健康分会、《中国社区医师》杂志联合支持的“健康中国家,疫苗护万家——健康社区‘免疫行动’促进计划”于4月23日在北京正式启动。
2025-04-24 14:07

带状疱疹疫苗“遇冷”,百克生物2024年净利润腰斩
近日,国内疫苗龙头企业百克生物发布2024年年报,数据显示,其报告期内实现营收12 29亿元,同比下降32 64%;归属于上市公司股东的净利润2 32亿元,同比下降53 67%。对于营收...
2025-04-23 12:59

重庆常用药联盟接续集采中选结果
近日,重庆常用药联盟接续集采中选情况公布,该联盟由重庆牵头,联合湖北、广西、海南、贵州、云南、青海、宁夏、新疆及新疆生产建设兵团等十省(区、市)开展的药品集中带量采...
2025-04-21 18:48

全周期智控慢病,诺和诺德与京东健康开启战略合作
2025年4月21日,全球领先的生物制药公司诺和诺德与京东健康在北京正式签署战略合作协议,标志着双方在糖尿病和体重管理领域的合作进入新阶段。依托诺和诺德百年深耕慢病领域的专...
2025-04-21 15:57

康方生物1类新药依若奇单抗上市申请获批,用于中重度斑块状银屑病成人患者
该药是我国第一个且唯一获批上市的IL-12 IL-23“双靶向”单克隆抗体新药,是康方生物自身免疫性疾病领域首个获批上市的一类新药。
2025-04-21 13:39

阿斯利康乳腺癌1类创新药卡匹色替片中国获批
该药适用于联合氟维司群用于转移性阶段至少接受过一种内分泌治疗后疾病进展,或在辅助治疗期间或完成辅助治疗后12个月内复发的激素受体(HR)阳性、人表皮生长因子受体2(HER2)...
2025-04-21 11:02

辉瑞宣布终止一款口服GLP-1减肥药的临床开发
近日,辉瑞在其官网宣布,决定终止开发口服胰高血糖素样肽-1受体(GLP-1R)激动剂Danuglipron(PF-06882961),原因系在一项有关用药剂量的临床试验中,一名患者出现了可能由该...
2025-04-21 10:29

福建省医保局印发单列门诊统筹支付医保药品目录(2024年版)
根据2024年6月发布的《福建省医保药品单列门诊统筹支付管理办法(试行)》,为了让参保患者无需住院、在门诊就医也能用上国家谈判药品、享受医保待遇,将适用于门诊治疗、使用周...
2025-04-20 13:34