说到医疗人工智能大数据的前景时,我们首先想到的是,这些黑科技准确率达到多少时才会有大规模的应用?
最近一家名为康夫子的公司最新测试结果表示,他们的症状诊断系统针对常见病典型症状的命中率已超过90%,超过某国际顶尖医疗诊所的症状诊断工具(symptom checker)10个百分点。而与此同时,据相关资料显示,国内各类医院的平均误诊率在30%左右。
据此,我们联系到康夫子创始人张超先生。据介绍,从技术原理上来说,其智能诊断是经过3大步骤训练出来的。
知识抽取:类似医生记忆医学知识。医疗AI的首要任务是构建医疗知识图谱进而支撑一系列的应用。知识图谱一直是各大AI公司的必争之地,相比较Google、Baidu等巨头基于Wikipedia、百科等半结构化站点来构建知识图谱,康夫子采取的是基于无结构化文本抽取来构建知识图谱。这因为医学的复杂性导致其知识还存在于教科书籍、论文、科普文章等无结构化文本中。据介绍,康夫子在知识抽取方面有着领先的原创技术:
1.) 他们的系统可以自动从海量文献中学习到书写某种知识的“规律”后进行二次大规模自动抽取;
2.) 设计了一套高性能计算框架来缓解复杂计算。
知识表示:类似医生在积累医疗经验。在得到结构化的医学知识后,康夫子要让这些知识具备推理的能力。这里分为两方面,
1.) 知识向量化表示, 基于深度学习技术,把疾病、症状向量化表示,进而实现一些推理的行为,如患者说“胃不舒服”,系统会交互,是“恶心”、“胃酸”还是“胃胀”。
2.) 知识关系权重表示。很多传统的概率统计模型是建立在独立假设上面的,但实际上这个是不合理的,比如在根据一组症状推导可能疾病时,就必须要考虑到症状之间的演变逻辑。
逻辑应用:类似医生在做问诊服务。受限与医学的复杂性以及知识壁垒,不仅仅是患者,有时候连医生都无法考虑周全。这时候就需要系统能智能交互,分析患者的病情,并进行智能的提问来获取更多的患者特征。
在谈到和传统巨头效果差异上时,张超解释到,传统的诊断学思维在效果上很快就达到了瓶颈,这主要因为:
1.知识规模:传统的诊断学思维大多使用人工编辑的知识库,知识库规模较小,康夫子借助国际领先的信息自动抽取技术,诊断知识条数已超过500万条;
2.知识更新:这里举个例子,大叶性肺炎典型症状是“铁锈色痰”,这条知识是几十年前发现的,并广泛存在于各种临床知识库中,但当今临床案例中,大叶性肺炎往往没有“铁锈色痰”这个症状,原因是,相当比例的患者早期会自行服用抗生素(如:阿莫西林),导致铁锈色痰可以不明显或者不出现; 传统的诊断工具在信息更新上比较滞后,从而导致诊断效果的下降。
3.知识推理:传统的诊断思维大多采用决策树的结构,比如患者主诉“牙疼、咳嗽、头疼”症状,当传统的诊断学看到“牙疼”时,基本就往牙周疾病去诊断了,而康夫子智能诊断可以基于知识库推理出这个“牙疼”是由于感冒引起的,进而给出正确的诊断。
4.知识表示:如果临床工具要做到“接地气”,那么一定得在自然语言处理上面下功夫,让机器能明白用户在描述上的多样性,这一点也是传统诊断工具要攻克的难题。
据介绍,当前康夫子已经学习了近万本医学书籍、2000万篇医学论文,针对近1万多种疾病、数千种症状、化验指标、用药反应等知识构建了知识图谱。
在7月中旬发布的1.0.1版本中,覆盖热门症状5000种,ICD10常见疾病4000种。它针对医生执业考试题中症状诊断部分Top1(推断出的可能患有概率最高的疾病)命中准确率>75%,Top3(推断出的可能患有概率前三的疾病)命中准确率>90%。
在谈到应用场景上,张超介绍,医疗AI的本质是增大医疗资源的供给,因此在医疗资源短缺的场景下,医疗AI会发挥极大的价值。比如:在医生临床辅助决策方面,医疗AI可以辅助社区医生、全科/家庭医生更好地行医;在服务患者方面,会通过一些B端医疗机构提供患者自诊、导诊的服务;同时康夫子还会开放医疗知识图谱去帮助医疗机构去提升他们产品(如HIS系统、智能硬件)的智能化水平。
在临床辅助方面,张超提供一个案例:康夫子有个实习生以主诉“体重下降”、“乏力”去校医院就诊,服用了一些药但一直不见好转。后来去某三甲医院,医生通过发现患者“轻微手抖”而建议去做甲状腺检查,最后确诊为甲亢。我们通过康夫子微信端的Demo可以看到,基于“体重下降”、“乏力”、“手抖”可以准确的给出“甲亢”的可能,如果同时提供“甲状腺素:偏高”这个特征,“甲亢”的可能性会进一步增高。
张超表示,康夫子智能诊断系统可以极大地辅助全科医生来进行诊断,医生需要做的是,聆听患者的病情描述,捕捉有用信息提供给辅助决策系统,最后综合辅助决策系统的结论给出患者治疗方案。
在后期,康夫子计划考虑更多的诊断特征来提升诊断的准确率甚至实现个性化诊断,如,患者群体特征(年龄、性别、时间、地域等等)、患者病史、生活习惯等,让诊断变得更智能。不过,张超表示,智能诊断只是医疗大脑(医学知识图谱+推理逻辑)的一部分。康夫子想以这条线,把很多工作串起来。比如先诊断,再提供治疗建议、用药建议、预后管理等。
据了解,张超曾在新加坡国立大学从事人工智能方向的研究工作,后担任百度自然语言处理部资深研发工程师、文本知识挖掘方向负责人,是知识图谱、实体建模方面专家;CTO张冲毕业与山大计算机系,是前百度高级研发工程师,拥有丰富的架构、工程开发经验;CMO李志朋前地坛医院主治医师,后担任卫计委处长一职,在20余年从业经历中积累了大量的临床经验和医疗资源。
来源:医谷网