语音识别在医疗领域要跨过的那些坎儿

医疗健康 来源:健康界
2014
06/16
12:49
健康界 医疗健康

语音识别即通过麦克风捕捉用户发出的声音,将声波信号转换成机器可以处理的“发音特征”,再从发音和语言的“模型空间”中快速搜索最匹配的句子,即识别结果。语音识别过程就是一个模型匹配的过程,模型训练的好坏直接关系到系统识别的结果。

为了得到一个好的模型,往往需要有大量的原始语音数据来进行训练,特别是对于非特定人的语音识别系统来说,这一点显得更为重要。因此,在开始进行语音识别研究之前,首先要建立一个语音数据库。数据库包括不同性别、年龄、口音的说话人的声音,并且必须具有代表性,能均衡地反映实际使用情况。模型训练就是指按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参数。

目前在医学领域并没有专门的语音识别词库和模型。由于医学术语、药物名称、疾病名称等用词的专业性很强,识别率会大幅下降。我带领团队花费了7个月的时间,分别于iOS平台和Android平台,采用科大讯飞和云之声两个主流第三方SDK,对药品词库的36176个药品名称和疾病词库的23501个疾病名进行了测试,训练出错率较高的词汇,初步搭建了医学语音识别领域的第三方素材库,并决定免费开放给任何有志于开发移动医疗APP的创业团队和个人。

下面以Android为例,具体介绍我们构建体系的流程、标准和测试方法,以帮助各位移动医疗开发人员快速上手:

测试平台:2台android4.0系统手机(小米2、中兴U930HD)、珍立拍系统、科大讯飞SDK

小    组: A组和B组

测试方法:对所有药品和疾病名称进行反复测试,使用纠正训练法,来克服语音识别体系中HMM的训练效果。小组A测试药品,小组B测试疾病,普通话识别。

测试步骤:

1. 医学词汇约有数十万条,前期总结查找筛选最常用词汇并分组。

2. 使用珍立拍系统中的语音识别对所有词库进行第一遍测试。

3. 在第一遍测试的基础上,对筛选出来错误的词汇进行二次测试,再次筛选。

4. 总结出识别易错词汇,两组交叉测试后,随后交给程序人员,按科大讯飞SDK模型训练,输入相应代码,完善建库。

可能存在的影响因素:

1.  读错:由于医学词汇中有很多较为生僻的汉字,读错很难避免,很多医生即使会写这个词,但是发音也可能会错。

规避方法:遇到拿捏不准的汉字时,查找准确读音,尽量避免错误。

2. 环境因素:测试时,所处的环境存在噪音。

规避方法:选择在低噪音环境中测试,但不能完全于安静的环境中测试,因其与日常使用环境不符。

3. 汉字的同音字:例如“弱视”“荨麻疹”,识别结果“若是”“寻麻疹”。

4. 汉字尾音:例如“肝癌”,识别结果为“刚来”。

5. 实际发音影响:例如“阻生齿”,识别结果“主生殖”。

下面以疾病词汇举例:

测试小结:

由统计结果可以看出,疾病名的识别率高于药品名。笔者分析,造成此结果的原因在于,疾病名的广普率要高于药品名,所以各个语音识别公司比较重视,而且疾病生僻汉字较少,而药品种类要远多于疾病种类,其中生僻汉字也较多。二次测试的正确率较一次测试大约提升了一个百分点左右,还是可以适当减少错误数据库中的词汇量。

音节短的词出错率较高,如:单音节词,痣(识别结果“志”),双音节词,义眼(识别结果“一眼”),长音节词出错率低,原因可能是音节越短的词,其同音节的普通词较其更常见,而且如果其尾音特殊的话,影响较大。

针对医学专业词汇识别率低的问题,目前可使用以下三种解决办法:

一、  扩充自定义词库

虽然有用户词表,但是目前科大讯飞用户词表仅限数量2000,经沟通后他们正在扩大词汇表数量中。但如果数据过大,将会导致数据包过重的问题,而移动端由于存储和运算能力受限,所以无法满足数量庞大的整个医学词库,因此我们只能先做常用库。

二、  搭建第三方素材库

语音识别虽然在实用性上已得到很大提高,但是由于目前语音识别的单一性(只能单纯的识别中文或者英文),以及使用环境、语音差异化等因素的影响,容易造成识别错误。就这些因素而言,我们为此做了大量的基础工作,用于搭建第三方数据库,在尽可能排除其它干扰因素的情况下,检测出识别错误的词汇,也为下一步构建专业领域的识别模型搭建出了样本数据库(针对大量样本数据库,精简出识别错误的小样本数据库,减少模型训练词库)。

三、  构建专业领域的识别模型

对于有大量专业词汇的识别系统来说,使用模型训练可以有效提升识别率,目前模型训练比较常用的有四种方法:最大似然估计、纠正训练法、最小分类错误、最大互信息方法。模型训练需要专业的技术,并与语音识别公司进行合作,由企业提供词库信息和语音集,专业人员采用模型训练对需要识别的词库进行训练,最终给出个性化定制的识别模型,以提升识别率。

语音识别技术在移动医疗领域中的应用会越来越普遍,但还有大量的基础工作需要我们大家齐心协力去完成。希望业内的精英之士能够对此多交流,多合作,抛开一些利益的纠葛,共同为行业的发展贡献出自己的力量。


来源:健康界

为你推荐

湖北医保局发布全国首个脑机接口医疗服务价格资讯

湖北医保局发布全国首个脑机接口医疗服务价格

侵入式脑机接口置入费为6552元 次,侵入式脑机接口取出费为3139元 次,非侵入式脑机接口适配费为966元 次

2025-04-03 09:37

悦唯医疗完成近亿元A++轮投资,加速重症冠心病诊疗全流程创新器械研发与国产替代资讯

悦唯医疗完成近亿元A++轮投资,加速重症冠心病诊疗全流程创新器械研发与国产替代

此次融资将主要用于深化冠心病诊疗全流程创新器械和脉动式左心室辅助系统等新产品的研发,以及加速已获准上市的心脏稳定器等产品的市场推广。

2025-04-03 09:28

海尔盈康一生启动孤独症儿童关爱行动,创新罕见病可持续公益新生态资讯

海尔盈康一生启动孤独症儿童关爱行动,创新罕见病可持续公益新生态

本次活动聚焦孤独症儿童的诊疗,探讨交流AI赋能全流程防治康体系创新、前沿性生物科技诊疗技术等话题,旨在通过生态联盟的力量推动医学研究、科技创新与人文关怀的融合,让“星...

2025-04-03 09:11

诺华创新药物飞赫达®(盐酸伊普可泮胶囊)C3G适应症在中国获批资讯

诺华创新药物飞赫达®(盐酸伊普可泮胶囊)C3G适应症在中国获批

首款且唯一选择性靶向C3G病因药物,填补临床治疗空白

2025-04-02 18:14

国家卫健委:商业化人源细胞系是否纳入人类遗传监管?资讯

国家卫健委:商业化人源细胞系是否纳入人类遗传监管?

4月1日,国家卫健委科教司发布《人类遗传资源管理有关问题解答之一》。

2025-04-02 17:49

《NPJ digital medicine》刊发李冬梅教授团队成果:AI赋能高效识别眼睑肿物资讯

《NPJ digital medicine》刊发李冬梅教授团队成果:AI赋能高效识别眼睑肿物

亚太眼整形外科学会主席、中华医学会眼科分会眼整形眼眶病学组副组长李冬梅教授团队携手爱尔数字眼科研究所,在《NPJ digital medicine》(影响因子:12 4)学术期刊发表团队...

文/李林 2025-04-02 10:27

角膜移植点燃生命之光,爱尔眼科致敬全国角膜器官捐献者资讯

角膜移植点燃生命之光,爱尔眼科致敬全国角膜器官捐献者

角膜病是我国第二大致盲眼病

文/屈慧莹 2025-04-02 09:36

千亿GLP-1市场再添重磅产品,华东医药司美格鲁肽注射液国内上市申请获受理资讯

千亿GLP-1市场再添重磅产品,华东医药司美格鲁肽注射液国内上市申请获受理

本次申报适应症为成人2型糖尿病患者的血糖控制

2025-04-01 17:34

默克全球执行副总裁周虹:合作与创新是默克未来五年战略的两大关键词资讯

默克全球执行副总裁周虹:合作与创新是默克未来五年战略的两大关键词

近日,德国默克医药健康全球执行副总裁、中国及国际市场负责人周虹带领医药健康中国及国际市场管理团队开启了2025年度首次“中国行”。

2025-04-01 17:11

首个且唯一,阿斯利康PD-L1单抗获FDA批准治疗肌层浸润性膀胱癌资讯

首个且唯一,阿斯利康PD-L1单抗获FDA批准治疗肌层浸润性膀胱癌

度伐利尤单抗联合吉西他滨和顺铂作为新辅助治疗,随后度伐利尤单抗作为根治性膀胱切除术后的辅助单药治疗,用于治疗肌层浸润性膀胱癌成年患者。

2025-04-01 14:37

全国首个,湖北为脑机接口医疗服务定价资讯

全国首个,湖北为脑机接口医疗服务定价

昨日(3月31日),据“湖北发布”消息,湖北省医保局发布全国首个脑机接口医疗服务价格,其中,侵入式脑机接口置入费6552元 次,侵入式脑机接口取出费3139元 次,非侵入式脑机...

2025-04-01 11:03

一款国产创新流感药,获批资讯

一款国产创新流感药,获批

近日,据国家药监局官网信息显示,青峰医药下属子公司江西科睿药自主研发的1类创新药玛舒拉沙韦片(商品名:伊速达)正式获批上市,用于既往健康的12岁及以上青少年和成人单纯性...

2025-04-01 10:22

26省联盟药品集采启动,聚焦妇科用药和造影剂资讯

26省联盟药品集采启动,聚焦妇科用药和造影剂

近日,山西省药械集中招标采购中心发布《关于做好二十六省联盟药品集中带量采购品种数据填报工作的通知》,开展相关采购数据填报工作。

2025-03-31 21:48

优时比罗泽利昔珠单抗注射液(优迪革)中国获批,全球首个且唯一双亚型创新药治疗全身型重症肌无力资讯

优时比罗泽利昔珠单抗注射液(优迪革)中国获批,全球首个且唯一双亚型创新药治疗全身型重症肌无力

作为唯一人源化、高亲和力且具备创新修饰结构的IgG4单抗,关键Ⅲ期MycarinG试验证实罗泽利昔珠单抗注射液(优迪革®)较安慰剂显著改善全身型重症肌无力患者的多个临床终点与结局。

2025-03-31 15:58

从手术麻醉到生命全周期护航,麻醉学科发展拓宽生命边界资讯

从手术麻醉到生命全周期护航,麻醉学科发展拓宽生命边界

3月26日,由中华医学会麻醉学分会、中国医师协会麻醉学医师分会等23家学协会共同举办的2025年中国麻醉周学术活动的启动仪式举办,该活动以“生命之重,大医精诚——守生命保驾护...

2025-03-31 15:30

欧狄沃联合逸沃成为中国目前唯一获批的肝细胞癌一线双免疫联合疗法资讯

欧狄沃联合逸沃成为中国目前唯一获批的肝细胞癌一线双免疫联合疗法

欧狄沃联合逸沃对比仑伐替尼或索拉非尼,可显著改善不可切除肝细胞癌一线患者的总生存期(OS),客观缓解率(ORR)可改善近3倍,中位缓解持续时间(mDOR)达30个月

2025-03-31 13:45

罗氏制药榜首 “现金牛” 产品罗可适(奥瑞利珠单抗)在华获批:开启多发性硬化症一年两次治疗新时代资讯

罗氏制药榜首 “现金牛” 产品罗可适(奥瑞利珠单抗)在华获批:开启多发性硬化症一年两次治疗新时代

罗氏制药今日(3月31日)宣布,其旗下创新药罗可适®(Ocrevus®,通用名:奥瑞利珠单抗注射液 ocrelizumab injection)正式获得中国国家药品监督管理局批准,每六个月静脉输...

2025-03-31 13:39

与拜耳“分手”后,华堂宁卖得更好了资讯

与拜耳“分手”后,华堂宁卖得更好了

日前,华领医药公布了华堂宁被纳入国家医保目录后首个完整年的业绩数据。

2025-03-31 11:21

三生有幸,医者仁心:三生制药向全体医药工作者致敬!资讯

三生有幸,医者仁心:三生制药向全体医药工作者致敬!

3月30日是国际医师节,由三生制药公益支持的以“三生有幸,医者仁心”为主题的公益活动,携手20位医生代表,以寄语海报的形式,共同向全体医护人员表达诚挚的祝福与关爱。

2025-03-30 17:38