语音技术是这两年资本市场和巨头公司追逐的宠儿,从像苹果的Siri,微软的Cortana,谷歌的google Assistant这样的语音助理,以及Amazon Echo和Google Home进入客厅和卧室场景的智能音箱,再到今年10月份的锤子新机发布会上,科大讯飞惊艳全场的语音识别技术。语音技术正在融入我们日常生活的每一个场景,天气、交通、订餐、家居……
说话是我们每天都要进行的活动之一,那么说话和我们健康是否相关?能否利用语音识别健康?在此基础上,随处可见的语音助理能否成为我们个人的私人医生?
答案是肯定。科学家认为,人们的健康和发出的声音息息相关。如果身体上或心理上出现了问题,那么发出的声音可能会变得纤细,或说话带有鼻音,或者你的言语更加粗暴,又或者你的声音会伴随着人耳难以区分的颤抖。
原因就在于,仅说一个简单的词语就需要大脑中的多个神经回路中进行复杂协调、对呼吸系统进行精确的控制、掌握好协调的肌肉骨骼系各个部分的激活的时间,这样才能控制整个声道的发音的清晰度。一旦身体出现了疾病,疾病的特异性干扰会对某个系统或多个系统会产生细微的、难以察觉、但具有特性的变化。而这种变化,是可以利用机器来进行分析计算的。
奇点糕之前写过一篇文章,讲的就是Sonde Health公司通过分析语音特征来诊断疾病,比如说抑郁症、脑震荡、认知障碍、帕金森症等神经系统疾病。该公司希望利用人们现有设备,比如说智能手机,在不记录人们具体的说话内容,仅仅提取人们的语音特征来监测人们的生理和心理健康。
现在,语音识别技术在健康医疗领域又有重大突破。这个月,梅奥诊所与以色列语音分析公司Beyond Verbal合作的研究发现:13个语音特征和冠心病存在相关性,其中一个语音特征会增加冠心病19倍的发生概率。
这项研究说明在语音特征和冠心病之间存在相关性。研究人员说,这项研究将在美国心脏协会科学会议展示。语音特征分析可以辅助医生评估胸痛患者患有冠心病的概率,尤其适合在远程医疗中使用。这项研究首次发现语音特征和纯粹的身体疾病存在相关性,这意味着在未来的某一天,医生可以使用语音分析的软件作为一种无创、辅助诊断工具。
这项研究是一项双盲研究,一共有150名实验对象,包括120名已经进行了冠状动脉血管造影术的冠心病患者,9名没有进行冠状动脉血管造影术的实验对象,以及21名健康的实验对象作为控制组。
所有的实验对象进行了冠状动脉血管造影术之前,使用一个下载到他们个人智能手机的应用来录三段30秒的语音。第一段语音要求实验对象读一段指定的文本;第二段语音要求实验对象描述一段积极的经验;第三段语音要求研究对象描述一段负面的经验。
所有录好的语音将会由Beyond Verbal提供的工具分析语音的强度和频率。研究人员利用梅尔频率倒谱系数(MFCCs)来从录好的音频中提取声音特征,分析时不知道实验对象的临床数据。
研究人员一开始对声音特征使用单因素二元逻辑回归(Univariate binary logistic regression)进行分析,发现声音特征与冠心病存在相关性。为了验证到底哪些声音特征与冠心病相关,研究人员使用逐步二元逻辑回归(Stepwise binary logistic regression)分析发现有13个声音特征与冠心病存在相关,其中研究人员在实验对象描述消极经验的录音中识别的「15号」声音特征与冠心病存在强相关性,出现15号声音特征的研究对象所患冠心病的概率是其他人的19倍。结果显示,利用声音特征识别冠心病独立于年龄、性别和其他一些利用传统冠心病风险评分的因素。
上图显示为在一段消极经验时冠心病患者和控制组语音的功率谱密度对比(PSD)红色为冠心病患者,绿色为健康的控制组
至于Beyond Verbal如何从三段录音中提取声音特征,可能因为涉及商业机密,梅奥诊所发布的研究中没有显示。很难去描述那些声音特征听起来是什么样的。这些声音特征不是人类的耳朵可以识别的。Yuval Mor说,他是Beyond Verbal的CEO。这和我们的视力很相似,人眼可以看到一个特定的光谱,但实际上现实中还存在更多的光谱。
Beyond Verbal,成立于2012年。2014年推出了Beyond Wellness API 。这款软件可以将智能手机或配置麦克风的可穿戴设备变为「情绪传感器」,不考虑实际内容和上下文语义,而是研究语音中的语调、频率来监测用户的情绪。该公司有两个免费、面向消费者的应用程序,Moodie 和Empath,并且还有一个面向临床医生的应用Beyond Clinic,他们希望在任何场景下都可以监测识别情绪的手段,比如说工作场景,市场研究场景,甚至梅根凯利采访川普的视频都可以进行情绪的识别。
9月份,Beyond Verbal推出一个研究平台,将它的软件用于健康医疗领域,想要通过识别语音的生理标志来进行健康问题的诊断。这家公司虽然拥有语音分析的经验,但一直以来更侧重于检测那些明显会影响到个人声音的疾病,比如说帕金森和其他的影响神经认知功能的疾病。这项和梅奥诊所的研究是首次揭示了语音特征可以用来识别单纯的身体疾病。
这项研究已经进行了两年,我们花了很长时间证明两者之间存在联系, Mor说,发现声音特征和身体疾病之间的相关性意味着在其他领域可以应用这项技术。比如说内嵌到一个APP中,通过说一段话来为人们的心脏健康进行预警。本次研究为我们开了一扇门,让我们可以继续心脏健康方面更多边、多语言的研究。Mor说。
Beyond Verbal 将会和梅奥诊所继续合作,将会在不同的语言环境中检测这项技术,确认语音特征分析是否会超越语言。
来源:奇点网(微信公众号:geekheal_com) 作者:李盈
为你推荐
资讯 备思复联合帕博利珠单抗显著改善肌层浸润性膀胱癌患者的生存期,无论患者能否耐受顺铂
思复联合帕博利珠单抗成为首个且目前唯一不含铂类化疗的治疗方案,在顺铂耐受肌层浸润性膀胱癌患者膀胱切除术前后使用中,可改善无事件生存期和总生存期
2025-12-19 15:37
资讯 我国60岁以上听损老人逾2000万
60岁及以上老年人群的听力损失患病率在各个年龄段当中居于首位,高达11 04%,据此推算,我国患听力损失的60岁以上老年人至少2000万人。约1 3的65岁以上老年人伴有听力残疾,约...
2025-12-18 21:44
资讯 中国低卫生资源地区宫颈癌综合防控项目在内蒙古敖汉旗落地,筑牢抵御宫颈癌的防线
由中国癌症基金会发起、默沙东(默沙东是美国新泽西州 肯尼沃斯市默克公司的公司商号)支持的中国低卫生资源地区宫颈癌综合防控项目于内蒙古自治区赤峰市敖汉旗正式落地
2025-12-18 16:23
资讯 安斯泰来将在2026年ASCO胃肠道癌症研讨会(ASCO GI)上公布其胃肠道肿瘤产品管线的最新临床数据
2期ILUSTRO研究评估佐妥昔单抗三药联合方案用于一线晚期胃癌和胃食管结合部(G GEJ)癌的队列结果入选最新突破性口头报告
2025-12-18 12:53
资讯 加强基层医疗卫生机构儿科、妇科、康复医学科、精神(心理)科、五官(口腔)科等特色科室建设
在加强基层医疗卫生机构全科医疗科、中医科、预防保健科等业务及医技科室建设的基础上,综合考虑辖区居民健康需求、人口老龄化、区域医疗卫生资源布局等因素,重点加强若干临床...
2025-12-17 20:03
资讯 复星医药14.12亿元收购绿谷医药,要再启“九期一”
12月15日,复星医药发布公告称,控股子公司复星医药产业拟出资共计14 12亿元控股投资绿谷医药。资金来源为拟以自筹资金支付本次收购的对价。
2025-12-16 22:40
资讯 安领科生物完成近 5000 万美元 A 轮追加融资,加速 ADC 全球临床与技术平台创新
本轮融资由老股东君联资本与新晋投资方美团龙珠联合领投,蓝驰创投、元生创投、五源资本等多家知名新老股东跟投
2025-12-16 11:28
资讯 华东医药“双喜临门”!GLP-1/GIP双靶点减重药II期数据亮眼,MUC17 ADC创新药获FDA孤儿药认定
创新多肽类人GLP-1(胰高血糖素样肽-1)受体和GIP受体(葡萄糖依赖性促胰岛素多肽)的双靶点长效激动剂HDM1005注射液在体重管理适应症中国II期临床试验中取得了积极结果
2025-12-15 17:13
资讯 自2028年起,每年3月底前完成上年度清算,国家医保局发布《医保基金清算提质增效三年行动计划》
自2028年起,实现每年3月底前完成上年度清算,清算资金占年度医保基金拨付的3%左右,推进季度清算等创新模式。
2025-12-15 10:29
资讯 远大赛威信六价诺如疫苗研发持续推进,直指百亿元市场
该疫苗是目前全球临床进展最快的六价诺如疫苗,采用先进的重组病毒样颗粒(VLP)技术,涵盖了六个全球高流行基因型别,理论覆盖范围可超全球90%的诺如病毒流行株
2025-12-14 13:15
资讯 圣因生物完成超 1.1 亿美元 B 轮融资,加速 RNAi 疗法全球布局
本轮融资由知名产业机构领投,国际主权基金、中国生物制药、君联资本等十余家机构跟投,全球制药巨头礼来公司战略入局,高瓴创投、启明创投等现有股东持续加码支持,融资规模创...
2025-12-12 16:59











