语音技术是这两年资本市场和巨头公司追逐的宠儿,从像苹果的Siri,微软的Cortana,谷歌的google Assistant这样的语音助理,以及Amazon Echo和Google Home进入客厅和卧室场景的智能音箱,再到今年10月份的锤子新机发布会上,科大讯飞惊艳全场的语音识别技术。语音技术正在融入我们日常生活的每一个场景,天气、交通、订餐、家居……
说话是我们每天都要进行的活动之一,那么说话和我们健康是否相关?能否利用语音识别健康?在此基础上,随处可见的语音助理能否成为我们个人的私人医生?
答案是肯定。科学家认为,人们的健康和发出的声音息息相关。如果身体上或心理上出现了问题,那么发出的声音可能会变得纤细,或说话带有鼻音,或者你的言语更加粗暴,又或者你的声音会伴随着人耳难以区分的颤抖。
原因就在于,仅说一个简单的词语就需要大脑中的多个神经回路中进行复杂协调、对呼吸系统进行精确的控制、掌握好协调的肌肉骨骼系各个部分的激活的时间,这样才能控制整个声道的发音的清晰度。一旦身体出现了疾病,疾病的特异性干扰会对某个系统或多个系统会产生细微的、难以察觉、但具有特性的变化。而这种变化,是可以利用机器来进行分析计算的。
奇点糕之前写过一篇文章,讲的就是Sonde Health公司通过分析语音特征来诊断疾病,比如说抑郁症、脑震荡、认知障碍、帕金森症等神经系统疾病。该公司希望利用人们现有设备,比如说智能手机,在不记录人们具体的说话内容,仅仅提取人们的语音特征来监测人们的生理和心理健康。
现在,语音识别技术在健康医疗领域又有重大突破。这个月,梅奥诊所与以色列语音分析公司Beyond Verbal合作的研究发现:13个语音特征和冠心病存在相关性,其中一个语音特征会增加冠心病19倍的发生概率。
这项研究说明在语音特征和冠心病之间存在相关性。研究人员说,这项研究将在美国心脏协会科学会议展示。语音特征分析可以辅助医生评估胸痛患者患有冠心病的概率,尤其适合在远程医疗中使用。这项研究首次发现语音特征和纯粹的身体疾病存在相关性,这意味着在未来的某一天,医生可以使用语音分析的软件作为一种无创、辅助诊断工具。
这项研究是一项双盲研究,一共有150名实验对象,包括120名已经进行了冠状动脉血管造影术的冠心病患者,9名没有进行冠状动脉血管造影术的实验对象,以及21名健康的实验对象作为控制组。
所有的实验对象进行了冠状动脉血管造影术之前,使用一个下载到他们个人智能手机的应用来录三段30秒的语音。第一段语音要求实验对象读一段指定的文本;第二段语音要求实验对象描述一段积极的经验;第三段语音要求研究对象描述一段负面的经验。
所有录好的语音将会由Beyond Verbal提供的工具分析语音的强度和频率。研究人员利用梅尔频率倒谱系数(MFCCs)来从录好的音频中提取声音特征,分析时不知道实验对象的临床数据。
研究人员一开始对声音特征使用单因素二元逻辑回归(Univariate binary logistic regression)进行分析,发现声音特征与冠心病存在相关性。为了验证到底哪些声音特征与冠心病相关,研究人员使用逐步二元逻辑回归(Stepwise binary logistic regression)分析发现有13个声音特征与冠心病存在相关,其中研究人员在实验对象描述消极经验的录音中识别的「15号」声音特征与冠心病存在强相关性,出现15号声音特征的研究对象所患冠心病的概率是其他人的19倍。结果显示,利用声音特征识别冠心病独立于年龄、性别和其他一些利用传统冠心病风险评分的因素。
上图显示为在一段消极经验时冠心病患者和控制组语音的功率谱密度对比(PSD)红色为冠心病患者,绿色为健康的控制组
至于Beyond Verbal如何从三段录音中提取声音特征,可能因为涉及商业机密,梅奥诊所发布的研究中没有显示。很难去描述那些声音特征听起来是什么样的。这些声音特征不是人类的耳朵可以识别的。Yuval Mor说,他是Beyond Verbal的CEO。这和我们的视力很相似,人眼可以看到一个特定的光谱,但实际上现实中还存在更多的光谱。
Beyond Verbal,成立于2012年。2014年推出了Beyond Wellness API 。这款软件可以将智能手机或配置麦克风的可穿戴设备变为「情绪传感器」,不考虑实际内容和上下文语义,而是研究语音中的语调、频率来监测用户的情绪。该公司有两个免费、面向消费者的应用程序,Moodie 和Empath,并且还有一个面向临床医生的应用Beyond Clinic,他们希望在任何场景下都可以监测识别情绪的手段,比如说工作场景,市场研究场景,甚至梅根凯利采访川普的视频都可以进行情绪的识别。
9月份,Beyond Verbal推出一个研究平台,将它的软件用于健康医疗领域,想要通过识别语音的生理标志来进行健康问题的诊断。这家公司虽然拥有语音分析的经验,但一直以来更侧重于检测那些明显会影响到个人声音的疾病,比如说帕金森和其他的影响神经认知功能的疾病。这项和梅奥诊所的研究是首次揭示了语音特征可以用来识别单纯的身体疾病。
这项研究已经进行了两年,我们花了很长时间证明两者之间存在联系, Mor说,发现声音特征和身体疾病之间的相关性意味着在其他领域可以应用这项技术。比如说内嵌到一个APP中,通过说一段话来为人们的心脏健康进行预警。本次研究为我们开了一扇门,让我们可以继续心脏健康方面更多边、多语言的研究。Mor说。
Beyond Verbal 将会和梅奥诊所继续合作,将会在不同的语言环境中检测这项技术,确认语音特征分析是否会超越语言。
来源:奇点网(微信公众号:geekheal_com) 作者:李盈
为你推荐
资讯 康龙化成与礼来达成口服GLP-1小分子药Orforglipron生产合作协议
3月11日晚间,康龙化成官方微信发布消息,康龙化成与礼来公司共同宣布,达成关于首个申报注册的口服小分子GLP-1受体激动剂Orforglipron的生产合作协议。
2026-03-12 21:56
资讯 美国 FDA 批准颂狄多(氘可来昔替尼)用于治疗活动性银屑病关节炎成人患者
颂狄多是一种口服选择性酪氨酸激酶 2(TYK2)抑制剂,也是首个获批用于 PsA治疗 的 TYK2 抑制剂
2026-03-12 16:53
资讯 百时美施贵宝宣布口服药物mezigdomide治疗复发或难治性多发性骨髓瘤Ⅲ期研究SUCCESSOR-2的积极结果
这是mezigdomide首项获得积极结果的Ⅲ期研究,也是百时美施贵宝CELMoD项目第二项获得积极成果的Ⅲ期研究
2026-03-11 21:15
资讯 备思复联合帕博利珠单抗使顺铂耐受的肌层浸润性膀胱癌患者的复发或死亡风险降低近 50%
在 III 期临床研究 EV-304 中,该联合疗法显著改善患者总生存期与病理完全缓解率,超半数患者在手术时未检测到病灶
2026-03-11 13:17
资讯 降 HbA1c 超 2.5%且多重获益,华东医药国产降糖新药HDM1005降糖2期数据揭晓
本次研究为一项在饮食和运动或二甲双胍治疗后血糖控制不佳的2型糖尿病受试者中评价HDM1005注射液有效性和安全性的多中心、随机、盲法、平行、安慰剂和阳性对照的Ⅱ期临床研究
2026-03-10 19:38
资讯 艾凯生物完成A3轮超亿元融资,加速AI驱动iPSC细胞治疗与类器官平台升级
本轮融资由知壹投资与沃杰资本联合领投,联新资本持续追加投资,资金将重点用于推进AI驱动的iPSC细胞治疗产品临床转化,加速完善iPSC细胞治疗与类器官两大核心技术平台布局。
2026-03-10 18:22
资讯 中科搏锐斩获数千万B轮融资,推动脑机接口全产业链产业化落地
本轮融资由国内知名投资机构三泽创投独家投资,凯乘资本担任长期独家财务顾问,所筹资金将全力支撑公司深化脑机接口全产业链布局,加速尖端技术的临床转化与产业化落地。
2026-03-10 18:03
资讯 入选不足4月,和黄医药申请将达唯珂移出首版商保创新药目录
国家医疗保障局办公室今日发布通知,自2026年3月9日起,撤销氢溴酸他泽司他片(商品名:达唯珂)在全国各省级医药采购平台挂网资格,并根据企业申请,将该药品移出《商业健康保...
2026-03-09 22:09
资讯 CDE:抗肿瘤药物生物等效性及药代动力学比对研究受试者人群选择考虑
本指导原则主要基于小分子化学药物及单抗类药物的研究经验,为抗肿瘤药物 BE PK 比对研究中受试者人群的选择考虑提供建议。
2026-03-07 10:59
资讯 四家知名药企被暂停军队采购
近日,军队采购网发布一批“军队采购暂停名单”,其中涉及四家药企被列入暂停名单,具体为北京费森尤斯卡比医药有限公司、齐鲁制药有限公司、宜昌人福药业有限责任公司和江苏新...
2026-03-07 10:41












