本文来自微信公众号:CyberMed丨赛博医客(ID:cybermed2050),作者:LY,头图来自:视觉中国


通过一个6秒钟的元音“啊——”,或者从50大声数到70,就能“听”出你是否得了COVID-19,是不是很不可思议?


没错,作为一种算法驱动的安全、可访问且非侵入式的筛查工具,它正势不可挡地直面公众。日前国际权威期刊《柳叶刀·数字健康》发表一篇述评称,“这些技术有潜力通过在个人设备上运行的快速、经济的诊断,显著改善全球健康——这是对抗流行病的完美工具。”


在与新冠病毒的斗争可能长期化的大背景下,语音生物标志物(Biomarker)在数字健康领域的应用热点正在加速度发展,并促动院外生命体征监测、家庭场景下的个体化医疗市场成为“香饽饽”。


那么,AI技术真的能确定“我有病吗”?


在对抗COVID-19中显山露水


在新冠肺炎疫情肆虐的美国,语音生物标志物技术公司Sonde Health正在协助“听音判病”。Sonde Health成立于2015年,总部位于波士顿,可基于语音生物标志物进行声学分析,从而诊断和监测人体健康状况,提供疾病筛查和管理解决方案。


用户通过智能手机访问名为Sonde One的应用软件,即可看到“呼吸系统症状风险”的部分,完成一份简单问卷(包含7个问题)之后,按要求吸气并保持一个元音“啊——”的语音至少6秒钟,该应用程序就会告诉用户其所处的风险状态。


该应用程序依赖于Sonde Health建立在从80000多个人收集的超过100万个人类声音样本上的机器学习模型,感知和分析声音中的细微变化,来识别例如咳嗽、哮喘、COPD(慢性阻塞性肺疾病)等呼吸系统疾病的症状,6秒钟的语音采样可以实现检测的准确率达70%以上。


Sonde Health首席执行官David Liu表示,“无论是呼吸系统疾病、哮喘还是COVID-19,给我们6秒钟的声音片段,即可清楚地告诉用户,他的健康状况怎样”。


虽然应用程序筛查不能代替临床医生的诊断,但可用作COVID-19的早期预警系统。而且,这种操作,就如同测量体温或血压一样简单。


目前,美国和印度的10家公司正在使用Sonde Health的技术来帮助员工筛查COVID-19,David Liu表示,如果每天有很多人使用它,其语音筛查测试可能有助于遏制激增的流行病。


另一家以色列初创公司Vocalis Health同样聚焦于医疗领域的人工智能和语音分析应用。


今年2月份,Vocalis Health宣布,其COVID-19筛查工具Vocalis Check在大型临床研究中成功验证,并已获得CE标志,成为首个获得CE批准的 COVID-19筛查医疗设备。



Vocalis Check是一款软件,同样可通过智能手机或Web应用程序访问。用户只需从50数到70,其录音就会被转换为包含512个语音生物标志物组成的图像,即频谱图,应用人工智能,这些图片与基于临床试验中COVID-19阳性参与者的录音的合成图像进行比较,以确定它们之间的相关性。在不到一分钟的时间里,Vocalis Check将做出判断,再通过随后的拭子测试进行验证或否定。


Vocalis Health一直在收集公共声音样本,并与以色列国防部协调,从而获取明确感染者的频谱图。据称,Vocalis Health的COVID-19声音生物标志物在评估一个人是否感染 COVID-19的风险方面准确度超过80%。


目前市场上检测COVID-19主要是PCR核酸检测法,这是一种相对昂贵、资源密集和耗时的方法。而利用声音生物标志物这样的高度可扩展的筛查方法可以填补当前COVID-19筛查方法的空白。



Vocalis Health还与大孟买市政公司(MCGM)合作,在COVID-19大流行期间设立的医疗中心开展为期一个月的声音测试试点,测试了2000多人,包括英语、印地语、马拉地语和古吉拉特语等,以突破语言本身的限制。


Vocalis Health首席医疗官Shady Hassan博士认为,声音生物标志物检测并非旨在取代PCR测试,这是为了筛查,而不是诊断。


通过快速广泛的筛查提供可靠的风险评分来指导可能需要额外诊断测试的人,从而使卫生系统能够更有效地分配诊断资源,这也是声音生物标志物检测的重要价值之一。


心理和精神疾病领域的探索


相对于像COVID-19这样的生理疾病,也许更引人关注的,是人工智能驱动的语音生物标志物识别技术是否能够帮助诊断心理和精神疾病。


以前,我们总将生理疾病的考虑优先于精神疾病,因为生理疾病更容易被监测和治疗,而现在,人们正在更加开放地看待精神健康问题,那么,语音生物标志物可否用于精神疾病的“数字化”?


人类在说话时,哪怕是一个简单的词语,都需要大脑中的多个神经回路进行复杂协调、对呼吸系统进行精确的控制、掌握好协调的肌肉骨骼系各个部分的激活时间,这样才能控制整个声道的发音清晰度。人体在发声时对于全身系统协调的依赖,可为研究机构提供监测疾病的新思路。


因为人体发声的同时会产生相应的生物标记物,当身体出现健康问题时,疾病的特异性干扰会对某个系统或多个系统产生细微、难以察觉、但具有特性的变化,生物标记物含量由此产生变化。而这种变化,是可以利用机器来进行分析计算的。


此类变化和关联无法被人耳识别,但却可以被语音生物标记技术检测到。这和我们的视力很相似,人眼可以看到一个特定的光谱,但实际上现实中还存在更多的光谱,我们肉眼并不能看到。


以抑郁症为例,患者往往会表现出言语迟缓、音量不稳定、发声颤抖、语言韵律异常等症状。麻省理工学院(MIT)林肯实验室的研究发现,抑郁症患者治疗前较治疗后,声带发声的时刻和强度在每次声带振动的周期中,波动都比较显著,并且波动程度与抑郁症的严重程度呈正相关。


随后,他们利用自动分类算法,实现了精确度可以达到80%~90%的抑郁症预测。Sonde Health已在这项技术的基础上,研发了用于检测和诊断精神疾病的产品。


Sonde Health很早就意识到声音对个人健康有意义的预测指标,开始研究语音和不同疾病之间的关联。比如,建立语音和MRI脑白质(抑郁症诊断)之间的关联,语音和海马体萎缩(老年痴呆诊断)之间的关联,等等。


目前,Sonde Health已经经过临床实验证明,通过智能手机,在不记录人们具体说话内容,仅提取语音特征的情况下,通过分析患者语音的短片段,便可查找可能指向早期健康状况的异常现象,监测从呼吸系统疾病到帕金森病、慢性老年病等各种疾病,以及人体精神问题,包括抑郁症、产后抑郁、认知障碍和脑震荡等。


Sonde Health的语音识别技术在不断发展迭代。第一代技术在使用时,要求用户必须阅读固定文本或回答问题,且用户必须处在特定环境中进行。目前,Sonde Health技术已可导入手机等随身电子设备中,通过语音实时监控用户健康情况,并及时提供治疗方案。


Sonde Health首席运营官Jim Harper声称,“当我们分析语音时,并不关心内容,而是关注语音中各指标的变化。”


其实,Sonde Health并不是第一个将语音生物识别技术应用于心理疾病检测的组织。


2015年,纽约大学Langone医学中心的研究人员便探索出了机器学习AI软件在健康领域的用途,该软件旨在通过语音生物特征识别PTSD(创伤后应激障碍)、抑郁症以及其他心理疾病。


研究人员使用神经网络发现了30种语音特征,比如,机器学习算法显示,在250多名患有创伤后应激障碍的个体中,发音中的元音间隔明显缩短等。这些特征可能区分出创伤后应激障碍的退伍军人和未受影响的退伍军人(或健康对照组),这个方法被用于一项为期5年的前瞻性大型队列研究。在开发的早期阶段,研究人员就发现该系统可以诊断PTSD的准确性为77%。


2016年,梅奥诊所与以色列语音分析公司Beyond Verbal(该公司后与Healthymize公司合并为Vocalis Health)合作的研究发现,13个语音特征和冠心病存在相关性,其中一个语音特征会增加冠心病19倍的发生概率。这项研究首次发现语音特征和纯粹的身体疾病存在相关性,这意味着,医生可以使用语音分析的软件作为一种无创、辅助诊断工具。


目前,语音生物标志物技术领域除了Vocalis Health与Sonde Health,还包括抑郁症诊断语音分析领域的龙头Ellipsis Health(该公司刚完成2600万美元A轮融资),AI语音诊断技术研发商Winterlight Labs,以及专注识别焦虑和抑郁等疾病的Kintsugi(该公司刚完成一轮800万美元的种子轮融资)


市场研究和咨询公司Fact.MR的报告预测,在2018~2027年的预测期内,语音生物标志物的全球市场将达到23.3%的年复合增长率。



但一些计算机科学家对使用人工智能来追踪精神障碍,特别是像抑郁症这样的严重障碍持保留意见,认为通过语音检测抑郁症的想法很难提供出高度精确的结果。另外,担心该技术避免不了AI技术的“偏见”顽疾,出现误诊。


打开个体化医疗之门?


语音技术一直是这两年资本市场和巨头追逐的宠儿。从苹果的Siri,微软的Cortana,谷歌的google Assistant这样的语音助理,以及Amazon Echo和Google Home进入客厅和卧室的智能音箱,到科大讯飞不断提升的语音识别技术。


语音技术已融入我们日常生活的很多场景,而现在,它正在健康医疗领域开疆拓土。


对于个人的健康监测来说,医院的监测往往只是一个“快照”,无法扑捉连续的问题发生,持续监测则可以捕获医院中遗漏的重大身体变化。如何将持续的数据与临床相结合?家庭场景下能保证监测精度的语音生物识别工具,或许是个有效解决方案。


基于声音的疾病检测技术无创伤、便宜,可实现实时、长期监测,且尤其适合在远程医疗中使用,这意味着可以覆盖到更广阔的地区,惠及更多人群和扩大数据采集范围。它将可能成为亚健康人群或疾病患者的刚需,亦或健康人群进行身体健康管理的工具。


这一领域背后存在的巨大商业机会,吸引着后来者不断进场。有业界人士表示,手机上的身体健康指标的监测有着非常大的市场需求,如果搞定它,将获得巨大的回报。


Jim Harper表示,医疗健康领域最古老的工具之一温度计,因其简单易操作以及在临床环境之外的广泛可用性,成了最有价值的医疗工具之一。Sonde Health则希望利用每天数十亿的语音交互,来创建一个21世纪的“温度计”,提供精准医疗和早期医学模式下所需的广泛数字医疗的决策支持。


反观国内,虽然“声量”不大,但也有企业已经介入语音诊断技术。比如,科慧健远研发的AI病理机器人,正在入局儿童自闭症及语言发育障碍市场。


其研发的AI病理系列机器人利用人工智能人脸识别技术、眼线眼动数据分析技术、病理语音数字分析技术、自闭症及语言相关障碍筛查系统,对语言发育迟缓、儿童构音障碍、自闭症、语言运动全面发育迟缓等疾病进行筛查和识别。


其中,病理语音数字分析技术通过提取相关声学特征参数,计算出综合声学参数,采用双模块权重综合的方法,筛选出儿童构音障碍。


而专注做“情绪体检”的想象科技在2017年成立了Wonder AI Lab,以探索AI+心理健康的可能性。他们的感知AI模型通过实时识别个人情绪,再综合心理、精神疾病等多学科知识交叉运用,基于EQ专家所标记的350多万个情感音频数据,从而应用到智能语音心理健康平台上。据称用户情绪识别精准度高达95%。此外也可提供可视化的情绪卡片解读,并生成调节方案等服务。


当下,我国越来越重视生命科技和基础科学研究,医疗健康产业提升到了前所未有的战略高度。


而随着经济的发展和社会的进步,“预测性、预防性、个体化、参与性”(Preventive、Predictive、Personalized、Participatory)的“4P”医学将替代传统以治为主的诊疗方式,个体化医疗正越来越受到临床医学界的重视。


目前全球个体化医疗检测的市场主要分布在北美、欧洲、日本等发达经济体国家。而在中国,个体化医疗市场需求正在“抬头”。生物标志物是实施个体化医疗的基础,其中,语音生物标记物诊断市场或许会成为增量巨大的热点之一。


未来在可观的业务收入及利润空间的吸引下,可以想象,随着各方有实力的玩家入场,AI语音诊断市场将迎来属于自己的新格局。


本文来自微信公众号:CyberMed丨赛博医客(ID:cybermed2050),作者:LY