新华社北京3月25日电 咳嗽是很多呼吸系统疾病的症状表现。由美国谷歌公司科研人员领导的团队最近开发出一种利用人工智能(AI)分析咳嗽,进而帮助检测健康状况的新系统,未来或可用于诊断新冠、结核病等疾病。
该系统是一种基于机器学习的工具,经过对海量人类声音片段的训练,实现对咳嗽和呼吸等噪声的检测,以诊断相关疾病和评估肺部功能状况。这一系统的创新之处在于使用海量未标记的数据训练模型以及可微调执行多项任务的能力。相关论文近期已发表在预印本网站arXiv上。
此前很多类似的AI检测工具在前期训练时都需要有标记的声音数据,即人们的咳嗽声录音须与发声者的健康信息相匹配。比如,一些声音片段会被标记为该人在录制时患有支气管炎,便于AI学习识别。但在医学领域,这样有标记的训练数据非常匮乏。
谷歌的新系统采用了一种被称为「自我监督学习」的方法,仅使用未标记的数据就可以成功训练出AI疾病检测模型。研究人员从社交媒体平台优兔上的公开视频中提取了超过3亿个咳嗽、呼吸、清喉咙等短声音片段来训练模型,使其可用于检测多任务,如新冠、结核病以及是否吸烟等。由于模型经过了广泛和多样的人类声音训练,其检测结果也是可推广的。
相关科学家认为,声音作为一种生物标记物在疾病检测领域的应用前景广阔,在诊断和筛查方面都有巨大潜力。每周重复进行扫描或活检对患者有所伤害,而声音检测不具有侵入性,需要耗费的资源也更少。