新華社北京3月25日電 咳嗽是很多呼吸系統疾病的癥狀表現。由美國谷歌公司科研人員領導的團隊最近開發出一種利用人工智慧(AI)分析咳嗽,進而幫助檢測健康狀況的新系統,未來或可用於診斷新冠、結核病等疾病。
該系統是一種基於機器學習的工具,經過對海量人類聲音片段的訓練,實作對咳嗽和呼吸等雜訊的檢測,以診斷相關疾病和評估肺部功能狀況。這一系統的創新之處在於使用海量未標記的數據訓練模型以及可微調執行多項任務的能力。相關論文近期已發表在預印本網站arXiv上。
此前很多類似的AI檢測工具在前期訓練時都需要有標記的聲音數據,即人們的咳嗽聲錄音須與發聲者的健康資訊相匹配。比如,一些聲音片段會被標記為該人在錄制時患有支氣管炎,便於AI學習辨識。但在醫學領域,這樣有標記的訓練數據非常匱乏。
谷歌的新系統采用了一種被稱為「自我監督學習」的方法,僅使用未標記的數據就可以成功訓練出AI疾病檢測模型。研究人員從社交媒體平台優兔上的公開視訊中提取了超過3億個咳嗽、呼吸、清喉嚨等短聲音片段來訓練模型,使其可用於檢測多工,如新冠、結核病以及是否吸煙等。由於模型經過了廣泛和多樣的人類聲音訓練,其檢測結果也是可推廣的。
相關科學家認為,聲音作為一種生物標記物在疾病檢測領域的套用前景廣闊,在診斷和篩查方面都有巨大潛力。每周重復進行掃描或活檢對患者有所傷害,而聲音檢測不具有侵入性,需要耗費的資源也更少。