
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于XGBoost模型与声学生物标志物的成人哮喘无创分类研究
【字体: 大 中 小 】 时间:2025年08月08日 来源:Scientific Reports 3.9
编辑推荐:
针对传统哮喘诊断依赖患者配合的局限性,上海中医药大学团队创新性地采用XGBoost机器学习模型,通过分析持续元音/a:/的声学特征(eGeMAPS参数集),构建了成人哮喘无创诊断系统。研究在214人主队列和200人外部验证集中分别达到0.8514和0.81的准确率,首次证实言语声学特征对哮喘的鉴别价值,为远程监测和早期预警提供了新范式。
哮喘诊断的声学革命:当机器学习遇见语音分析
在哮喘影响全球3亿患者的今天,临床诊断仍面临巨大挑战。传统肺功能检测需要患者高度配合,儿童和老年人往往难以完成精确测试;而听诊器检查则受制于医生主观经验,难以捕捉亚临床炎症的细微变化。更棘手的是,常用声学标志物如咳嗽和喘鸣易与其他呼吸道疾病混淆,且采集过程可能加剧患者不适。这些痛点催生了一个关键科学问题:能否通过更稳定、更易获取的声音特征实现客观诊断?
上海中医药大学传统医学院的研究团队在《Scientific Reports》发表了一项突破性研究。他们另辟蹊径,选择持续元音/a:/作为分析对象——这种发音稳定且易于标准化采集,避免了咳嗽等非言语声的个体差异干扰。通过改良版eGeMAPS(扩展日内瓦极简声学参数集)提取88维特征,研究人员系统比较了7种机器学习算法,最终开发出基于XGBoost(极限梯度提升)的高精度分类模型。
技术方法精要
研究采用病例对照设计,主队列含214名受试者(107例哮喘/107健康),外部验证集200人。使用Logitech H340麦克风采集/a:/音频(16kHz采样率),通过openSMILE工具包提取声学特征。采用70/30划分训练测试集,十折交叉验证优化XGBoost模型,SHAP(沙普利加和解释)和LIME(局部可解释模型无关解释)方法解析特征重要性。
结果揭示
模型性能
XGBoost在主队列测试集表现卓越:准确率0.8514(AUC 0.9130),召回率0.8804,Kappa系数0.7018。外部验证中指标稳定(准确率0.8100,AUC 0.8755),显著优于既往咳嗽(0.7872)或呼气音(0.715 AUC)模型。

特征解析
SHAP分析显示共振峰频率是关键预测因子:
F2frequency_sma3nz_amean(第二共振峰频率均值)呈现显著负相关
F1与F3频率则显示正相关
LIME局部解释揭示模型决策依赖特征间复杂交互,如当F1≤501.55Hz且F3≤2510.42Hz时,低F2值反而支持健康分类,体现非线性关系。

横向对比
与Ulukaya的KNN喘鸣分类(0.7578准确率)、Emeryk的RFR(随机森林回归)呼气分析(0.715 AUC)相比,本研究的言语声学方法在保持无创优势的同时,首次实现诊断性能的实质性突破。
讨论与展望
这项研究开创性地证实了言语声学在哮喘诊断中的价值。相较于需要主动配合的肺功能检测,元音发音的被动采集更适用于儿童和老年群体;而相比咳嗽等非稳定声源,/a:/的标准化特性减少了环境干扰。模型解释性分析揭示了共振峰频率的核心作用,这与哮喘患者气道狭窄导致的声带振动模式改变理论相符。
研究仍存在样本来源单一(仅上海地区成人)、未包含儿童数据等局限。未来工作可拓展多中心队列,整合更多元音(如/i:/、/ou/)构建多维声纹图谱。值得关注的是,该技术框架与智能手机的兼容性,为开发居家监测APP铺平道路——正如作者Yi Lyu所述:"这不仅是诊断工具的革新,更是慢性病管理范式的转变。"
这项发表于《Scientific Reports》的成果,标志着声学生物标志物研究从情绪识别(eGeMAPS传统应用)向病理检测的成功跨越,为AI辅助呼吸病学树立了新标杆。随着可解释性AI(XAI)技术的发展,这种"听音识病"的古老智慧,正在机器学习赋能下焕发新生。
生物通微信公众号
知名企业招聘