
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于可解释机器学习(XAI)的声学生物标志物在老年人群帕金森病早期诊断中的应用研究
【字体: 大 中 小 】 时间:2025年09月06日 来源:Frontiers in Aging Neuroscience 4.5
编辑推荐:
这篇研究创新性地构建了基于XGBoost的可解释机器学习(XAI)框架,通过声学生物标志物(vocal biomarkers)实现帕金森病(PD)早期筛查。采用BorderlineSMOTE处理数据不平衡,结合贝叶斯优化(Bayesian Optimization)和SHAP(SHapley Additive exPlanations)解释模型,最终在测试集达到98%准确率和0.991 ROC-AUC,显著优于SVM(提升7%)和DNN(提升4%),为老龄化社会神经退行性疾病诊断提供了非侵入性解决方案。
帕金森病(PD)作为仅次于阿尔茨海默病的第二大神经退行性疾病,全球60岁以上人群患病率达1%。其早期诊断因症状隐匿性面临挑战,而90%患者存在语音障碍特征(如基频变异、振幅扰动),这为基于声学生物标志物的机器学习(ML)筛查提供了突破口。研究利用UCI帕金森数据集(195条录音,23例PD/8例健康),通过可解释AI(XAI)技术构建高精度、可临床转化的诊断模型。
2.1 数据预处理
采用受试者层级分层抽样(75:25)避免数据泄漏,标准化(z-score)后应用BorderlineSMOTE针对性合成边界样本,解决PD样本占比过高(74.4%)导致的类别不平衡问题。
2.2 特征选择与模型优化
首轮XGBoost筛选前10关键声学特征(如MDVP:Fhi(Hz)、spread2),再通过贝叶斯优化调整超参数(学习率0.01,max_depth=5)。创新性采用F1最大化动态阈值(0.45),相比固定阈值0.5提升健康样本识别率15%。
2.3 可解释性分析
SHAP力图示揭示:高频成分(MDVP:Fhi(Hz)>4,500Hz)和声学扰动指标(spread1>0.45)对PD预测贡献度达32%,与基底节神经退行性变导致的声带控制障碍病理机制高度吻合。
性能对比
最终模型准确率98%(DNN 94%,SVM 91%),宏F1-score 0.97
ROC曲线下面积(AUC)0.991,假阴性率仅3%(见图6)
SHAP全局分析显示非线性特征(如DFA<0.6)对PD判别具有特异性
临床意义
模型识别出的top3特征(MDVP:Fhi(Hz)、spread2、RPDE)与既往PD语音研究一致,证实其生物学合理性。单个病例SHAP解释(如患者ID12的jitter>0.04驱动阳性预测)为医患沟通提供可视化依据。
未来拟开发移动端应用,并整合步态分析等多模态数据。当前局限性在于样本量较小(n=31),需扩大跨种族验证。该研究为老龄化社会神经退行性疾病筛查提供了兼具工程严谨性(AUC>0.99)和临床可解释性(SHAP)的AI范式。
(注:全文严格依据原文数据,未新增结论;专业术语如XGBoost、SHAP等保留原名;数学公式已转换为文本表述;去除了文献引用标记)
生物通微信公众号
知名企业招聘