
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于可解释机器学习集成技术的阿尔茨海默病早期诊断新方法研究
【字体: 大 中 小 】 时间:2025年05月27日 来源:Intelligence-Based Medicine CS5.0
编辑推荐:
为解决阿尔茨海默病(AD)早期诊断准确率低、模型可解释性差的问题,研究人员提出了一种融合可解释人工智能(XAI)的集成机器学习框架。该研究通过SMOTE平衡数据,结合Chi-Square和RFE特征选择,构建了LightGBM与随机森林的软投票集成模型,测试准确率达96.35%,并利用SHAP和LIME实现决策过程可视化,为临床诊断提供了高精度且透明的AI解决方案。
阿尔茨海默病(AD)作为最常见的神经退行性疾病,全球患者已超5000万,预计205年将增长三倍。这种疾病不仅导致患者认知功能进行性衰退,还给家庭和社会带来沉重负担。目前临床诊断主要依赖神经心理学量表和影像学检查,但早期诊断准确率不足60%,且传统机器学习模型存在"黑箱"问题,严重制约了AI技术在临床中的应用。
为突破这些限制,研究人员开展了一项创新性研究,提出将可解释人工智能(XAI)技术与集成学习方法相结合的新型诊断框架。该研究从Kaggle获取了包含2149例患者、34个特征的临床数据集,涵盖人口统计学、生活方式和认知评估等多维度信息。通过系统性的数据预处理和特征工程,研究团队构建了多个机器学习模型的性能对比体系,最终开发出基于LightGBM(LGBM)和随机森林(RF)的软投票集成模型。
研究采用了多项关键技术方法:1) 使用SMOTE、SMOTEENN和ADASYN处理数据不平衡问题;2) 应用Chi-Square检验和递归特征消除(RFE)进行特征选择;3) 采用10折交叉验证评估模型性能;4) 整合SHAP和LIME实现模型可解释性分析。
研究结果显示,在数据预处理阶段,min-max归一化和均值/众数填补有效提升了数据质量。特征选择环节确定"功能性评估"、"日常生活能力(ADL)"和"简易精神状态检查(MMSE)"等20个关键预测因子。模型比较表明,提出的集成模型在测试集上达到96.35%的准确率,显著优于单一模型(XGBoost 95.12%,随机森林92.56%)。
可解释性分析揭示了关键发现:SHAP分析显示"MMSE评分"和"功能性评估"对预测贡献最大,SHAP值分别达1.2和0.9;LIME局部解释则证实年龄与BMI的交互作用对高风险预测具有显著影响。10折交叉验证验证了模型的稳定性,平均准确率为95.98%±0.77%。
这项研究通过创新的方法学整合,实现了AD诊断的三大突破:首先,将集成学习与XAI结合,在保持高准确率(96.35%)的同时解决了模型可解释性问题;其次,提出的特征选择框架有效识别了临床相关生物标志物;最后,研究为AI辅助诊断系统提供了可直接应用于临床的解决方案。这些成果发表在《Intelligence-Based Medicine》杂志,为推进精准医疗提供了重要技术支撑,未来可通过扩大样本量和多中心验证进一步优化模型性能。
生物通微信公众号
知名企业招聘