
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用先进的机器学习模型提升帕金森病的预测精度
《Scientific Reports》:Enhancing prediction accuracy for Parkinson’s disease using advanced machine learning models
【字体: 大 中 小 】 时间:2026年06月14日 来源:Scientific Reports 3.9
编辑推荐:
摘要帕金森病是一种神经系统疾病,对全球老年人的健康状况有着负面影响。目前尚无有效的治疗方法,因此该疾病不仅影响患者的身体健康,还会对其心理健康造成不良影响。因此,有必要开发新的方法来检测帕金森病,从而保障相关人员的健康。通过利用结构化数据源并应用机器学习技术,有望提升帕金森病的检
帕金森病是一种神经系统疾病,对全球老年人的健康状况有着负面影响。目前尚无有效的治疗方法,因此该疾病不仅影响患者的身体健康,还会对其心理健康造成不良影响。因此,有必要开发新的方法来检测帕金森病,从而保障相关人员的健康。通过利用结构化数据源并应用机器学习技术,有望提升帕金森病的检测精度。本研究旨在利用UCI帕金森病数据集中的声学数据,提供一种基于机器学习的整体诊断方法,并比较四种常用的数据分类算法——XGBoost、随机森林、支持向量机以及K最近邻算法在帕金森病分类方面的性能。研究共分为四个阶段:(1)建立基准模型;(2)采用10折交叉验证;(3)通过合成少数类过采样方法平衡各类别数据;(4)利用主成分分析降低数据维度。在研究的四个阶段中,XGBoost在所有模型中取得了最高的分类准确率(97.22%),同时在所有测试算法中也拥有最高的马修斯相关系数,这表明XGBoost更擅长处理非线性关系。实验结果显示,采用合成少数类过采样方法显著提升了机器学习分类算法的性能,尤其是K最近邻算法。主成分分析在无需损失重要识别信息的情况下有效降低了数据维度。研究结果表明,各种机器学习分类算法之间存在性能差异,但在应用合成少数类过采样和主成分分析后这些差异有所缩小。因此可以得出结论,在经过这两种方法处理后,各类机器学习分类算法的性能在统计上已趋于相似。实验还表明,机器学习分类算法,尤其是XGBoost和K最近邻算法,能够有效用于帕金森病的早期检测。此外,基于SHAP技术的可解释性分析表明,所提出的框架不仅具备较高的准确性,还具有较好的可解释性,从而缩小了帕金森病诊断中预测结果与临床实际结果之间的差距。
生物通微信公众号