基于机器学习技术的帕金森病语音生物标志物:早期诊断的新希望

【字体: 时间:2025年04月10日 来源:Scientific Reports 3.8

编辑推荐:

  帕金森病(PD)早期诊断困难,影响患者治疗。研究人员开展了利用语音生物标志物结合机器学习技术诊断 PD 的研究。结果显示,随机森林(RF)模型表现最佳,准确率达 94%。该研究为 PD 早期诊断提供了新方法,有助于提高患者生活质量。

  帕金森病(Parkinson’s disease,PD)是一种常见的神经系统退行性疾病,全球有数以百万计的人受其困扰。它主要是由于大脑中多巴胺能神经元逐渐退化,导致多巴胺分泌不足,进而影响人体运动控制 。患者会出现肌肉僵硬、震颤、运动迟缓、面部表情减少以及平衡和协调问题等症状。目前,帕金森病无法完全治愈,早期诊断对于减缓疾病进展、改善患者生活质量至关重要。然而,现有的诊断方法存在诸多问题。传统诊断主要依赖患者病史和症状评估,主观性较强。像磁共振成像(MRI)扫描、脑电图(EEG)等神经影像学方法,虽然在一定程度上有助于诊断,但存在成本高、设备复杂、准确性有限等缺点 。而且,在疾病早期,一些轻微症状如面部表情变化、语音改变等常被忽视,导致诊断延迟。
为了解决这些问题,来自巴基斯坦、也门、加拿大、南非等多个国家研究机构的研究人员展开了深入研究。他们的研究成果发表在《Scientific Reports》上。

研究人员开展了一项利用语音生物标志物结合机器学习技术对帕金森病进行早期诊断的研究。他们收集了 31 名个体的 195 个语音录音,其中 23 人患有帕金森病,构建了包含多种语音特征的数据集。这些语音特征涵盖了频率、振幅、噪声和非线性特征等多个方面,能全面反映帕金森病对个体语音的影响。

为了使研究结果更可靠,研究人员采用了多种关键技术方法。在数据处理阶段,使用合成少数过采样技术(Synthetic Minority Over - sampling Technique,SMOTE)解决数据集类别不平衡问题,通过生成新的合成样本,让少数类样本数量增加,使数据集分布更均衡;运用主成分分析(Principal Component Analysis,PCA)方法进行特征选择,在降低数据维度的同时保留关键信息。在模型构建方面,选用支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)、逻辑回归(Logistic Regression,LR)和决策树(Decision Tree,DT)这四种机器学习模型对数据进行分类训练,判断患者是否患有帕金森病。

研究结果如下:

  • 基线模型(未使用 SMOTE 或 PCA):在使用原始数据集所有属性进行分类时,RF 模型表现最佳,准确率达到 92%。这是因为 RF 模型作为一种集成模型,综合考虑了 100 个决策树的平均结果,在处理完整数据集时具有优势。SVM 模型准确率为 89%,LR 模型的准确率、召回率和 F1 分数分别为 89%、95% 和 93% ,DT 模型准确率为 89%。
  • SMOTE 的影响(应用类别平衡):使用 SMOTE 技术平衡数据集后,多数模型的准确率有所提高。其中 RF 模型提升最为显著,从 92% 提升到 94.87%,SVM 模型准确率从 89.74% 提升到 92%。这表明解决类别不平衡问题能有效提高模型预测的稳定性和准确性。
  • PCA 的影响(应用降维):运用 PCA 方法将特征减少到 12 个关键特征后,SVM 模型在较小特征集下仍展现出较高的分类准确率,达到 92.3%。但 RF 模型和 LR 模型的准确率有所下降,RF 从基线的 92% 降至 89.76%,LR 从 89.73% 大幅降至 82.05%,这说明 PCA 在降维过程中可能丢失了一些对模型重要的特征。

综合来看,研究结果表明使用 SMOTE 处理类别不平衡问题对提高模型性能有显著作用,而 PCA 虽然能提高模型效率,但可能会去除一些关键判别特征。综合使用 PCA 进行特征选择和 SMOTE 平衡类别,能提升机器学习模型检测帕金森病的可靠性。

在研究结论和讨论部分,该研究具有重要意义。一方面,研究证实了语音特征可作为帕金森病早期诊断的重要指标,为临床诊断提供了新的、更便捷的途径。相比传统的神经影像学方法,语音检测具有非侵入性、操作简便、成本低等优势,有望成为早期筛查帕金森病的有效手段。另一方面,研究中对多种机器学习模型的比较分析,为后续相关研究提供了参考,有助于进一步优化诊断模型。不过,该研究也存在一定局限性,如数据集规模较小,可能无法全面代表帕金森病患者的多样性;模型在大规模数据集上的有效性尚未验证;在实际应用中还可能面临背景噪声、录音设置差异和语音变异性等问题 。未来的研究可以从扩大数据集、开发临床决策支持工具、结合多种生物标志物以及探索深度学习方法等方面展开,以进一步提高帕金森病诊断的准确性和可靠性,推动帕金森病诊断技术的发展,更好地服务于患者。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号