基于语音希尔伯特谱特征的帕金森病计算机辅助诊断系统研究

《Scientific Reports》:A computer-aided diagnosis system of parkinson’s disease based on hilbert spectrum features of speech

【字体: 时间:2025年12月21日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对帕金森病(PD)早期诊断难题,开发了一种基于汉语绕口令语音瞬时振幅特征的计算机辅助诊断系统。研究人员通过希尔伯特变换(HT)提取57维瞬时振幅特征,结合支持向量机(SVM)模型实现PD患者识别,准确率达91.43%。该系统为PD早期筛查提供了新型语音分析范式,具有实时远程诊断潜力。

  
随着人口老龄化进程加速,帕金森病已成为全球第二大神经退行性疾病。据统计,中国帕金森病患者人数已突破300万,预计到2030年将攀升至500万,占全球患者总数的50%。更令人担忧的是,这种疾病正呈现"年轻化"趋势,中青年患者比例已达5%-10%。帕金森病具有不可治愈性、病程长、致残率高等特点,给患者家庭带来沉重的心理压力和经济负担。
早期干预是延缓帕金森病恶性发展的关键,然而诊断过程却充满挑战。《2022年中国帕金森病患者诊疗与生活质量年度报告》显示,超过90%的患者需要一年以上才能获得确诊。这种诊断延迟主要源于疾病的独特性和复杂性:其运动症状(如构音障碍、肌肉强直、运动迟缓)和非运动症状(如感觉障碍、睡眠障碍)与其他神经系统疾病存在重叠,特别是早期症状不典型时更容易被误诊或漏诊。
在众多症状中,构音障碍被认为是帕金森病的早期重要标志之一,约89%的早期患者会出现此症状。患者常表现为单音调、低音调、声音嘶哑、清晰度降低、音量减弱、压力减少、音高波动、气短、停顿大和发音不准确等特征。这些语音变化为无创、低成本的早期筛查提供了可能。
传统基于元音持续发音的帕金森病检测方法存在一定局限性。西北师范大学马玉红团队创新性地利用汉语绕口令这一特殊语言形式,设计了包含"[pa] paI」 pjaol paI] paI] pho], phaol pn] phar] per pjenl phaao"等敏感音节的测试文本。这些音节对早期帕金森病患者的发音异常具有高度敏感性,为语音特征分析提供了独特素材。
研究方法主要包括三个关键技术环节:首先,研究团队在2023年4月至11月期间,从某医院老年病科门诊收集了97例疑似帕金森病患者的绕口令录音,构建了专门的语音数据库(其中67例为帕金森病患者,30例为非患者)。所有录音均满足完整性(超过10个清晰音节,录制长度不超过15秒)、清晰度(环境噪声无显著干扰)和有效性(完全排除其他构音障碍疾病)的要求。
其次,团队引入希尔伯特变换处理语音数据,获得语音的解析信号z(t)=x(t)+iy(t),进而提取瞬时振幅信号a(t)=√[x2(t)+y2(t)]。与原始振幅不同,瞬时振幅始终为正值,具有更优的数学特性。从瞬时振幅信号中,研究人员提取了每个音节对应的峰值(Vi)、峰位(Pi)、峰宽(Wi)和峰面积(Ei)等特征,结合总语音长度,构成了57维特征向量。
第三,研究比较了三种机器学习模型(支持向量机SVM、反向传播神经网络BP和长短期记忆网络LSTM)在三种特征集(振幅特征、瞬时振幅特征和复值图灰度分布特征)上的性能。通过五折交叉验证,以20次独立试验的平均准确率评估特征有效性和模型分类性能。
特征提取结果显示,帕金森病患者的语音特征与健康人群存在显著差异。从瞬时振幅信号来看,患者的每个音节波形较细,线条连贯性差,音量突然增大,出现爆破音或音节缺失,音节间停顿间隙长,流畅性弱。而非患者的音节饱满,波区大,音节连接紧凑,总长度通常小于患者。这些差异使得峰值、峰能和峰宽的平衡性以及峰位分布的均匀性成为区分两类人群的有效数值特征。
模型性能评估表明,基于瞬时振幅特征的支持向量机模型表现最优,识别准确率最高达100%,最低为89.47%,平均为92.10%,20次独立试验的方差仅为5.11%。相比之下,基于振幅特征的支持向量机模型平均准确率为91.56%,而基于复值图灰度分布特征的模型性能普遍不理想(最佳情况下为80.69%)。综合分析表明,支持向量机模型结合瞬时振幅特征在帕金森病语音识别中具有稳定且优异的性能。
基于这一发现,研究团队构建了一套完整的计算机辅助诊断系统。系统包含四个核心模块:数据预处理模块负责通过希尔伯特变换获取瞬时振幅信号并进行归一化、压缩、去噪和分割处理;特征提取模块计算57维瞬时振幅特征向量;机器学习模块使用支持向量机训练分类模型;系统应用模块实现实时诊断功能。系统还设有自动再训练机制,每新增20个样本即可重新优化模型。
临床验证显示,该系统在2024年6月至9月的医院门诊测试中,从35例疑似患者中准确识别出32例帕金森病患者,准确率达91.43%,平均响应时间仅为3.5秒。用户评价在安全性、稳定性和可用性三个维度均超过90分,表明系统具有较好的临床应用价值。
该研究的创新之处在于首次将汉语绕口令与希尔伯特变换相结合用于帕金森病诊断,突破了传统元音持续发音的分析范式。瞬时振幅特征能有效捕捉患者语音的细微变化,而支持向量机模型则提供了可靠的分类边界。这种非侵入性、低成本的筛查方法为帕金森病的早期发现提供了新思路,特别适合在基层医疗机构和远程医疗中推广应用。
然而,研究也存在一定局限性。样本量较小(97例)且数据不平衡(患者与非患者比例为67:30),测试结果对语言任务存在依赖性,且难以完全排除其他疾病(如轻度口吃、轻度阿尔茨海默病)引起的构音障碍。此外,模型的效度和准确度仍需长期验证,系统诊断错误的原因需要进一步分析。
未来研究方向包括扩大样本量,提取更多具有物理意义的语音特征进行分级学习,从而实现对帕金森病严重程度的分级评估。团队还计划将系统开发成简易手机应用程序,使医生或患者家属能够自主进行帕金森病筛查,真正实现早发现、早诊断、早治疗,延缓疾病进程,减轻患者痛苦和经济负担。
这项发表于《Scientific Reports》的研究,为帕金森病的早期诊断提供了新的技术路径,展示了语音分析结合机器学习在神经退行性疾病筛查中的巨大潜力。随着技术的不断完善和临床数据的积累,这种计算机辅助诊断系统有望成为帕金森病诊断流程中的重要补充工具,提升诊断效率,改善患者生活质量。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号