基于持续元音声学特征与LightGBM的延髓型ALS早期诊断模型研究

【字体: 时间:2025年08月03日 来源:eNeurologicalSci CS3.5

编辑推荐:

  本研究针对肌萎缩侧索硬化症(ALS)缺乏早期生物标志物的临床难题,创新性地采用持续元音发声(SVP)的131项声学特征,通过LightGBM算法构建预测模型,取得RMSLE 0.162的优异性能,其中病理震颤指数(PVI)等特征展现出重要诊断价值,为ALS早期筛查提供了非侵入性、低成本的新型解决方案。

  

肌萎缩侧索硬化症(ALS)作为一种进行性神经退行性疾病,其诊断目前主要依赖临床症状观察,平均确诊时间长达12个月。特别是延髓型ALS患者,80%会出现构音障碍,但传统语音清晰度评估对早期病变不敏感。这种诊断延迟严重影响了治疗时机和患者预后,开发客观、敏感的早期诊断工具成为临床迫切需求。

针对这一挑战,伊朗沙希德·贝赫什提医科大学学生研究委员会的研究团队在《eNeurologicalSci》发表创新研究。他们另辟蹊径地从语音产生机制入手——语音需要呼吸、发声、共鸣和构音系统的精密协同,而神经系统损伤会引发细微的声学特征改变。研究团队重点分析持续元音/a/和/i/的声学特征,这种简单发音任务既能规避连续语音的复杂性,又能敏感反映延髓功能状态。

研究采用Minsk2020 ALS数据集,包含31名ALS患者和33名健康人的128段元音录音。通过提取131项声学参数(包括抖动jitter、振幅扰动shimmer、梅尔频率倒谱系数MFCCs等),结合LASSO等特征选择方法,最终构建基于LightGBM的分类模型。技术路线涵盖5折交叉验证、Root Mean Squared Logarithmic Error(RMSLE)评估等机器学习关键技术。

在结果部分,模型表现出色:整体RMSLE仅0.162,预测值与实际诊断高度吻合。特征重要性分析揭示,S55_i(元音/i/的特定频谱特征)、CCI(2)(二阶倒谱系数)和dCCa(12)(元音/a/的微分倒谱特征)最具鉴别力。特别值得注意的是病理震颤指数PVI,其数值与ALS诊断呈现强相关性,可能反映声带运动神经元损伤导致的频率调制异常。

讨论部分深入剖析了这些发现的科学价值。与Vashkevich等前人研究相比,该工作创新性地证实了持续元音分析对延髓型ALS的特异性。PVI作为新型生物标志物的提出尤为关键,其物理意义可能对应运动神经元退化引发的声带振动不稳定性。相比需要专业设备的传统方法,该方案仅需智能手机录音即可实现,在远程医疗场景中优势显著。

当然,研究也存在样本量有限(仅64人)、仅分析元音未涵盖连续语音等局限。作者建议未来应扩大样本多样性,整合多模态数据,并探索深度学习等更先进的算法。这些改进可能进一步提升模型在临床前期的敏感性,为ALS超早期干预创造可能。

这项研究的临床意义不容小觑:它首次系统证实了持续元音声学特征作为ALS无创筛查工具的可行性。相比昂贵的影像学或侵入性检查,这种"语音活检"技术更易在基层医疗机构推广。特别是对于延髓型ALS患者,早期发现意味着能更及时地开始吞咽功能训练和语言康复,显著改善生活质量。随着后续研究的深入,这种基于声学的人工智能诊断模式或将成为神经退行性疾病早期预警系统的重要组成部分。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号