编辑推荐:
帕金森病(PD)早期诊断困难,严重影响治疗效果。研究人员开展了利用智能手机多模态特征辅助早期识别 PD 的研究。结果显示,整合语音、手指敲击和步态特征的模型诊断性能更优。这为 PD 早期诊断提供了新途径,具有重要意义。
帕金森病(Parkinson’s disease,PD)是一种常见的神经退行性疾病,预计到 2030 年将影响近 900 万人。其主要表现为运动功能障碍,如运动迟缓(bradykinesia)、肌强直、静止性震颤以及步态异常等。目前,PD 的治疗主要是对症治疗,尚无治愈方法。随着机制靶向疗法逐渐进入临床试验阶段,早期检测 PD 变得至关重要。然而,现有的用于辅助早期识别 PD 患者的成像和生物流体标志物,均未在常规临床实践中广泛应用。
在此背景下,来自台湾大学等机构的研究人员开展了一项研究,旨在探究智能手机衍生的多模态特征结合机器学习算法能否助力 PD 的早期识别。该研究成果发表在《npj Parkinson's Disease》杂志上。
研究人员为开展此项研究,采用了多种关键技术方法。首先,从台湾大学医院招募了 496 名参与者,包括 213 名 PD 患者和 283 名未患病的对照者 ,并将其分为训练集和测试集。其次,运用智能手机上实验室定制的应用程序,对参与者进行主动运动评估,获取语音、手指敲击运动和步态数据。然后,利用 Google MediaPipe 等工具处理数据,提取相关特征。最后,通过顺序向前选择(SFS)算法训练模型,并使用 10 折交叉验证评估模型性能。
下面来详细了解该研究的结果:
- 人口统计学特征:参与者中,PD 患者组和对照组的年龄相当,但 PD 患者组中男性比例更高。
- 语音分析:PD 患者朗读文章耗时更长、阅读时停顿更多,音高和音量变异性降低。语音停顿百分比随疾病严重程度增加,且早期和晚期 PD 患者与对照组之间差异显著。
- 手指敲击分析:PD 患者与未患病的对照者在手指敲击测试中的平均频率差异显著。随着 PD 严重程度增加,食指与拇指的距离减小,且重复敲击后,敲击距离的减少会由敲击频率的增加来补偿。
- 步态分析:PD 患者的平均步长更短,平均每轮转身持续时间更长,且这种差异与疾病严重程度相关,在晚期 PD 患者中更为明显。
- 单模态模型的诊断性能:使用训练数据集,分别以语音、手指敲击和步态这三种生物标志物构建单模态模型来识别 PD 患者。结果显示,仅使用语音特征时,随机森林(RF)分类器在训练队列中的诊断值(AUROC)为 0.88,测试数据中为 0.80;手指敲击测试的诊断性能较低,训练集和测试数据中的 AUROC 均为 0.74;步态特征单独使用时,训练集的诊断准确率为 0.81,测试数据中为 0.76。在区分早期 PD 患者和未患病的对照者时,语音特征的 SVM 分类器表现最佳,训练集和测试数据中的 AUROC 分别为 0.83 和 0.74 。
- 集成多模态模型的诊断性能:将语音、手指敲击运动和步态特征集成构建多模态模型,使用 SVM 分类器的 AUROC 分析显示,在测试数据中区分 PD 患者和未患病的对照者时,诊断值达到 0.86,优于任何两种模态组合的结果。对于早期 PD 患者的识别,集成模型的 AUROC 值为 0.82,在识别晚期 PD 患者时,AUROC 达到 0.95。进一步验证表明,集成三模态模型的 F1 评分和准确率等指标均显著优于单模态模型。
在讨论部分,研究人员指出,语音作为 PD 的早期软体征,虽可用于区分 PD 患者和未患病的对照者,但现有研究存在局限性,如缺乏对自发语言基于语言层面的分析。手指敲击运动数据单独用于诊断时,性能一般,尤其在区分早期 PD 患者时表现欠佳。步态分析方面,尽管 3D 步态模型提供了较好的诊断性能,但仅依靠步态特征区分早期 PD 仍存在不足。PD 是一种多方面的神经退行性疾病,临床表现多样,基于单模态的诊断模型存在局限性,容易受到年龄等混杂因素的影响,难以准确识别 PD,尤其是在早期阶段。而本研究的集成多模态模型结合了多种数字生物标志物,能更全面地评估 PD,减少混杂因素的影响,提高诊断准确性,特别是在早期 PD 的识别上优势明显。
综上所述,该研究成功开发了基于智能手机录音的多模态模型,用于区分 PD 患者和未患病的对照者。集成多模态模型在早期 PD 识别中表现出良好的性能,优于单模态模型。这一研究成果为 PD 的早期诊断提供了新的方向和方法,有望实现大规模低成本筛查以及远程客观监测治疗反应。不过,该研究也存在一些局限性,如语音数据集主要基于当地语言、缺乏社区人群的外部验证、未纳入基于语言的特征以及手指敲击距离计算可能存在不精确等问题。未来需要进一步研究来解决这些问题,以完善对 PD 的诊断和监测。