ALSFRS-R的动态建模:利用基于人群的评分数据与神经网络相结合的方法
《Drug Resistance Updates》:Dynamic modelling of the ALSFRS-R: leveraging population-based scores using neural networks
【字体:
大
中
小
】
时间:2025年11月16日
来源:Drug Resistance Updates 21.7
编辑推荐:
人工智能预测肌萎缩侧索硬化症功能评分轨迹研究。通过全连接神经网络(FCNN)对人口基线PRECISION-ALS数据集进行建模,成功实现48点ALSFRS-R评分的短期预测(MAE 0.0552,R2 0.8694)。模型在PROACT外部验证中MAE降至0.0485,优于线性外推方法(MAE 0.0961)。研究证实机器学习可有效捕捉异质性临床轨迹,为试验监测和个体化管理提供工具。
在医学研究领域,神经退行性疾病如肌萎缩侧索硬化症(ALS)的临床进展预测一直是一个重要且具有挑战性的课题。ALS是一种以运动神经元逐渐退化为特征的疾病,导致肌肉无力、瘫痪、认知功能变化,最终影响患者的生存。由于疾病的个体差异性以及临床评估工具的局限性,准确预测患者的功能状态变化极为困难。本研究旨在开发一种基于完全连接神经网络(Fully Connected Neural Network, FCNN)的短期预测工具,用于预测ALS患者的ALSFRS-R评分轨迹,从而为临床实践和临床试验提供自然病史的基准参考。
### 一、背景与研究意义
ALSFRS-R是目前用于评估ALS患者功能状态的最常用临床工具,通过12个问题评估患者的言语、吞咽、手部精细动作、四肢粗大动作以及呼吸功能,每个问题的评分范围为0至4,总分范围为0至48。高分代表患者的功能状态较好,低分则意味着功能退化严重。然而,ALSFRS-R存在一些显著的局限性,例如评分的天花板和地板效应、非线性进展(尤其是在疾病早期)以及评分的异质性,这些因素使得传统的统计分析方法难以准确捕捉个体的疾病进展模式。此外,由于临床试验和日常医疗实践中数据的采集频率不一致,评分的时间间隔不规则,进一步增加了建模的难度。
因此,本研究引入了一种基于机器学习的方法,利用大型、跨欧洲的基于人群的ALS数据集——PRECISION-ALS,开发了一种能够处理不规则时间序列数据的预测模型。该模型不仅能够准确预测个体的ALSFRS-R评分轨迹,还能在不同临床情境下提供可靠的自然病史参考,从而优化临床试验设计、患者管理策略以及早期干预措施。
### 二、研究方法与模型构建
研究团队对PRECISION-ALS数据集进行了回顾性分析,该数据集包含来自九个欧洲国家的专业ALS中心的数据,涵盖了从诊断到死亡的多个时间点的ALSFRS-R评分记录。研究对象共5319名ALS患者,总共有29,992次评分记录。为了确保模型的泛化能力,研究者采用80:20的比例将数据分为训练集和测试集,并通过GroupShuffleSplit方法确保个体数据不重复出现在训练和测试集中。此外,研究团队还利用PROACT数据库进行外部验证,该数据库包含多个ALS临床试验的数据,且与PRECISION-ALS数据集无重叠,以确保模型在不同数据集中的适用性。
模型构建采用了三层次的完全连接神经网络(FCNN),其输入包括患者前两次的ALSFRS-R评分及其对应的时间间隔,输出为第三次的预测评分。为了提高模型的预测能力,研究团队对数据进行了标准化处理,并在训练过程中应用了Dropout机制以防止过拟合。模型的训练过程使用了Adam优化器,目标函数为均方误差(MSE),训练周期最多为100次,但实际在10次后即达到收敛,表明模型训练效率较高。
此外,研究团队还测试了另一种常见的神经网络模型——长短期记忆网络(LSTM),以评估其在该任务中的表现。尽管LSTM模型在处理时间序列数据方面具有优势,但在本研究中,其预测性能略逊于FCNN模型,特别是在平均绝对误差(MAE)和R2值方面。这表明,在当前的数据条件下,使用较为简单的FCNN结构可能更有效,因为它能够捕捉到不规则时间序列中的关键信息,而无需复杂的门控机制。
### 三、研究结果与模型性能
在PRECISION-ALS测试集上,FCNN模型的平均绝对误差(MAE)为0.0552(95%置信区间为0.0547至0.0576),对应的原始ALSFRS-R评分误差为2.65(95%置信区间为2.63至2.76)个点。这表明模型在预测个体评分时具有较高的准确性,误差范围相对较小。此外,模型的R2值为0.8694(95%置信区间为0.8557至0.8752),说明模型能够较好地解释评分变化的方差。
在外部验证的PROACT数据集上,模型的性能进一步提升,MAE降低至0.0485(95%置信区间为0.0481至0.0489),对应的原始评分误差为2.33(95%置信区间为2.31至2.35)个点,R2值达到0.8961(95%置信区间为0.8931至0.8992)。这一结果表明,模型不仅在训练集上表现良好,而且在新的、未见过的数据集上也具有良好的泛化能力。
相比之下,线性外推方法在所有评估指标中表现较差。例如,在PRECISION-ALS测试集上,线性外推的MAE为0.0961(95%置信区间为0.0896至0.1039),对应的原始评分误差为4.61(95%置信区间为4.30至4.99)个点,远高于FCNN模型的预测误差。这说明,传统的线性方法在处理ALSFRS-R这种非线性变化的评分数据时存在明显的局限性,而神经网络方法则能够更好地捕捉评分变化的复杂模式。
### 四、模型的临床适用性与优势
研究团队进一步探讨了模型在不同临床变量下的表现。结果显示,模型的预测误差在性别、基因型、发病部位、诊断年龄、发病年龄和诊断延迟等方面均保持一致,没有显著差异。这表明,无论患者的背景如何,该模型都能提供相对准确的预测。这一特性对于临床实践和临床试验具有重要意义,因为它意味着模型可以广泛应用于不同类型的患者群体,而无需针对特定人群进行调整。
此外,模型在不同时间段内的表现也较为稳定。在短期(0–12个月)、中期(12–24个月)、长期(24–48个月)以及更长时间段(>48个月)的预测误差均未出现显著波动。这表明,该模型能够适应不同阶段的疾病进展,并在各个时间窗口内提供可靠的预测结果。这种稳定性对于临床医生和研究人员来说至关重要,因为它有助于制定长期的随访计划和干预策略。
模型还展示了其在处理ALSFRS-R子评分方面的潜力。尽管使用子评分时模型的预测误差略高于总评分,但仍然优于线性外推方法。这表明,即使在数据维度增加的情况下,FCNN仍然能够提供有价值的预测信息。然而,研究团队也指出,过多的子评分可能会导致模型过度拟合,从而影响其在新数据上的泛化能力。因此,在构建模型时需要权衡输入数据的复杂性和模型的泛化能力。
### 五、模型的实际应用与潜在价值
该模型的开发为ALS的临床管理提供了新的工具。在临床试验中,研究人员可以利用该模型作为基准,快速识别那些进展速度明显偏离预期的患者,从而决定是否继续试验或提前终止。此外,模型还可以用于日常医疗实践,帮助医生更好地理解患者的病情变化,制定个性化的治疗方案。
在临床环境中,模型还可以作为远程医疗的辅助工具。例如,随着移动应用、智能手机和可穿戴设备的发展,患者可以在家中自行记录ALSFRS-R评分,这些数据可以通过模型进行分析,提供实时的临床反馈。这种基于数据驱动的预测方法能够提高医疗效率,减少不必要的检查和干预,同时提升患者的整体生活质量。
此外,模型的高预测精度也有助于优化患者招募策略。在临床试验中,准确的预测可以帮助研究人员更有效地筛选符合条件的患者,确保试验的科学性和可操作性。同时,模型还可以用于评估不同治疗方案的效果,为临床决策提供数据支持。
### 六、研究的局限性与未来展望
尽管该模型在多个方面表现出色,但研究者也承认其存在一些局限性。首先,数据的稀疏性和不规则性仍然是一个挑战。许多患者在诊断后仅能提供有限的评分记录,这可能影响模型的预测精度。因此,研究团队采用了滚动窗口的方法来处理这一问题,但仍然无法完全解决数据缺失的问题。
其次,研究对象主要集中在白人欧洲人,这可能限制模型在其他种族或文化背景下的适用性。因此,在未来的研究中,需要扩大数据来源,以提高模型的多样性和代表性。
此外,研究团队并未提供具体的决策阈值,这意味着在实际应用中,如何将模型的预测结果转化为临床行动仍需进一步探索。未来的工作可以结合临床医生的经验,建立一套标准化的决策框架,以便更有效地利用模型的预测能力。
最后,尽管模型在当前的数据条件下表现良好,但随着数据量的增加和数据类型的多样化,更复杂的神经网络结构可能会提供更高的预测精度。例如,结合卷积神经网络(CNN)或深度学习技术的模型可能能够更好地捕捉评分变化中的细微模式。然而,由于当前数据的稀疏性,这些复杂模型尚未能有效应用于ALSFRS-R预测任务。
### 七、结论与展望
本研究展示了基于完全连接神经网络的短期预测模型在ALSFRS-R评分轨迹预测中的潜力。该模型不仅能够准确捕捉个体患者的评分变化,还能在不同数据集和时间段内保持一致的性能,为临床实践和临床试验提供了重要的参考工具。随着基于人群的自然病史数据的不断积累,以及多模态数据的整合,未来的研究可能会进一步优化模型的结构和性能,从而实现更精确的个体化预测。
总体而言,该模型的开发为ALS的临床管理带来了新的可能性。通过将复杂的疾病进展模式转化为可预测的指标,模型能够帮助医生和研究人员更好地理解疾病的自然病史,并制定更加精准的干预策略。未来,随着数据的进一步丰富和技术的进步,这种基于人工智能的预测工具有望在更广泛的临床场景中发挥作用,为ALS患者提供更加个性化的医疗服务。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号