急诊科患者就诊量预测:针对数据分布变化的自适应长短期记忆(LSTM)模型

《Computer Methods and Programs in Biomedicine》:Patients visits forecasting in emergency departments: Self-adapting LSTM models for evolving data distributions

【字体: 时间:2025年11月16日 来源:Computer Methods and Programs in Biomedicine 4.8

编辑推荐:

  急诊科患者流量预测中自适应LSTM框架的构建与验证。提出基于LSTM的序列到序列模型,通过Per-Sequence Scaling(PSS)保持序列局部特性,结合Continual Learning(CL)实现增量更新以应对疫情等突发分布变化。实验表明,在1天和7天预测中,该框架的MASE值显著低于ARIMA和Prophet,但30天预测因长期趋势复杂性接近季节性直觉方法。自适应机制无需人工重训练,满足医院隐私与IT约束下的持续优化需求。

  在现代医疗体系中,急诊科(Emergency Department, ED)的拥挤问题一直是一个亟需解决的挑战。准确预测患者到访数量对于优化人力资源和物资分配至关重要,同时也能够提升医疗服务的质量和效率。然而,传统的预测模型在面对突发性的数据分布变化时往往表现不佳,例如在疫情爆发或医院组织结构调整期间。这些模型通常依赖于频繁的人工重新训练,这不仅耗费大量时间和资源,而且在数据隐私和IT系统限制的背景下,难以实现高效部署。因此,研究一种能够在数据分布变化下保持预测精度的深度学习框架具有重要的现实意义。

本文提出了一种基于Seq2Seq LSTM(长短时记忆网络)的自适应预测方法,旨在在无需人工干预或完全重新训练的情况下,提高模型对数据分布变化的适应能力。为了实现这一目标,研究引入了两种独立的策略:Per-Sequence Scaling(PSS)和Continual Learning(CL)。其中,PSS通过独立对每个序列进行归一化处理,保留了序列特有的统计特性,从而避免了全局归一化可能带来的信息丢失。CL则通过引入回放缓冲区(replay buffer)机制,使模型能够随着新数据的出现逐步更新参数,同时减少由于“灾难性遗忘”(catastrophic forgetting)导致的模型性能下降。这两种策略被分别与传统的统计模型(如ARIMA和Prophet)以及标准的LSTM Seq2Seq模型进行对比评估,以验证其在不同预测时间范围和数据分布条件下的有效性。

研究使用了覆盖疫情前、疫情期间和疫情后阶段的历史每日急诊科患者到访数据,这些数据来自法国的一家公共医院,时间跨度从2018年1月至2023年7月。该时间段内,患者流动呈现出显著的变化,特别是在疫情爆发初期,患者数量急剧下降,随后又出现波动。这种数据分布的非平稳性为模型的适应性提出了更高的要求。研究对三种预测时间范围(1天、1周、1个月)进行了评估,使用了多种指标,包括均方误差(MSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)以及均方误差比例(MASE),以全面衡量模型的预测性能。

在1天的预测任务中,PSS策略表现尤为突出,其误差指标均低于其他方法。具体而言,PSS在MSE、MAE和MAPE方面分别达到了197.62、11.11和9.48%,MASE值为0.786。这一结果表明,PSS不仅能够有效保留序列的局部统计信息,还能在短期内提供高度准确的预测。相比之下,标准的LSTM模型和ARIMA模型在相同任务中表现稍逊,而Prophet模型则因对时间序列的复杂模式捕捉能力不足,未能在所有指标上超越PSS。然而,当预测时间范围扩展到1个月时,PSS的性能逐渐趋近于季节性朴素预测(seasonal naive benchmark),这一现象可能与长期预测中序列特异性统计信息的重要性下降有关。

值得注意的是,在疫情相关突发变化的阶段,ARIMA模型偶尔展现出比PSS和CL策略更高的准确性。这一结果可能归因于ARIMA在处理具有明显季节性或周期性特征的数据时具有一定的优势。然而,随着疫情的结束和患者到访模式的恢复,PSS和CL策略在长期预测中的表现再次超越ARIMA,显示出其在适应数据分布变化方面的潜力。此外,研究还发现,CL策略通过回放缓冲区机制,能够有效缓解灾难性遗忘问题,从而确保模型在面对新数据时仍能保持较高的预测精度。相比之下,标准的LSTM模型在面对数据分布变化时需要进行完整的重新训练,这在实际应用中可能受到数据隐私和系统限制的影响。

通过将PSS和CL策略结合,研究构建了一个更为稳健的预测框架,能够在不同时间段和不同数据分布条件下持续提供准确的预测结果。这种自适应能力对于医院管理者而言尤为重要,因为急诊科的患者流动模式往往受到多种因素的影响,如季节性变化、公共卫生事件(如疫情)、医院内部政策调整等。这些因素可能导致数据分布的突然变化,而传统的预测模型在面对此类变化时往往难以迅速调整。因此,开发一种能够在数据分布变化下保持预测精度的模型,对于提高医院的运营效率和应对突发情况的能力具有重要意义。

此外,研究还探讨了模型在实际医疗环境中的部署可行性。由于医疗数据通常受到严格的隐私保护法规限制,模型的训练和更新过程需要符合数据安全和合规性要求。在这一背景下,PSS和CL策略的引入使得模型能够在不依赖完整数据集的情况下进行自我调整,从而降低了数据获取和处理的难度。同时,模型的参数更新过程也更加高效,减少了对计算资源的依赖,使其更适合在资源有限的医院环境中应用。

在实际应用中,预测模型的性能不仅取决于其在训练数据上的表现,还受到测试数据分布的影响。因此,研究特别关注了模型在不同时间段(如疫情前、疫情中、疫情后)的表现差异。结果表明,PSS和CL策略能够有效适应这些变化,而传统的统计模型则在面对数据分布的剧烈波动时表现出一定的局限性。例如,在疫情初期,由于患者到访模式的突然改变,ARIMA和Prophet模型的预测误差显著增加,而基于PSS和CL的LSTM模型则能够更快地适应新的数据分布,保持较高的预测精度。

除了预测精度,模型的稳定性也是评估其性能的重要指标。在长期预测任务中,模型需要在数据分布变化后仍然保持一致的预测能力,而PSS和CL策略的结合为实现这一目标提供了可行的解决方案。具体而言,PSS策略通过保留序列的局部统计信息,确保了模型在面对不同时间段的数据时能够保持一定的稳定性,而CL策略则通过回放缓冲区机制,使模型能够逐步学习新数据,同时避免遗忘旧数据中的关键信息。这种双重机制的结合,使得模型在面对复杂和非平稳的数据分布时,能够维持较高的预测准确性和稳定性。

研究还对模型的可解释性和实际应用价值进行了探讨。虽然深度学习模型通常被认为缺乏可解释性,但本文提出的PSS和CL策略在一定程度上提高了模型的可解释性。例如,PSS策略通过保留序列的局部统计特性,使得模型能够更好地捕捉数据中的关键特征,从而在一定程度上提高了预测结果的可信度。而CL策略则通过逐步更新模型参数,使得模型的适应过程更加透明和可控,为医院管理者提供了更直观的决策支持。

综上所述,本文提出的基于Seq2Seq LSTM的自适应预测框架在多个方面展现了其优越性。首先,它能够在数据分布变化的情况下保持较高的预测精度,特别是在短期和中期预测任务中。其次,它避免了传统模型在面对突发变化时需要频繁重新训练的缺点,从而降低了运营成本和数据隐私风险。最后,它为医院管理者提供了一种更为稳定和可靠的预测工具,有助于优化资源配置和提升医疗服务效率。

在未来的应用中,这种自适应预测框架不仅限于急诊科,还可能扩展到其他医院部门,如住院部、手术室和门诊部。这些部门同样面临着患者流量波动的问题,尤其是在面对突发公共卫生事件或季节性变化时。因此,开发一种能够适应多种数据分布变化的预测模型,对于提升整个医疗系统的运营效率具有广泛的适用性。

此外,本文的研究也为深度学习在医疗领域的应用提供了新的思路。虽然深度学习模型在处理复杂时间序列数据时表现出色,但其对数据分布变化的敏感性一直是限制其应用的重要因素。通过引入PSS和CL策略,本文为解决这一问题提供了可行的解决方案,同时也为其他类似任务的模型优化提供了参考。未来的研究可以进一步探索这些策略在其他医疗场景中的适用性,并结合更多的实际数据进行验证。

在医疗AI领域,预测模型的应用正逐步从单一任务扩展到更复杂的多任务场景。例如,一些研究已经尝试将预测模型与医院的运营决策相结合,如床位管理、人员调配和资源分配等。本文提出的自适应预测框架在这些方面也具有一定的潜力。通过结合PSS和CL策略,模型不仅能够提供准确的预测结果,还能够根据医院的实际需求进行动态调整,从而更好地支持决策过程。

最后,本文的研究强调了医疗预测模型在实际应用中的重要性。准确的预测不仅能够帮助医院优化资源配置,还能够提升患者满意度和医疗服务质量。特别是在面对突发公共卫生事件时,预测模型的适应性和稳定性显得尤为重要。因此,开发一种能够在数据分布变化下保持高性能的预测模型,对于提升医疗系统的应对能力和长期运营效率具有重要意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号