基于LSTM模型的实时呼吸信号预测:训练数据集规模对预测精度的影响研究

【字体: 时间:2025年06月08日 来源:Radiation Oncology 3.3

编辑推荐:

  本研究针对放疗中呼吸运动导致的肿瘤靶区位移问题,创新性地采用长短期记忆网络(LSTM)模型,系统探究了训练数据集规模(TDS)对呼吸信号预测精度的影响。通过分析151例患者的实时位置管理系统(RPM)数据,发现90秒TDS即可实现稳定预测(RMSE=0.120 cm),为临床缩短患者等待时间、优化呼吸门控技术提供了重要依据。

  

在胸腹部恶性肿瘤的放射治疗中,呼吸运动导致的肿瘤靶区位移一直是困扰临床的难题。传统解决方案是通过扩大照射范围(从临床靶区CTV到内靶区ITV)来覆盖所有潜在位置,但这会显著增加正常组织的辐射剂量,加剧副作用。更棘手的是,放疗设备从获取肿瘤位置信号到机械响应存在50-500毫秒的延迟,这意味着实时追踪需要提前预测呼吸信号。

以往研究多聚焦于模型架构优化,却忽略了训练数据集规模(TDS)这一关键因素——过短的TDS会导致预测不准,而过长的TDS又延长患者等待时间。针对这一空白,浙江大学医学院附属第二医院等机构的研究团队在《Radiation Oncology》发表了一项开创性研究。

研究团队采用患者特异性建模策略,利用151例患者的实时位置管理系统(RPM)数据(采样率25Hz),通过贝叶斯优化超参数带(BOHB)框架确定最佳超参数组合。主要技术包括:1)滑动窗口法构建时间序列输入输出对;2)五类超参数(层数、优化器、学习率等)系统测试;3)基于均方根误差(RMSE)的多维度评估;4)不同预测时长(160-520ms)的交叉验证。

训练数据集规模的影响
结果显示,当TDS从10秒增至150秒时,RMSE从0.146 cm降至0.119 cm(520ms预测时长)。但超过90秒后,精度提升趋缓(90秒与150秒仅差0.001 cm),且统计检验表明60-90秒区间已达显著稳定水平(p<0.05)。这表明90秒可能是临床应用的"甜蜜点"。

时间依赖性的挑战
随着测试数据长度增加,所有TDS组的预测精度均下降。但TDS≥90秒时,这种衰减趋势明显减缓,说明充足训练数据能增强模型对呼吸模式变化的鲁棒性。

超参数的协同效应
• 学习率:0.005最佳,过小(0.0001)需更大TDS,过大(0.1)导致震荡
• 网络结构:2层LSTM表现最优,单层欠拟合,5层过拟合
• 优化器:Adam在TDS>30秒时优于Rprop
• 输入长度:50个时间点(2秒)最佳,过短丢失时序特征
• 隐藏单元:64个平衡拟合与泛化能力

预测时长的普适性
虽然预测误差随提前时间(160→520ms)递增,但90秒TDS在所有区间均保持稳定表现,证实其广泛适用性。

这项研究首次系统论证了TDS与LSTM预测精度的非线性关系,为临床实践提供了三大价值:1)将必要训练时间从文献报道的9.2分钟压缩至90秒;2)确立Adam优化器+2层LSTM+50点输入的参数组合;3)揭示了呼吸信号"近因效应"——距离当前时间越远的数据贡献度递减。正如通讯作者Bing Li强调的,该成果不仅提升了放疗精度,更通过优化患者舒适度推动了精准医疗的人性化发展。未来研究可探索自适应TDS选择算法,进一步个性化呼吸运动管理方案。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号