
-
生物通官微
陪你抓住生命科技
跳动的脉搏
CoSTI:基于一致性模型的高效时空数据填补方法及其在医疗监测与交通管理中的应用
【字体: 大 中 小 】 时间:2025年07月23日 来源:Knowledge-Based Systems 7.2
编辑推荐:
为解决多变量时间序列(MTS)数据缺失问题,研究人员创新性地将一致性模型(CMs)引入时空数据填补(MTSI)领域,提出CoSTI框架。该研究通过一致性训练(CT)和定制化时空架构,在保持与去噪扩散概率模型(DDPMs)相当精度的同时,将推理时间缩短98%。成果发表于《Knowledge-Based Systems》,为ICU监护、交通控制等实时应用提供了高效解决方案。
在医疗监护和交通管理等关键领域,多变量时间序列(MTS)数据的完整性直接影响决策质量。然而传感器故障、记录遗漏等问题导致数据缺失现象普遍存在,传统填补方法如均值填充会引入偏差,而基于循环神经网络(RNN)或图神经网络(GNN)的方法又难以兼顾时空依赖性。更先进的去噪扩散概率模型(DDPMs)虽精度优异,但其迭代式推理过程耗时严重——例如在METR-LA数据集上需要3.65小时完成测试集填补,无法满足ICU实时监护等场景需求。
针对这一瓶颈,研究人员开创性地将计算机视觉领域的一致性模型(CMs)引入时空数据填补。通过概率流常微分方程(PF-ODE)建立噪声扰动与数据分布的关系,设计具有双分支结构的U-Net架构:主分支处理含噪声的原始信号,条件分支整合观测值Xt、掩码矩阵Mt和邻接矩阵A。核心创新点包括:1)时空特征提取模块(STFEM)融合双向Mamba块和空间自注意力机制;2)噪声提取模块(NEM)通过交叉注意力整合条件信息;3)采用线性课程学习策略,将噪声级别N从10逐步提升至200以平衡训练稳定性。
关键技术涵盖:1)基于Karras噪声调度器的多级扰动;2)使用伪Huber损失函数进行一致性匹配;3)Scheduler-Free优化器实现稳定训练;4)对PhysioNet Challenge 2019等6个基准数据集进行系统验证,涵盖从空气监测(AQI-36)到临床记录等不同缺失场景。
研究结果显示:
通过消融实验证实:条件信息分支贡献最大,移除后MAE骤增至6.36±0.02;而课程学习策略使最终性能提升7%。研究同时发现,当缺失率超过60%时,所有模型性能均显著下降,但CoSTI仍保持最优鲁棒性。
这项发表于《Knowledge-Based Systems》的工作,首次证明一致性模型在时空数据领域的适用性。其重要意义在于:1)为实时医疗监护提供可行方案,例如 sepsis(败血症)风险预测的响应时间从小时级缩短至分钟级;2)提出的双分支架构为多模态条件生成提供新范式;3)开源的代码库(GitHub: javiersgjavi/CoSTI)包含完整实现细节,推动领域发展。未来可扩展至动态图学习、异常检测等方向,但当前在PEMS08等稀疏拓扑数据集的表现仍有提升空间。
生物通微信公众号
知名企业招聘