综述:环境流行病学中的中断时间序列分析:传统与新型建模方法综述
《Current Environmental Health Reports》:Interrupted Time Series Analysis in Environmental Epidemiology: A Review of Traditional and Novel Modeling Approaches
【字体:
大
中
小
】
时间:2025年12月02日
来源:Current Environmental Health Reports 9.1
编辑推荐:
本综述系统介绍了中断时间序列(ITS)分析在环境健康领域的应用进展,重点对比了传统分段回归、ARIMA模型、机器学习(如Prophet-XGBoost)及贝叶斯框架等方法的优劣。通过2018年旧金山野火烟雾事件导致呼吸道住院病例激增的案例,深入解析了各模型在处理复杂时间模式(如季节性、非线性趋势)和空间异质性效应中的实践策略,为环境政策与极端天气事件的健康影响评估提供了方法学支持(保留PM2.5、RR等专业符号)。文中附带的开源代码与数据集进一步增强了研究的可复现性。
环境流行病学中的中断时间序列分析:传统与新型建模方法综述
中断时间序列(ITS)设计作为一种准实验方法,近年来在环境健康研究中日益受到重视,尤其适用于评估极端天气事件或环境政策的突发影响。本文通过整合传统统计模型与前沿计算方法,系统探讨了ITS在因果推断中的实践路径与挑战。
2018年11月8日,加利福尼亚州布特县爆发的“坎普山火”持续燃烧逾两周,虽远离旧金山市区,但其产生的烟雾导致当地日均PM2.5浓度连续12天超过美国环保署(EPA)设定的24小时标准限值(35μg/m3),峰值达105μg/m3。这一明确的时间节点与急性健康效应(如呼吸道住院病例的快速响应)为ITS分析提供了理想场景。
经典分段回归采用准泊松模型,通过事件指示变量(Eventt)、时间趋势项(Timet)、季节谐波函数(含年日期谐波项)及环境协变量(非烟雾PM2.5、气温立方样条、相对湿度与降水)构建反事实轨迹。模型显示烟雾事件期间呼吸道住院风险显著增加14%(RR=1.14),对应超额住院90例(95%CI:69-110)。该模型依赖预设的函数形式,对非线性趋势与空间异质性捕捉有限。
为处理时间序列自相关性,ARIMAX模型通过自动选择参数(p,d,q)优化预事件期拟合,并预测反事实住院数。其ARIMA(2,1,3)结构包含一阶差分、2阶自回归与3阶移动平均项,辅以外生变量校正。结果预估超额住院174例,但预测区间较宽(95%CI:-47~394),反映模型对短期事件的不确定性较高。
机器学习融合:Prophet-XGBoost混合模型
结合Prophet时间分解与XGBoost梯度提升的混合模型,通过滑动窗口交叉验证(5折)自动捕获非线性交互与滞后效应(如环境变量7日滞后)。模型在训练集与测试集均表现良好(RMSE≈6.5),预测反事实住院643例,推算超额住院95例(95%eCI:48~144)。该方法虽预测精度高,但计算复杂且假设检验透明度较低。
基于ZCTA(邮区编码制表区域)级数据,贝叶斯ITS引入时空随机效应(月际随机游走+BYM2空间先验),直接量化事件效应的空间异质性。结果显示超额住院109例(RR=1.17),且东部沿海与湾景区 attributable fraction(AF)显著高于中部及西部社区,揭示地形、建成环境或社会经济因素可能导致健康影响的空间分异。
四类模型各具特色:分段回归简洁易解但依赖预设形式;ARIMA擅长处理自相关却对非平稳序列敏感;机器学习灵活性高但可解释性弱;贝叶斯框架兼顾时空依赖而计算成本高昂。选择需权衡研究目标、数据规模与先验知识。此外,模型未覆盖交错干预、群体异质性或多重间接效应(如热浪与臭氧的交互作用)等复杂场景,未来可结合分层分析或中介模型拓展。
ITS方法通过反事实构建为环境暴露的急性健康效应评估提供了强因果推断工具。本文以野火烟雾事件为锚点,演示了从传统到前沿模型的完整分析链条,其开源代码与数据共享进一步推动了方法学的可复现应用。随着极端气候事件频发,ITS在环境政策优化与健康公平性研究中的价值将日益凸显。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号