时间序列分析中基于时间聚合数据的无偏估计方法研究:跨结果、暴露与聚合类型的普适性验证
【字体:
大
中
小
】
时间:2025年10月04日
来源:Epidemiology 4.4
编辑推荐:
本研究针对时间序列分析中因健康数据时间聚合导致估计偏差的难题,开发了一种基于时间聚合结果数据的无偏估计方法。通过模拟分析验证了该方法在死亡率/住院量(结果)、温度/二氧化氮(NO2)暴露及多种聚合方案(含非连续日聚合)中的普适性。结果表明,在数据充足条件下,该方法能有效还原底层关联,且适用于周数据等复杂场景,为资源受限地区的健康政策制定提供了可靠分析工具。
背景:近期提出并实施了一种新型时间序列分析方法,该方法利用时间聚合结果数据(temporally aggregated outcome data)生成对底层时间分散化结果与协变量数据关联的无偏估计。但该方法的性能此前仅在与温度(temperature)和死亡率(mortality)之间的延迟非线性关系背景下,以及连续日聚合场景中得到验证。
方法:研究人员通过模拟分析(simulation analysis)检验了该方法的性能,涵盖:(i)死亡率和住院量(hospital admissions)作为健康结果;(ii)温度和二氧化氮(nitrogen dioxide, NO2)作为暴露因素;(iii)开放获取健康数据中最常用的三种聚合方案(aggregation schemes),包括非连续日(non-consecutive days)的聚合组合。
结果:在拥有足够分析数据的情况下,该方法能够还原所有结果、暴露及聚合方案组合下的底层关联。估计值的偏差(bias)和变异性(variability)随结果数据聚合程度的增加而上升,并随样本量(数据集长度、病例数)的增加而下降。值得注意的是,即使在极端情况下(如每周结果数据且关联受星期几效应confounded by day of the week干扰的空气污染模型中),估计值仍保持无偏。
结论:在数据充足的前提下,该方法能灵活生成无偏估计,将先前结果推广至其他结果类型、暴露因素以及聚合类型与程度。这一成果有望推动现有时间聚合健康数据在科研、转化应用及政策制定中的使用,特别是在资源匮乏与农村地区。
通俗摘要(Plain Language Summary):一项针对时间序列数据分析新方法的模拟研究显示,该方法能通过聚合数据准确估计健康结果(如死亡率、住院量)与环境暴露(如温度、NO2)之间的关联。研究测试了多种健康结果、暴露类型及数据聚合方式,证实只要数据量充足,即使面对周数据等复杂聚合场景或星期几混淆效应,该方法仍可提供可靠估计。该技术有望提升聚合健康数据在资源受限地区的科研与政策应用价值。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号