条件逻辑斯蒂个体水平模型中疾病传播的变量筛选方法比较研究及其在口蹄疫疫情分析中的应用

【字体: 时间:2025年08月16日 来源:Spatial and Spatio-temporal Epidemiology 1.7

编辑推荐:

  研究人员针对传染病空间传播模型变量选择难题,创新性地将条件逻辑斯蒂个体水平模型(CL-ILM)与六种变量筛选方法(包括逐步AIC、Lasso、SS prior等)相结合,通过模拟SI/SIR框架疫情和英国口蹄疫(FMD)实际数据验证,发现SS prior方法在准确性和计算效率上表现最优。该研究为传染病风险因子识别提供了标准化分析框架,显著提升模型解释力与预测性能。

  

在全球化时代,传染病暴发如同多米诺骨牌般冲击着公共卫生、经济和社会系统。从COVID-19疫情到口蹄疫(FMD)等动物疫病,精准预测疾病传播路径已成为科学界亟待解决的难题。传统个体水平模型(ILM)虽能刻画空间传播细节,却面临计算复杂度高、变量选择困难等瓶颈。加拿大卡尔加里大学(University of Calgary)的Tahmina Akter与Rob Deardon团队在《Spatial and Spatio-temporal Epidemiology》发表的研究,开创性地将条件逻辑斯蒂回归(CL-ILM)与多变量筛选技术结合,为这一领域带来突破性进展。

研究团队采用蒙特卡洛模拟生成SI/SIR框架下的疫情数据,结合2001年英国FMD真实疫情记录,系统比较了逐步AIC、最小绝对收缩选择算子(Lasso)、钉板先验(SS prior)等六种变量筛选方法。关键技术包括:基于EpiILM包的疫情数据模拟、MCMC参数估计、glmnet包的Lasso正则化,以及自定义开发的SS prior贝叶斯算法。通过灵敏度、特异度等指标量化评估,最终构建出兼顾精度与效率的传染病建模新范式。

在模型构建方面,研究揭示了CL-ILM的核心优势:通过固定空间参数β0,将非线性距离函数转化为可标准化的逻辑斯蒂形式,使模型计算效率提升约40%。公式Pit=1/(1+exp(-(α01∑dij0)))巧妙实现了感染概率与空间作用的关联建模。

变量筛选结果显示,钉板先验(SS prior)在7个有效变量的复杂场景中表现突出,平均准确率达0.937,较Lasso方法提升近50%。该方法通过双组分先验分布(钉部概率pk=0.5,板部服从U[0,5]),有效区分噪声变量与真实风险因子。特别在FMD数据分析中,SS prior准确识别出牛群规模(系数5.92,95%CI[4.87,6.94])为关键风险因素,而羊群数量呈现负相关(-3.09,[-4.68,-1.60])。

研究同时发现,当引入18个噪声变量时,两阶段筛选策略展现强大抗干扰能力:预筛结合SS prior的方法仅误选1个噪声变量,远优于传统Lasso(误选4个)。这一发现为高维流行病学数据建模提供了重要方法学参考。

该研究的创新价值体现在三方面:首先,建立了CL-ILM与变量筛选的标准化流程,使复杂疫情分析可通过R语言常规包实现;其次,证实贝叶斯SS prior在时空传染病建模中的优越性,其参数后验分布可视化(如图1)为风险因子评估提供直观依据;最后,开发的预筛策略有效解决了"维度灾难"问题,为大数据时代传染病预警系统建设奠定方法基础。未来研究可进一步探索弹性网络(Elastic Net)等混合方法,以及在SEIRS等多阶段传染病模型中的应用潜力。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号