基于SEIAR模型与机器学习整合方法的中国成都猩红热传播动力学及社会经济决定因素研究

【字体: 时间:2025年07月18日 来源:Epidemics 3.0

编辑推荐:

  为解决猩红热(SF)传播机制不明、无症状携带者作用不清及社会经济因素影响量化不足的问题,研究人员采用SEIAR(易感-潜伏-感染-无症状-康复)模型结合Boruta-XGBoost-SHAP机器学习方法,分析了成都2005-2019年流行病学数据。研究发现SF呈现双峰季节性流行,儿童(3-7岁)和学校聚集性传播显著,且一孩率、人口密度和医疗资源是影响时间依赖再生数(Rt)的关键驱动因素。该研究为无疫苗条件下的精准防控提供了数据支持。

  

猩红热(Scarlet Fever, SF)是由A组链球菌(GAS)引起的急性呼吸道传染病,尽管抗生素的普及使其在发达国家发病率显著降低,但近年来中国多地出现疫情反弹,2011年香港甚至报告了致死病例。这种疾病的高发人群为3-7岁儿童,且无症状携带者的隐蔽传播给防控带来巨大挑战。更复杂的是,快速城市化进程中的人口流动、教育资源分布等社会经济因素如何影响SF传播,至今缺乏系统研究。

成都市疾病预防控制中心的研究人员针对这一科学问题,创新性地将传统传染病动力学模型与机器学习算法相结合,对成都2005-2019年间11,499例SF病例展开了多维度分析。他们首先构建了包含无症状感染状态的SEIAR(Susceptible-Exposed-Infectious-Asymptomatic-Recovered)模型,通过四阶龙格-库塔法拟合计算出时间依赖再生数Rt;随后运用Boruta算法筛选关键社会经济变量,并采用XGBoost-SHAP框架量化各因素对Rt的贡献度。这项发表在《Epidemics》的研究,首次揭示了社会经济因素与SF传播的动态关联。

关键技术方法包括:1)基于15年传染病监测数据的SEIAR模型构建,参数设定参考了潜伏期(ω=0.25 day-1)和病程(γ=0.06 day-1)等生物学特征;2)采用Moran's I指数和LISA聚类进行空间自相关分析;3)通过Boruta-XGBoost双验证机制筛选驱动因素,并用SHAP值解释变量贡献。

研究结果呈现三大发现:

3.1 流行病学特征
数据显示SF发病率呈现典型双峰季节性,4-5月和11-12月为高峰,而寒暑假期间病例显著减少。75.25%病例集中在3-7岁儿童,男女性别比达1.59:1。空间分布上,武侯区(年均发病率17.99/10万)和新都区(16.76/10万)为核心疫区,2011年后疫情从中心城区向周边扩散。

3.2 传播动力学模拟
SEIAR模型整体拟合优度R2=0.831(P<0.001),证实无症状感染者(设定比例ρ=8%)是重要传播源。敏感性分析显示模型对无症状者传染力参数k(0-1范围)变化具有稳健性。全市中位Rt为0.963,但成华区(1.384)、郫都区(1.305)等5个区域持续处于流行扩散状态(Rt>1)。

3.4 社会经济驱动机制
机器学习识别出六大关键因素:一孩率(SHAP值0.126)、人口密度(0.068)、医疗机构数量(0.052)位列前三。热图分析显示高Rt区域与高人口密度、低医疗资源分布高度重合,而教育资源配置通过影响学龄儿童聚集程度间接促进传播。

这项研究通过多学科方法创新,首次量化证明了家庭结构(一孩政策影响)和资源配置不平等对SF传播的塑造作用。其建立的Rt预警模型可提前2个月预测疫情高峰,为学校等重点场所的精准干预提供时间窗口。作者建议:1)在Rt>1区域增设临时筛查点;2)优化儿童医疗资源空间配置;3)建立跨区域联防联控机制。这些发现不仅为SF防控提供了新思路,其"动力学模型+机器学习"的研究范式也为其他呼吸道传染病的分析提供了方法论参考。

研究的局限性在于未纳入跨行政区人口流动数据,未来可结合手机信令等实时迁移数据构建元胞自动机模型。此外,气象因素与社会经济变量的交互效应也值得深入探索。这些方向将有助于进一步完善传染病预警体系的构建。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号