
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于环境-社会经济-媒介因素整合机器学习的美国莱姆病风险预测研究
【字体: 大 中 小 】 时间:2025年06月16日 来源:One Health 4.1
编辑推荐:
莱姆病作为美国最常见的蜱媒传染病,其传播风险受环境、社会经济和媒介因素多重影响。南京医科大学团队通过整合2001-2022年县级监测数据,采用随机森林(RF)、增强回归树(BRT)和XGBoost机器学习模型,首次量化了COVID-19大流行对莱姆病报告率的冲击(2020年骤降43.9%),揭示人口密度、肩突硬蜱生态位和最高温度是关键预测因子,为精准防控提供数据支撑。
莱姆病是由伯氏疏螺旋体(Borrelia burgdorferi)通过硬蜱(Ixodes species)叮咬传播的疾病,已成为美国最严重的虫媒传染病。随着气候变化和人类活动范围扩大,其发病率从2001年的16,862例激增至2022年的61,802例,地理分布也向东南部扩张。然而,传统研究多聚焦单一环境因素,忽视社会经济要素与突发公共卫生事件的复合影响,特别是COVID-19大流行如何改变莱姆病传播模式尚不明确。
南京医科大学的研究团队在《One Health》发表的研究,创新性地整合了环境、社会经济和媒介三维度数据,通过机器学习揭示了莱姆病传播的驱动机制。研究收集了2001-2022年美国县级莱姆病监测数据,结合NOAA气候数据、ESA土地覆盖数据、人口经济数据及CDC的硬蜱分布数据。采用随机森林(RF)、增强回归树(BRT)和XGBoost三种算法构建预测模型,并运用SHAP(Shapley Additive Explanations)可解释性分析量化各因素贡献度。
3.1 莱姆病时空分布特征
通过热图分析发现,病例数从2001年16,862例增长至2022年61,802例,地理重心从东北部向东南部转移。宾夕法尼亚州、纽约州和新泽西州始终是疫情核心区,2022年纽约州单年病例达16,796例。值得注意的是,2020年发病率骤降至5.41/10万,与COVID-19大流行时间高度吻合。
3.2 媒介蜱生态位预测
XGBoost模型显示,肩突硬蜱(I. scapularis)已扩散至美国东部全境,而太平洋硬蜱(I. pacificus)则沿西海岸向内陆延伸。这两种媒介的分布变化与莱姆病地理扩张趋势一致。
3.3 疾病风险预测模型
XGBoost模型表现最优(R2
=0.824),SHAP分析识别出三大关键因子:人口密度(每增加1单位SHAP值提升0.15)、肩突硬蜱生态位(贡献度28.7%)和最高温度(呈负相关)。土地覆盖分析发现,森林碎片化边缘地带风险最高,而连续森林区风险较低,印证了"边缘效应"理论。
3.4 COVID-19的冲击效应
模型预测2020年应报告31,680例,实际仅17,743例(偏差-43.9%),新英格兰地区降幅达56.3%。2021年持续偏低22.0%,表明封锁政策通过减少户外活动和医疗可及性双重机制影响莱姆病报告。2022年病例激增可能包含诊断标准修订的干扰因素。
这项研究首次系统量化了社会经济因素对莱姆病传播的贡献,证实人口密度比气候因子的影响更强。创新性地揭示COVID-19大流行通过改变人类行为模式(如户外活动减少)和医疗系统承压(如诊断延误)双重途径,显著扭曲了莱姆病自然流行曲线。研究提出的整合机器学习框架,为应对气候变化下的虫媒传染病防控提供了可推广的方法学范式,特别是SHAP分析实现了"黑箱模型"的可解释化。公共卫生部门可据此优化监测策略,在气候变暖和人口流动加剧的背景下,重点防范城乡交界带等高风险区域的疫情暴发。
生物通微信公众号
知名企业招聘