全球动物SARS-CoV-2感染风险的预测建模:揭示潜在病毒库与推动公共卫生协同政策

【字体: 时间:2025年10月02日 来源:Transboundary and Emerging Diseases 3

编辑推荐:

  本综述运用机器学习(ML)模型(包括BRT、XGBoost和RF)预测全球动物SARS-CoV-2感染风险分布,揭示欧洲、美国及南亚等高危区域。研究发现人为因素(如人口密度、城市可达性、COVID-19死亡率)比生物物理因素更具预测力,强调跨部门协同(One Health)对防控人兽共患病(zoonosis)及潜在病毒库管理的重要性。

  
引言
尽管COVID-19不再被列为全球卫生紧急事件,但SARS-CoV-2病毒仍对公众和动物健康构成重大威胁。该病毒具有跨物种传播能力,从人类传播到动物的事件屡见报道,包括家猫、狮子、老虎、貂、白尾鹿等。动物感染不仅威胁动物福利,还可能形成病毒储存库,引发病毒变异并回传人类,例如丹麦貂养殖场事件导致超过1700万只貂被扑杀。因此,了解驱动动物感染的环境因素和人为因素对于制定未来预防和控制策略至关重要。
方法
数据收集与处理:研究通过系统文献检索(截至2022年12月)、世界动物卫生组织(WOAH)报告及GenBank数据库,收集了550例动物SARS-CoV-2自然感染记录。数据覆盖22个动物物种,包括地理坐标和感染时间。使用地理参照方法处理位置信息,确保数据空间准确性。
影响因素分析:共筛选27个环境与人为变量,分为六类:气候条件(如温度、降水、风速、太阳辐射)、景观特征(如香农多样性指数、边缘密度)、 livestock密度(包括牛、禽类等)、人口密度、生物多样性完整性指数、易感动物分布(基于IUCN红色名录,包括白尾鹿、美洲水貂、亚洲小爪水獭等9个物种)、COVID-19死亡率及城市可达性(旅行时间)。所有数据重采样至0.25°网格分辨率。
机器学习建模:采用三种机器学习算法——增强回归树(BRT)、极限梯度提升(XGBoost)和随机森林(RF)——训练预测模型。为解决数据不平衡问题,采用自助法(bootstrapping)生成伪缺失点,并进行50次迭代以优化模型稳健性。模型在数据丰富区域(如北美、欧洲)训练,并 extrapolate 至全球范围。通过ROC曲线和AUC值评估模型性能。
结果
全球感染模式:动物感染报告主要集中在北美、南美和欧洲,美国记录最多(569例,涉及18物种)。希腊、荷兰等7个国家报告超100例。
模型性能:三种模型均表现出色,AUC值介于0.9659至0.9970之间。XGBoost模型表现最佳(AUC=0.9871),其次是RF(0.9857)和BRT(0.9748)。模型间标准差较高的区域主要分布在欧洲和北美南部沿海,表明这些地区预测不确定性较大。
风险分布:高风险区域集中在西欧和中欧、美国东部、南巴西、中国沿海、北印度及日本。比利时、荷兰、德国、瑞士等国高风险面积占国土比例超20%,比利时高达55.42%。尽管中国、印度、巴西绝对高风险面积大,但因国土广阔,占比低于10%。
关键驱动因素:人为因素权重显著高于生物物理因素。城市可达性是最重要预测因子(在BRT、XGBoost、RF中权重分别为32.53%、10.58%、53.35%),其次是人口密度(31.83%、7.89%、14.30%)和COVID-19死亡率。气候因素在XGBoost中贡献较高(降水、风速各占5%),反映环境传播路径。
易感物种与风险重叠:白尾鹿、美洲水貂和亚洲小爪水獭的分布与预测高风险区高度重合。水貂在美加边境、白尾鹿在美洲、亚洲小爪水獭在东南亚均面临高风险。狮、虎、雪豹等物种栖息地附近也有中高风险区。
讨论
监测偏倚与数据缺口:当前动物感染报告集中于宠物、养殖动物和动物园物种,野生和商业养殖物种(如貉、穿山甲)数据缺失严重,可能导致非洲、亚洲部分地区风险低估。模型在数据稀疏区预测存在不确定性。
人为因素主导:结果凸显人类活动(人口密集、城市扩张、高交通可达性)对病毒传播的核心作用。高COVID-19死亡率区域动物感染风险高,表明人兽接触是主要传播途径。 livestock 养殖密度(特别是鸭、猪)也与风险正相关,但机制需进一步研究。
政策协同(One Health):动物感染与人类疫情严重程度紧密关联,提示公共卫生与动物健康政策需协同。措施包括加强疫苗接种、生物安全、动物饲养管理及监测响应。忽视人类活动因素可能导致动物感染控制政策不足。
局限与展望
模型外推不确定性:全球预测在非洲、亚洲部分区域可能不准确,因训练数据主要来自欧美。未考虑病毒在动物间传播或变异(如狗作为传播终点),也未整合蝙蝠分布(天然冠状病毒库)和家养动物(猫、狗)的空间模式。
物种数据缺口:IUCN物种未能覆盖商业重要物种(如貉、穿山甲),且缺乏全球家畜、宠物分布标准化数据。未来需结合农业登记、野生动物贸易路线数据,并引入物种行为生态学、环境病毒持久性、种间接触网络以完善传输模型。
结论
机器学习空间预测模型有效揭示了动物SARS-CoV-2感染的潜在高风险区,为监测和预防提供了科学工具。人为因素是关键驱动力,呼吁通过One Health框架强化跨部门合作,以降低人兽共患病溢出风险。随着更多动物感染数据积累,模型可进一步优化,支持精准防控决策。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号