意大利西尼罗河病毒标准化发病比数据集(2012-2024)——基于省级监测的流行病学分析

《Scientific Data》:Standardized Incidence Ratio dataset of Human West Nile Virus in Italy (2012-2024)

【字体: 时间:2025年11月25日 来源:Scientific Data 6.9

编辑推荐:

  本刊推荐:为填补意大利西尼罗河病毒(WNV)标准化流行病学指标的空白,研究团队构建了2012-2024年省级标准化发病比(SIR)数据集。该研究通过整合人类确诊病例、人口统计数据和媒介监测数据,首次系统量化了WNV在意大利的空间分布与时间演变规律。结果显示蚊媒阳性率与高SIR值显著相关(2022年后R=0.55-0.64),且帕多瓦省等地区呈现明显上升趋势(斜率0.404)。该数据集为实施精准防控策略提供了重要依据,对应对气候变化背景下虫媒传染病威胁具有示范意义。

  
盛夏的波河平原,蚊虫的嗡鸣声中潜伏着看不见的威胁。自2008年意大利北部爆发大规模西尼罗河病毒(West Nile Virus, WNV)疫情以来,这种通过蚊媒传播的病原体已在亚平宁半岛扎根。WNV属于黄病毒科(Flaviviridae),最早于1937年在乌干达的西尼宁地区发现。病毒主要通过库蚊(Culex)叮咬受感染的鸟类获得并传播,而人类和马等哺乳动物作为偶然的终末宿主,通常不会产生足够高的病毒血症来感染新的蚊虫。虽然约80%的人类感染无症状,但约1/150的病例可能发展为脑炎或脑膜炎等神经侵袭性疾病,对老年人和免疫缺陷群体构成严重威胁。
意大利的WNV防控面临严峻挑战:病毒分布范围持续扩大,监测数据分散在不同系统,且缺乏标准化指标进行跨区域比较。虽然意大利高等卫生研究院(ISS)每年发布疫情报告,Marco Mingione等人也整理了确诊病例数据集,但能消除人口年龄结构影响的标准化发病比(Standardized Incidence Ratio, SIR)数据始终缺失。这种缺失阻碍了研究人员准确评估不同省份的发病风险,也难以量化环境因素对病毒传播的影响。
为解决这一瓶颈,来自巴里大学、博洛尼亚大学等机构的研究团队在《Scientific Data》发表了2012-2024年意大利省级WNV标准化发病比数据集。该研究创新性地将监测数据与人口统计学数据结合,首次构建了覆盖13个传播季的SIR时序数据集。
研究方法的核心在于标准化发病比的计算。团队从三个维度整合数据源:首先,从公开的GitHub仓库获取经实验室确认的人类WNV病例数据,严格遵循欧盟病例定义标准(Decision (EU) 2018/945),排除无症状献血者检测和输入病例;其次,从意大利国家统计局(ISTAT)获取省级单岁年龄组人口数据,其中2012-2018年采用传统接口,2019-2024年采用新平台IstatData;最后,创新性地将参考人群限定为当年报告至少1例确诊病例的省份,避免SIR值偏斜。计算时采用年龄分层标准化法,具体公式为SIRp,y= Op,y/Ep,y,其中期望病例数Ep,y= Σ(Ri,yP× ni,p,y),即各年龄组参考发病率与省级人口结构的加权和。
数据记录与结构
数据集通过Dryad平台公开,包含核心文件"sir_tot.csv"和辅助数据文件夹。核心文件收录了2012-2024年各省SIR值及其统计特征(均值、标准差、极值等),特别增加了斜率特征(Gradient)量化各省份的时间趋势。辅助数据则提供了原始人口表格(Ni.xlsx)和年度监测文件(wn-ita-provinces-human-surveillance-20***.csv),确保数据可追溯、可复现。
技术验证
通过皮尔逊相关性分析验证了SIR指标的流行病学意义。结果显示SIR与人类确诊病例数呈显著正相关(整体R=0.50, p<0.01),而与蚊媒阳性数的相关性在近期显著增强(2022年R=0.55, 2023年R=0.55)。这一变化暗示蚊媒监测数据质量的提升,也可能反映气候变化导致的传播强度变化。值得注意的是,2017年前动物阳性数据缺失,2017-2021年蚊媒相关性不显著,表明早期监测网络存在覆盖不均问题。
斜率分析
线性回归趋势分析揭示了病毒扩散的时空动态。如图2所示,除马泰拉、戈里齐亚等5个省份呈微弱负增长(平均斜率-0.018)外,绝大多数省份SIR值呈上升趋势,整体平均斜率达0.05。帕多瓦省(0.404)、洛迪省(0.237)和摩德纳省(0.224)成为疫情热点区域,提示波河平原仍是传播核心区。
研究结论强调,该数据集首次实现了WNV风险的标准化跨区域比较,为优化监测资源分配提供了科学依据。SIR指标对年龄结构的校正尤为重要,因为年龄是WNV神经侵袭性疾病的关键风险因素(Petersen et al., 2013)。数据集显示的北高南低分布模式与已知的媒介生态位吻合,而2016年后强化的"一体健康"(One Health)协同监测体系,可能通过提升检测灵敏度部分解释了近期病例数的增长。
这项研究的突破性在于将分散的监测数据转化为可操作的流行病学指标。相比传统发病率,SIR消除了人口年龄结构的混淆效应,使偏远地区与人口稠密区的风险比较成为可能。数据集不仅为政府部门制定精准防控策略(如靶向性蚊虫控制、血液筛查策略调整)提供支撑,还可与气候、遥感等多元数据结合,构建更精准的传播风险预测模型。在气候变化加剧虫媒传染病威胁的背景下,该研究为建立标准化传染病风险评估框架提供了重要范式。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号