基于机器学习的生态流行病学视角:中越边境地区华支睾吸虫病传播风险预测与防控策略研究

【字体: 时间:2025年07月29日 来源:International Journal of Health Geographics 3

编辑推荐:

  本研究针对中越边境地区华支睾吸虫病(Clonorchis sinensis)流行特征不明的问题,通过整合2000-2018年流行病学调查数据与26项环境气候指标,采用机器学习模型揭示了生食淡水鱼习惯是该病传播的核心驱动因素。研究发现越南年均温度(23.37℃)和降水(1731.64 mm)显著高于广西,而广西地区54.9%的县存在生食习惯。逻辑回归模型(AUC=0.941)精准识别出中越边境高风险带,为跨境联防联控提供了科学依据。

  

在东南亚的淡水流域,一种名为华支睾吸虫(Clonorchis sinensis)的肝吸虫正悄然威胁着数百万人的健康。这种寄生虫引发的华支睾吸虫病(clonorchiosis)在中国广西和越南北部形成顽固的流行区,最新调查显示广西感染率高达6.68%,而越南部分边境省份甚至出现42.9%的惊人感染率。更棘手的是,传统的防控手段收效有限,因为这种疾病的传播牵涉到复杂的环境、气候和社会文化因素的"三重奏"——从水温变化影响虫卵发育,到当地"鱼生"饮食文化助长传播,再到跨境人口流动加剧疫情扩散。

上海交通大学医学院-爱丁堡大学全健康研究中心的科研团队在《International Journal of Health Geographics》发表的研究,首次采用机器学习方法解构了这个跨境健康难题。研究人员构建了包含26个环境气候指标和饮食文化变量的预测模型,特别创新性地将"生食淡水鱼"这一关键行为因素量化纳入分析框架。通过系统收集2000-2018年间中越两地85个广西村庄和51个越南地点的感染数据,结合卫星遥感获取的植被指数(NDVI)和世界气候数据库(Bio1-Bio19)信息,研究团队运用六种机器学习算法进行了深度挖掘。

关键技术方法包括:通过系统文献评价构建地理编码的感染数据库;使用WorldClim和MODIS等长期遥感数据集提取环境变量;采用SMOTE算法处理数据不平衡问题;比较逻辑回归(LM)、随机森林(RF)等六种机器学习模型的预测效能;基于最优模型生成5km分辨率的风险预测图。

环境差异揭示传播奥秘
对比分析显示,越南采样点的年均温度(Bio1)比广西高2.51℃,降水季节变异(Bio15)更显著。广西的高海拔地区(平均170.63米)与越南低地(3.25米)形成鲜明对比,这种地理分异造就了不同的中间宿主生态环境。

饮食文化成为关键开关
变量重要性分析中,"生食鱼肉"以100%的贡献度成为最强预测因子。地图可视化显示广西54.9%的县存在这种饮食传统,而越南为31.7%。部分依赖图揭示,有生食习惯的地区感染概率暴增13倍,从0.007跃升至0.096。

机器学习模型的较量
在六种算法中,逻辑回归(LM)表现出最优的预测稳定性(AUC=0.941),其校准曲线最接近理想对角线。随机森林(RF)虽在训练集表现完美(AUC=1),但存在过拟合风险。温度年较差(Bio3)和植被指数(NDVI)分别以58.8%和74.5%的重要性成为次要预测因子。

跨境风险图谱的警示
空间预测结果勾勒出一条清晰的高风险带:广西中部至南部县域,以及越南北部与广西接壤的省份。特别值得注意的是,模型识别出的若干高风险区与现有监测数据高度吻合,如广西崇左和越南谅山等边境走廊。

这项研究的突破性发现为跨境寄生虫病防控提供了全新思路。首先,它证实了文化行为因素在疾病传播中的决定性作用,提示单纯的药物干预难以根治,必须配合饮食文化改良。其次,研究建立的预测框架能够精准定位高风险"热点",使有限的防控资源发挥最大效益。最后,中越两国在温度、降水等关键生态因子上的显著差异提示,未来的防控策略需要因地制宜——在越南重点监控温暖湿润的三角洲地带,在广西则需关注山地与平原过渡区域。正如作者强调的,这项研究不仅是一份科学的"风险地图",更是呼吁中越两国建立联合防控机制的倡议书,为"一带一路"倡议下的卫生健康合作提供了典范案例。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号