机器学习集成模型预测肯尼亚采采蝇适宜生境分布及其对锥虫病防控的意义

【字体: 时间:2025年09月26日 来源:Parasites & Vectors 3.5

编辑推荐:

  本研究针对肯尼亚采采蝇分布数据存在地理空白的问题,利用机器学习集成建模技术(RF、SVM、MaxEnt、GLM)结合遥感环境变量,成功预测了Glossina spp.(26%国土面积)和G. pallidipes(9%国土面积)的适宜生境分布,发现绵羊密度、NDVI和土壤湿度与适宜性呈正相关,而地表温度>40°C和海拔>400m会降低适宜性。该成果为精准实施采采蝇监测和锥虫病(AAT/HAT)防控提供了关键空间决策支持。

  
在广袤的非洲大陆,一种名为采采蝇(Glossina spp.)的微小昆虫持续威胁着人类和动物的健康。它们通过叮咬传播锥虫,引发非洲动物锥虫病(African animal trypanosomosis, AAT)和人类非洲锥虫病(Human African trypanosomosis, HAT),给依赖农牧业生产的社区带来沉重经济负担。在肯尼亚,高达38个县(全国共47个县)受到8种不同采采蝇的侵扰,每年造成的经济损失估计达2亿美元。
尽管采采蝇的危害众所周知,但全面掌握其分布范围却面临巨大挑战。现有的昆虫学数据集存在显著的地理空白,难以全面反映采采蝇在全国范围内的分布情况,特别是在气候变迁和人类活动加剧导致景观快速变化的背景下。传统的实地调查方法成本高昂且耗时,难以实现全国范围的覆盖。因此,开发一种能够准确预测采采蝇潜在分布的方法,对于有效防控锥虫病至关重要。
在这项发表于《Parasites & Vectors》的研究中,Raphael Mongare及其合作者开展了一项创新性研究,他们利用先进的物种分布模型(Species distribution modeling, SDM)技术,结合机器学习算法和遥感数据,对肯尼亚全境的采采蝇适宜生境进行了精准预测。
研究团队采用了四种机器学习算法——随机森林(Random Forest, RF)、支持向量机(Support Vector Machines, SVM)、最大熵模型(Maximum Entropy, MaxEnt)和广义线性模型(Generalized Linear Models, GLM),并进一步开发了集成模型,以结合四种算法的预测优势。预测分别在属水平(Glossina spp.)和种水平(Glossina pallidipes,一种在肯尼亚占优势的采采蝇物种)上进行。
研究使用的主要技术方法包括:收集2017-2020年肯尼亚采采蝇与锥虫病 eradication委员会(KENTTEC)和国际昆虫生理生态中心(icipe)的采采蝇发生记录;获取卫星衍生的环境变量(NDVI、LST、土壤湿度等)、景观结构、人口统计指标共118个月度数据集;通过方差膨胀因子(VIF)分析和逐步回归筛选24个预测变量;使用sdm软件包进行模型训练和验证;采用AUC加权平均法构建集成模型;利用2021-2023年独立数据集进行模型验证。
研究结果显示,所有模型均表现出良好的预测性能。对于Glossina spp.,真实技巧统计(True Skill Statistic, TSS)和曲线下面积(Area Under the Curve, AUC)分别达到0.67和0.88;对于G. pallidipes,这两个指标更是高达0.85和0.96。使用独立数据集验证的F1分数分别为0.75和0.63,进一步证实了模型的可靠性。
变量重要性分析表明,不同预测变量对采采蝇分布的影响各不相同。在属水平预测中,最重要的五个变量依次是绵羊密度、人口密度、土壤湿度、牛密度和归一化植被指数(Normalized Difference Vegetation Index, NDVI);而在种水平预测中,海拔、土壤湿度、地表温度(Land Surface Temperature, LST)和人口密度成为四个最重要的预测因子。
响应曲线分析揭示了环境因子与采采蝇适宜性的复杂关系。研究发现,采采蝇生境适宜性与1,000-2,000头/平方公里的绵羊密度呈正相关,而与超过7,500-10,000头/平方公里的牛密度和超过1,000人/平方公里的人口密度呈负相关。地形、土壤、植被和温度变量则显示出混合的(正负)关联:低于400米的海拔、5-25毫米的最小和中值土壤湿度以及高于0.6的最大和中值NDVI有利于采采蝇生境适宜性,而超过40毫米的地下土壤湿度则会降低适宜性。
空间预测结果显示,肯尼亚约26%的国土面积(151,488平方公里)对Glossina spp.具有潜在适宜性,而G. pallidipes的适宜生境约占9%(52,438平方公里)。采采蝇适宜生境主要分布在肯尼亚南部地区,北部地区的适宜性相对较低。
0.55)。绿色网格显示新颖区域——训练数据环境条件范围以外的区域'>
高适宜性区域主要分布在保护区内外、社区森林保护区、保护区和肯尼亚的隔离高地上。马赛马拉国家保护区、东、西察沃国家公园、鲁马国家公园和梅鲁国家公园等都被确定为采采蝇的潜在高适宜生境。沿海带的辛巴山国家保护区、丹达拉、博尼、阿鲁布科索科凯、恩古鲁曼悬崖和基布韦齐森林也预测有高适宜性。
与其它Glossina spp.的广泛生境分布不同,G. pallidipes的适宜生境较为有限,主要集中在野生动物保护区周围的小块高适宜性区域,包括东、西察沃国家公园、基利菲、夸勒和拉穆等沿海县、纳罗克县的马赛马拉国家保护区、卡贾多-纳罗克边界的恩古鲁曼、西亚亚县的鲁马国家公园、梅鲁县的梅鲁国家公园以及图尔卡纳、马萨比特、曼德拉和桑布鲁县,以及莱基皮亚和伊西奥洛县周围保护区。
研究表明,温度相关变量对预测采采蝇适宜生境具有基础性作用。海拔超过400米和温度高于35°C会降低采采蝇生境适宜性评分。土壤湿度和植被覆盖对采采蝇的繁殖和生存特别重要,土壤湿度 availability 在5-25毫米范围内与采采蝇分布呈正相关。NDVI值大于0.6的区域显示出高采采蝇适宜性,表明采采蝇偏好有遮荫的地方。
研究还发现,保护区内及其周边地区具有高度适宜的采采蝇生境,这与这些地区有偏好的野生动物物种(如水牛和疣猪)和由林地组成的茂密植被有关,且人类影响有限。相反,人口密集区显示出较高水平的人类活动,干扰了采采蝇的偏好生境,阻碍了其定殖。
研究的创新之处在于采用了集成建模方法,结合了四种机器学习算法的预测优势,提供了更加可靠和准确的采采蝇生境预测。这种方法有效地弥补了现有采采蝇分布图谱中的数据空白,特别是在气候变化和人类活动加剧导致景观快速变化的背景下,为采采蝇和锥虫病的防控提供了及时、准确的空间决策支持。
尽管研究取得了显著成果,但仍存在一些局限性。大多数免费提供的基于卫星的生态变量空间分辨率较粗(4.6-10公里),这可能限制了更精细景观和气候 dynamics 变异的模拟。此外,研究可能受益于野生动物密度分布数据,以获取更多关于偏好野生宿主的信息。最后,记录的采采蝇观测数据在全国分布不均,大部分北部地区没有覆盖,这些景观的更多数据可以为预测提供缺乏的信息。
研究的结论强调,利用集成建模方法成功预测了肯尼亚采采蝇的空间生境分布,这有助于补充更新采采蝇分布图谱中数据可用性低的区域。保护區、保护区和森林保护区被确定为具有高采采蝇适宜性水平的受影响区域。观察到的不连续采采蝇生境可能与人类活动产生的收缩生境有关,并且是非洲动物锥虫病持续传播的剩余焦点。
研究结果建议,人类活动正在高度塑造采采蝇的分布,这为通过逐步的特定地点干预和监测操作消除采采蝇提供了机会,这些操作由相对更精细尺度的预测图指导。预计持续的气候变化将影响采采蝇生境,因此需要物种水平的生境图来更新现有知识。因此,为了捕捉未来的生境前景,G. pallidipes的适宜性模型应整合稳健的预测方法和气候模拟情景,以适应 resulting 的气候 variations。确定的新颖采采蝇区域需要更多的监测工作,以测试模型在数据缺失区域的适用性。
这项研究不仅为肯尼亚的采采蝇和锥虫病防控提供了科学依据,也为其它类似地区提供了可借鉴的方法和经验。随着气候变化和人类活动的持续影响,这种基于机器学习和遥感技术的物种分布预测方法将在未来的病媒生物学和疾病防控中发挥越来越重要的作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号