可解释的卷积神经网络在识别Ampullariidae属生物中的应用

《Pathology》:Explainable Convolutional Neural Networks for the identification of the Ampullariidae genus

【字体: 时间:2025年11月20日 来源:Pathology 3

编辑推荐:

  入侵性淡水螺对农业和公共卫生构成威胁,本研究提出基于VGG16和Grad-CAM的可解释CNN模型,通过尼日利亚北部350份标本及近缘属扩充数据集训练,验证准确率达0.99,Grad-CAM可视化成功揭示壳高、扭转方向等关键鉴别特征。

  
Rabi Suraj Duwa | Kabir Salihu Suraj
尼日利亚警察学院生物科学系,Maiduguri路,Wudil,713001,Kano,尼日利亚

摘要

属于Ampullariidae科的入侵性淡水蜗牛对农业、生物多样性和公共卫生构成了重大威胁。深度学习的最新进展使得能够自动化识别具有医学和农业价值的蜗牛物种,但大多数现有模型作为“黑箱”运行,限制了它们在分类学研究和生态决策中的应用。在这项研究中,我们提出了一种基于VGG16和Grad-CAM的可解释卷积神经网络(CNN)架构,用于分类和解释Ampullariidae及其相关属的形态特征。我们使用了一个包含350个从尼日利亚北部野外采集的Ampullariidae标本的数据集,并补充了BiomphalariaBulinusLymnaeMelanoides的标记图像来训练和验证该模型。该分类器在20个训练周期内达到了0.99的验证准确率,表明其性能稳健。Grad-CAM显示,网络正确地关注了特定属的壳特征,如螺塔高度、卷曲方向和开口方向。我们的发现表明,可解释的深度学习可以提高分类精度,并提供诊断特征的视觉洞察,使其成为生态监测和寄生虫控制计划的强大工具。

引言

Ampullariidae科的成员——由于其大型圆形的壳而通常被称为苹果蜗牛——是最大的淡水腹足类动物之一[1]、[2]、[3]。入侵性苹果蜗牛已知会对农业造成严重损害[4]、[5],同时还会引发生态问题,包括水生植物多样性的下降和湿地生态系统功能的改变[6]、[7]。此外,它们贪婪的食欲[8]、[9]、高繁殖率[10]、在干旱期间的抗干燥能力[11]以及作为人畜共患病传播媒介的角色[12]、[13],使得它们成为对农业[14]、环境以及潜在的人类健康[15]、[16]的严重威胁。
近年来,通过应用机器学习(ML)和人工智能(AI),在应对具有医学和农业价值的蜗牛所带来的危险方面取得了显著进展。在公共卫生领域,特别是在应对影响全球超过2亿人的血吸虫病方面,AI驱动的工具已成为传统劳动密集型蜗牛监测方法的强大替代方案。例如,卷积神经网络(CNN)已经通过数千张野外采集的蜗牛宿主和Schistosoma尾蚴图像进行了训练,其分类准确率可与专家寄生虫学家相媲美,并提供了一种低成本、可扩展的识别系统,可以在流行地区部署在移动设备上[17]、[18]、[19]。同样,像U-Net这样的深度学习模型也被用于分析高分辨率卫星和无人机图像,以识别塞内加尔河流域等大范围内的支持蜗牛栖息的水生植被。这种方法可以快速准确地绘制高风险传播区域,显著改善了环境干预措施的目标定位[20]。在中国,机器学习模型——特别是随机森林(Random Forests)——通过结合多源环境、纹理和低地数据,精确地勾勒出湖泊和沼泽生态系统中的蜗牛栖息地。这种方法取得了非常高的预测性能,为改进当地的血吸虫病控制策略带来了希望[21]。在乌干达,类似基于随机森林的方法被应用于火山口湖泊,揭示了地理、生态和气候变量如何在不同空间尺度上影响中间宿主蜗牛(如BulinusBiomphalaria)的分布[22]。除了公共卫生领域,澳大利亚农业界还探索了使用高光谱成像和机器视觉系统来检测损害作物并污染谷物收成的害蜗牛物种。通过分析光谱特征并运用ML算法,研究人员在复杂的野外条件下实现了对各种蜗牛类型的高准确率分类,为免耕种植系统中的综合害虫管理提供了可行的工具[23]。总的来说,这些努力突显了机器学习在实现高效、可扩展和情境敏感的监测和减轻有害蜗牛影响的策略方面的变革潜力。
限制机器学习模型识别蜗牛成功的一个关键问题是,大多数模型依赖于没有事后可解释性的“黑箱”算法,这在诊断准确性和透明度方面留下了空白。可解释性在生物分类中是不可或缺的,因为它确保了计算预测与形态学和分类学推理的一致性。像Grad-CAM这样的可解释模型使研究人员能够可视化有助于属识别的壳特征,从而将深度学习从一个纯粹的预测框架转变为一个生物学上可解释的框架。这种透明度对于验证AI驱动的分类结果并将其整合到生态和诊断工作流程中至关重要。为了解决这些挑战,我们使用了在ImageNet上预训练的VGG16的卷积基础来计算“瓶颈”特征图,然后将其展平并通过一个由256个单元组成的ReLU激活的密集层(丢弃率为0.6)和一个softmax输出层进行处理,以进行最终物种预测。我们在一个包含从尼日利亚北部采集的Ampullariidae标本的精心策划的数据集上训练了这个模型,然后应用了梯度加权类激活映射(Grad-CAM)来生成突出显示每个预测背后的壳特征的显著性图[24]。通过结合高准确率的物种识别和可解释的AI,我们的框架提供了具有分类学意义的洞察以及稳健的分类性能。

方法

蜗牛(Ampullariidae)是从Fanchan、Fadama和Datsa的稻田中手工挑选的。然后,它们被转移到尼日利亚警察学院的生物科学实验室,使用从这些地点收集的水填充的开口塑料容器运输。这些地点位于尼日利亚Kano州的Dawakin Kudu地方政府区域内。
共收集了350个蜗牛样本,并补充了458张Biomphalaria、845张Bulinus和730张

结果

基于VGG16的分类器在20个训练周期内迅速收敛(图1)。训练准确率从第1周期的0.66上升到第6周期的0.94,并在第20周期达到0.98。验证准确率始终保持在0.99左右,仅在第4周期短暂下降到0.97(图1a)。相应地,训练损失从2.14降至0.08,而验证损失在前几个周期后降至0.005以下(图1b)。这些动态表明了快速收敛和最小的过拟合现象。

结论

本研究展示了将深度学习与可解释AI技术相结合的有效性,能够准确分类Ampullariidae属及相关分类单元的淡水蜗牛。通过将基于VGG16的CNN与Grad-CAM可视化相结合,我们不仅实现了高分类准确率,还阐明了影响模型决策的具体壳区域。

CRediT作者贡献声明

Rabi Suraj Duwa:写作——审稿与编辑、验证、数据管理、概念化。Kabir Salihu Suraj:写作——原始草稿、可视化、软件开发、方法论、数据管理。

致谢

本研究的计算资源由RIKEN提供。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号