深度学习赋能海洋生物学:实现浮游生物精准分类的创新突破

【字体: 时间:2025年05月07日 来源:Computers in Biology and Medicine 7.0

编辑推荐:

  浮游生物分类传统方法耗时耗力且易出错。研究人员开展基于深度学习的浮游生物分类研究,融合 InceptionResNetV2 和 DeepPlanktonNet 模型特征,用鲸鱼优化算法(WOA)筛选特征。结果分类准确率达 98.79%,有助于海洋生态监测等。

  在广袤的海洋世界里,浮游生物虽小,却有着大作用。它们作为海洋食物链中的初级生产者,对海洋生态平衡和全球碳循环意义重大。而且,浮游生物对环境变化极为敏感,是海洋生态状况的重要生物指标,研究它们的种类和数量变化,对于保护海洋生态系统至关重要。
然而,传统的浮游生物分类方法却面临着诸多难题。以往,科研人员借助 Niskin 瓶、泵、拖网等工具采集海洋样本,之后在显微镜下由专业人员逐一把关、分类鉴定。但海洋环境复杂恶劣,采样工作困难重重,后续的样本分析不仅耗费大量时间和人力,还容易出现人为误差,这极大地限制了浮游生物研究的效率和准确性。

随着科技的发展,计算机视觉和深度学习技术逐渐兴起,为浮游生物分类带来了新的希望。不过,这条探索之路并非一帆风顺。有限的标记数据集、深度学习模型缺乏可解释性以及高昂的计算成本,成为了阻碍浮游生物自动化分类发展的 “三座大山”。在这样的背景下,为了实现浮游生物的高效、精准分类,来自国外的研究人员开展了一项极具创新性的研究,其成果发表在《Computers in Biology and Medicine》上。

研究人员整合了迁移学习与 DeepPlanktonNet 模型从头训练、特征融合和优化技术。他们选用 InceptionResNetV2 模型(利用迁移学习进行高效特征提取)和 DeepPlanktonNet 模型(从头训练以捕捉特定数据集特征),通过特征融合的方式,将两个模型的优势结合起来,使特征表示更加丰富。同时,运用鲸鱼优化算法(WOA)进行特征选择,减少了冗余特征,提高了计算效率。此外,研究人员还采用了 Local Interpretable Model-agnostic Explanations(LIME)技术,让模型的决策过程更加透明、可解释。

下面来看看研究中用到的几个主要关键技术方法:

  • 数据集:使用 WHOI 提供的数据集,该数据集包含 6598 张图像,分为 22 个类别,涵盖多种浮游生物种类。
  • 模型构建:构建 InceptionResNetV2 和 DeepPlanktonNet 模型,前者借助迁移学习从大规模图像数据中学习通用特征,后者针对浮游生物数据特点从头训练提取特定特征。
  • 特征处理:先对图像进行预处理,包括数据增强、图像 resize 和数据划分;接着从两个模型中提取特征并融合,再利用 WOA 优化特征空间。
  • 模型评估:采用多种评估指标,如准确率、精确率、召回率和 F1 分数,使用 5 折交叉验证确保模型性能可靠。

接下来是具体的研究结果:

  • 模型性能对比:实验对比了 InceptionResNetV2 和 DeepPlanktonNet 的端到端分类性能。InceptionResNetV2 凭借其复杂的架构,在多尺度特征提取和梯度流动方面表现出色,准确率达到 92.33%;而 DeepPlanktonNet 因架构相对简单,捕捉复杂模式的能力有限,准确率为 79.21%。这一结果表明单一模型存在局限性,为后续采用混合方法提供了依据。
  • 融合特征分类优势:将机器学习分类器应用于融合特征集,发现分类性能显著提升。例如,Medium Neural Network(MNN)在使用融合特征集后,F1 分数达到 0.94,准确率提升至 96.4%,执行时间也有所减少。这证明了融合特征能够整合不同模型的优势,提高分类效果。
  • WOA 优化效果显著:应用 WOA 对融合特征进行优化后,几乎所有分类器的性能都得到显著提升。如 Decision Tree-Medium Tree 模型的准确率从 62.42% 大幅提升至 96.05%,表明 WOA 能够有效调整模型参数,克服决策树等模型的固有缺陷,提高分类性能。
  • 精度与效率平衡:通过绘制热图分析模型性能和计算成本的权衡关系,发现优化后所有模型的准确率都有所提高,且大部分模型的运行时间减少。尽管 SVM 模型在优化后计算时间增加,但整体来看,优化过程提高了模型的综合性能,为模型选择提供了参考依据。
  • 与其他模型对比优势明显:与 InceptionResNetV2、ShuffleNet、DenseNet201 和 ResNet101 等先进模型相比,本研究提出的混合模型在准确率、精确率、召回率和 F1 分数上都表现更优,达到了 98.79% 的准确率。这得益于 InceptionResNetV2 和 DeepPlanktonNet 在处理复杂数据集时的协同优势,以及 WOA 在特征选择上的优化作用。
  • LIME 解释性分析:利用 LIME 技术对 InceptionResNetV2 和 DeepPlanktonNet 的预测进行解释,发现 InceptionResNetV2 在分类时更关注浮游生物的特定区域和精细特征,解释性更强;而 DeepPlanktonNet 的关注区域更广泛,可能更有利于模型的泛化,但解释性相对较弱。这为根据不同任务需求选择合适的模型提供了参考。
  • 与 SOTA 方法比较性能卓越:与其他最先进(SOTA)方法相比,本研究提出的方法在分类准确率上具有显著优势。之前最高报道的准确率为 97.9%,而本研究通过特征融合、WOA 特征选择和多种分类器协同,达到了 98.79% 的准确率,同时 LIME 技术的应用增强了模型的可解释性,使模型更适用于实际应用场景。

在研究结论和讨论部分,该研究成果具有重要意义。研究提出的方法在浮游生物图像分类领域取得了显著进展,InceptionResNetV2 的端到端准确率验证了迁移学习在特定数据集上的有效性,而 DeepPlanktonNet 虽然从头训练效果稍逊,但通过特征融合和 WOA 优化,整体框架性能大幅提升。融合特征增强了模型的表现力,WOA 优化不仅提高了准确率,还降低了计算成本,使框架更具可扩展性,有助于大规模的海洋生态研究。

然而,研究也存在一些局限性。DeepPlanktonNet 在小样本数据集上的表现有待提高,优化过程的计算成本仍需进一步降低,现有数据集可能无法涵盖所有浮游生物种类的变异,且深度学习模型的特征重要性分析存在困难,缺乏与领域知识对齐的标准解释性指标。

针对这些不足,研究人员在未来工作中有明确的方向。他们计划与海洋生物学家合作生成带专家注释的基准数据集,添加注意力机制和其他可解释性技术(如 SHapley Additive Explanations(SHAP))来增强模型的可解释性,探索域适应技术、自监督或半监督学习技术,结合 WOA 与其他优化技术降低计算成本,将时空数据纳入 LIME 框架,并研究联邦学习技术在浮游生物分类中的应用,实现实时监测等。

总的来说,这项研究为浮游生物分类提供了一种高效、准确且可解释的方法,对海洋生态监测、气候变化研究和水质分析等领域有着重要的推动作用,也为环境 AI 应用的进一步创新奠定了坚实基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号