利用计算机视觉技术对澳大利亚干旱地区生物地衣层中的地衣和苔藓进行物种鉴定

《Applications in Plant Sciences》:Computer vision species identification of lichens and bryophytes from biocrusts in Australian drylands

【字体: 时间:2025年11月07日 来源:Applications in Plant Sciences 2.4

编辑推荐:

  机器学习计算机视觉方法在澳大利亚生物结皮地衣和苔藓物种识别中的应用。通过Azure Custom Vision和移动端测试,综合模型准确率达64%,虽低于类似规模被子植物模型,但鉴于地衣苔藓形态特征少,已具可行性。讨论了数据不平衡、背景干扰和移动端图像稳定等挑战及改进方向。

  本研究探讨了利用机器学习计算机视觉技术对澳大利亚干旱地区生物结皮中的地衣和苔藓物种进行识别的可行性。地衣和苔藓作为非维管植物,因其体积小、缺乏明显的宏观特征,长期以来在物种鉴定方面面临较大困难。传统方法依赖于专家的知识和经验,而这一过程既耗时又对非专业人员而言具有挑战性。随着技术的发展,特别是图像识别模型的进步,为非维管植物开发高效的识别工具成为可能。本研究通过构建包含大量图像的数据集,训练并测试了三种不同的计算机视觉模型,分别是仅针对地衣的模型、仅针对苔藓的模型,以及整合地衣和苔藓的“Cryptogam”模型。这些模型在实验室测试和移动应用测试中均展现出一定的性能,尤其是在面对生物结皮中的复杂生态系统时,显示出巨大的应用潜力。

生物结皮在澳大利亚干旱地区的生态系统中扮演着至关重要的角色。它们不仅有助于减少土壤侵蚀和保持土壤结构,还在碳和氮循环、维持土壤水分等方面发挥着重要作用。然而,由于过度放牧和土地利用变化的影响,这些生物结皮的分布和多样性正面临严重威胁。因此,深入了解这些生态系统及其组成部分,对于有效的土地管理和生态保护至关重要。目前,虽然已有针对澳大利亚土壤地衣和苔藓主要属的鉴定手册,但缺乏电子化的识别工具,这使得非专业人员难以准确鉴定这些物种。为了解决这一问题,研究团队尝试利用计算机视觉模型,将地衣和苔藓的图像数据转化为可识别的分类信息。

本研究的数据集主要来源于澳大利亚国家标本馆(CANB)和新南威尔士州标本馆(NSW)的标本图像,同时也包括了其他标本馆的图像以及现场拍摄的活体标本图像。图像的获取方式多种多样,包括使用高分辨率相机和标准化图像处理流程,以确保图像质量。为了训练模型,研究团队对原始图像进行了手动裁剪,并使用了LabelImg软件来标注图像区域。此外,为了增加数据的多样性,还采用了图像旋转等方法。最终,研究团队构建了一个包含约89,000张裁剪图像的图像库,涵盖了226种地衣和苔藓物种。

模型的训练采用了Microsoft Azure Custom Vision平台,该平台提供了灵活的图像分类功能,支持非预训练的通用模型和适用于移动设备的紧凑模型。通过在平台上创建多类别图像分类项目,研究团队训练了三种模型:地衣模型、苔藓模型以及综合的地衣和苔藓模型。模型的训练过程涉及大量的图像处理和数据标注,以确保模型能够准确识别目标物种。测试结果显示,综合模型的识别准确率达到了64%,与相似规模的维管植物模型(如哥斯达黎加的维管植物识别模型)相比,虽然稍低,但仍具有一定的应用价值。

在移动平台Horama ID上进行的测试进一步验证了模型的性能。测试中使用了50种不同的物种,其中部分为活体标本,部分为干燥标本。结果显示,综合模型在物种级别的识别准确率为64%,而地衣模型和苔藓模型的准确率分别为54%和30%。这表明,尽管模型在识别非维管植物方面表现出一定的能力,但在实际应用中仍面临诸多挑战,尤其是在处理活体图像时。移动设备上的图像采集过程中,由于高倍率拍摄和环境光线的变化,模型的识别结果容易受到干扰,导致准确率下降。

此外,研究团队还注意到,图像数据集的不平衡问题可能影响模型的性能。一些物种的图像数量较少,导致模型在识别这些物种时出现偏差。为了解决这一问题,研究建议采用数据增强技术,如图像裁剪、旋转和合成,以提高数据集的多样性。同时,引入语义分割技术,可以有效去除图像中的无关背景,例如白色底板或混合标本中的其他物种,从而提升模型的识别能力。语义分割技术已被成功应用于蕨类植物的图像识别,但在地衣和苔藓领域尚未广泛应用,这可能是由于它们的形态和结构较为复杂,难以标准化处理。

研究还指出,活体图像的使用在某些情况下可能比干燥标本图像更具优势。例如,苔藓在湿润状态下能够更好地展示其特征,而地衣在干燥状态下则更易观察其颜色和结构。然而,由于活体图像在采集过程中容易受到环境因素的影响,如光照和相机稳定性,因此在移动应用中使用活体图像仍面临一定困难。为了改善这一状况,研究建议未来开发能够自动标注图像中物种尺寸和三维结构的算法,以提高模型的准确性和稳定性。

总体而言,本研究为非维管植物的计算机视觉识别提供了一个初步的框架,展示了人工智能在这一领域的应用潜力。尽管当前的模型在识别准确率上仍有提升空间,但其在干旱地区生物结皮研究中的应用前景广阔。未来的工作应着重于数据集的优化、模型的改进以及移动应用的进一步开发,以更好地服务于土地管理者、生态学家和公众。通过这些努力,非维管植物的识别将变得更加高效和准确,从而为生态保护和生物多样性研究提供有力支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号