综述:植物标本图像与人工智能

【字体: 时间:2025年07月04日 来源:New Phytologis 8.1

编辑推荐:

  这篇综述系统探讨了人工智能(AI)在数字化植物标本(herbarium)图像分析中的应用,涵盖计算机视觉(CV)技术原理、数据集构建方法(如GBIF/Symbiota/iDigBio)、模型架构(CNN/ViT)选择及训练策略(迁移学习/特征提取),为植物分类学(taxonomy)、表型组学(phenology)和生态学研究提供了高效工具,同时指出标准化成像与跨学科协作对未来AI植物学研究的关键意义。

  

AI计算机视觉基础
植物标本数字化图像正成为训练人工智能模型的重要资源。标准化装帧的标本(如压平植株附纸质标签)配合专业鉴定的高精度标签,为AI模型提供了理想数据源。卷积神经网络(CNN)和视觉Transformer(ViT)是主流架构——CNN擅长局部特征识别(如枫属Acer的掌状叶脉),而ViT在长程依赖特征(如苔藓Sphagnum的微观结构)分析中更具优势。

数据集构建挑战
三大公共数据库(GBIF/iDigBio/Symbiota)提供海量图像,但存在技术差异:纽约植物园(NY)使用全画幅相机,而史密森尼(US)采用线扫描仪。预处理需剔除非生物干扰(标签/胶带),均值掩膜法可减少色彩偏差。数据划分需遵循80-10-10原则(训练-验证-测试),避免信息泄漏——例如法国标本馆(P/LY)特制纸张可能误导AI将材质误判为地理特征。

创新工作流设计
针对小样本难题,合成数据(如分形图像)和自监督预训练(SimCLR/NNCLR)能提升模型鲁棒性。表型分析案例显示:枫树物候期识别准确率达92%(Lorieul et al. 2019),叶片虫食面积量化误差<5%(Meineke et al. 2020)。特别值得注意的是,Score-CAM可视化技术可揭示AI关注的隐藏特征(如叶腋角度),为发现新分类性状提供可能。

未来发展方向
跨模态学习(结合标本图像与地理/系统发育数据)和自动化新物种发现将是突破点。当前瓶颈在于标本数字化标准不统一——如苔藓类标本常以非标准方式成像。研究者呼吁全球标本馆采用统一色彩校正协议,这对构建能应对气候变化研究的百年尺度物候模型至关重要。正如文中强调:"AI模型的上限,始终取决于标本本身的质量与一致性。"

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号