深度学习目标检测技术在南极硅藻化石计数中的应用:化石保存状态与种内形态变异的影响评估

【字体: 时间:2025年09月29日 来源:Marine Micropaleontology 1.6

编辑推荐:

  本研究针对化石硅藻分析中传统人工计数效率低、碎片计数标准复杂以及形态变异影响检测精度等问题,开展了基于YOLOv5的深度学习目标检测模型在南极硅藻Eucampia antarctica自动化识别中的应用研究。通过多区域沉积物样本训练与验证,发现模型对形态变异不敏感,中等保存状态样本训练效果更优,且包含多样非目标颗粒的训练数据能显著提升模型鲁棒性。该研究为古环境重建中海冰浓度与表层温度的高通量分析提供了自动化解决方案。

  
在南大洋的古环境研究中,硅藻化石作为重要的生物指标,被广泛应用于重建古海冰分布和表层海水温度变化。其中,Eucampia antarctica(南极桅杆藻)因其形态特征与环境因子密切相关,成为关键指示物种。然而,传统的硅藻计数方法依赖人工显微镜观察,耗时耗力,且需处理大量碎片和形态变异样本,成为大规模沉积物样本分析的瓶颈。近年来,基于深度学习的目标检测技术虽在微生物和化石分析中展现出潜力,但针对化石硅藻的特殊性——如碎片计数惯例和种内形态变异——的系统研究仍较为缺乏。
为此,日本产业技术综合研究所地质调查部的Saki Ishino、Takuya Itaki和Motohisa Fukuda等人开展了一项研究,旨在评估深度学习模型YOLOv5在自动化检测E. antarctica化石(包括完整壳瓣和可计数碎片)中的应用效果,并重点探究化石保存状态和形态变异对检测精度的影响。该研究近期发表于《Marine Micropaleontology》,为化石硅藻分析提供了高效、可靠的自动化解决方案。
研究人员从南大洋18个站点采集表层沉积物样本,涵盖大陆架、大陆坡和深海平原等多种沉积环境。样本经过氧化氢处理和标准制片后,使用全玻片扫描仪获取高分辨率图像(552 μm × 552 μm,分辨率0.23 μm/像素)。通过Visual Object Tagging Tool对E. antarctica壳瓣和碎片进行边界框标注,遵循计数惯例(完整壳瓣计1单位,碎片计0.5单位)。利用YOLOv5x模型进行训练和验证,设置了10种训练方案(4个单站点和6个双站点组合),并在14个独立测试站点评估模型性能,主要指标包括召回率(Recall)、精确度(Precision)和平均精度(AP)。

4.1. 样本中化石保存状态与E. antarctica尺寸变异

研究首先通过边界框尺寸分布和显微镜图像评估了各站点的化石保存状态和E. antarctica形态变异。结果显示,大陆架站点(如CD、G503)化石保存较好,壳瓣尺寸较大(边界框面积多>2000 μm2),而深海平原站点(如GC2003、MC10)保存中等至较差,小尺寸壳瓣或碎片占比高。这种差异反映了南大洋不同区域的沉积环境和生物地理特征。基于此,研究选取了CD(保存好、大壳瓣常见)、St. 12B(保存中等、大壳瓣常见)、MC10(保存好、大壳瓣罕见)和GC2003(保存中等、大壳瓣罕见)作为训练站点,以覆盖主要的形态和保存状态变异。

4.2. 目标检测模型比较

4.2.1. 单站点训练模型
四种单站点训练模型在测试站点的表现差异显著:
  • MODEL-CD在邻近站点(如G503、GC1006)表现优异(Recall、Precision、AP均>0.9),但在形态和保存状态差异较大的站点性能下降(Recall和AP多<0.8),表明模型对训练站点的背景颗粒组成较为敏感。
  • MODEL-St12B表现出最稳定的高性能(所有指标中位数>0.85),即使在地理和保存状态不同的站点也能保持高召回率,说明中等保存状态的训练数据有助于提升模型泛化能力。
  • MODEL-MC10和MODEL-GC2003(训练数据以大壳瓣罕见为特征)在大陆架站点同样达到高精度(>0.85),证明壳瓣尺寸变异对检测性能影响较小。
综合表明,训练数据的背景多样性(如非目标颗粒类型和对比度)是影响模型泛化能力的关键因素,而非壳瓣形态变异。
4.2.2. 双站点训练模型
六种双站点组合训练模型进一步提升了检测一致性和鲁棒性。所有双站点模型的Recall和Precision均超过0.85,AP>0.9(75%测试站点)。其中,MODEL-St12B&GC2003(训练数据包含大陆架和深海平原样本,保存中等)表现最佳,最低Recall和AP均>0.85。这表明融合多来源、多保存状态的训练数据能有效增强模型对多样沉积环境的适应性。
本研究证实了YOLOv5模型在化石硅藻检测中的高效性和可靠性。模型不仅能准确识别E. antarctica的完整壳瓣和碎片,还表现出对种内形态变异的强鲁棒性。更重要的是,训练数据的背景多样性(如包含多种非目标颗粒和碎片)是确保模型跨区域适用性的关键。该方法显著提升了硅藻计数效率(单玻片检测仅需数十秒,较人工节省数小时),为大规模沉积物样本的古环境分析(如海冰浓度和SST重建)提供了实用工具。未来,此技术可扩展至其他硅藻物种的自动化识别和形态计量分析,推动古海洋学研究的自动化和高通量化发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号