低标注成本下花粉图像的深度学习:形态特征与训练预测策略的联合优化
《Review of Palaeobotany and Palynology》:Deep learning of pollen images under low annotation costs: joint optimization of morphological features and training and prediction strategies
【字体:
大
中
小
】
时间:2025年10月24日
来源:Review of Palaeobotany and Palynology 1.7
编辑推荐:
本文提出了一种创新的深度学习框架,通过构建高质量花粉图像数据集(5,521张/141种)和结构化形态属性表(20个特征),结合改进的ResNet50架构与掩码机制,实现了图像特征与形态数据的有效融合。采用弱标注数据(部分形态特征+未标注图像)与全标注数据联合训练策略,将模型准确率从83.00%提升至89.49%以上,显著增强泛化能力并抑制过拟合,为自动化花粉鉴定提供了可扩展的解决方案。
我们的数据集包含图像数据集和花粉形态属性表两部分:
a) 图像数据集:涵盖79科124属141种的5,521张花粉图像(图1示例如附件)。所有图像均采自第四纪植物花粉样本,经统一缩放至512×512像素并采用数据增强技术(如旋转、翻转、色彩调整)扩充至27,605张。
b) 形态属性表:包含20个标准化形态特征(如极性、对称性、萌发孔类型等),每个特征设3-8个离散值,由专家根据文献标注,形成结构化数据矩阵。
ResNet(残差网络)通过跳跃连接解决深度网络梯度消失问题,ResNet50包含49个卷积层和1个全连接层(约2,560万参数)。本研究改进其残差块结构,新增形态特征掩码模块:将形态属性编码为向量后,通过门控机制与图像特征加权融合,增强模型对关键形态线索的感知能力。
系统:Windows11 23H2;框架:PyTorch2.2.2 + CUDA12.1;语言:Python3.8.18;硬件:Intel i7-12700H CPU + NVIDIA RTX 4060 GPU。训练参数:Adam优化器,批次大小32,初始学习率0.0001,迭代100轮。
准确率:分类正确的样本占比;F1分数:精确率与召回率的调和平均;AUC值:模型区分能力的综合指标。
本研究通过引入形态属性表与网络结构优化,显著提升分类性能。轻量模型(如ResNet18)可能欠拟合,而复杂模型(如Vision Transformer)易过拟合。联合训练策略有效利用弱标注数据,降低对全标注数据的依赖,为小样本场景提供新思路。
深度学习驱动的花粉自动鉴定技术正突破传统方法的效率瓶颈。本研究创新的形态属性表征系统与属性-掩码映射机制,为孢粉学与古生态研究提供了高精度、低成本的解决方案。未来可探索多模态数据融合与跨领域迁移学习,进一步拓展应用边界。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号