
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于视觉Transformer-胶囊网络的柑橘品质检测:成熟度分级与黑斑病早期诊断
【字体: 大 中 小 】 时间:2025年06月18日 来源:Applied Fruit Science 1.3
编辑推荐:
为解决柑橘成熟度分级主观性强、黑斑病早期检测困难等问题,来自未知机构的研究人员开发了ViT-CapsNet混合模型,通过融合Vision Transformer(ViT)的全局特征提取能力和胶囊网络(CapsNet)的空间层次保持特性,在400张增强至1200张的柑橘图像数据集上实现96.12%验证准确率,F1-score达0.88-0.94,IoU(0.70)和AUC(0.93)显著优于传统CNN,为农业自动化提供高效解决方案。
精准判断柑橘果实成熟度并早期识别黑斑病(Citrus Black Spot)对优化采收时机、保障果实品质及减少经济损失至关重要。传统人工检测方法存在主观性强、重复性差的缺陷,促使研究者转向自动化深度学习技术。这项研究创新性地提出ViT-CapsNet混合架构,巧妙结合视觉Transformer(ViT)的全局特征捕捉优势与胶囊网络(CapsNet)的空间关系建模能力,在保持特征空间层级结构的同时显著提升分类与分割性能。
实验采用Hugging Face平台获取的400张柑橘图像数据集(未成熟/半熟/成熟/染病各100张),通过旋转、亮度调节、翻转及CutMix等数据增强手段扩展至1200张。ViT-CapsNet展现出惊人性能:训练准确率95.37%、验证准确率96.12%,全面碾压ViT单体(88.45%)、CapsNet单体(86.39%)、传统CNN(89.72%)及ViT-CNN混合模型(90.81%)。各类别F1-score分别为:未熟0.88、半熟0.85、成熟0.94、染病0.92。在分割任务中,交并比(IoU)0.70和Dice系数0.82的表现同样亮眼。
模型鲁棒性测试显示:正常条件下保持94.21%准确率,面对高斯模糊(85.37%)、JPEG压缩(80.23%)和遮挡(78.64%)等干扰时仍具竞争力。异常检测(OOD)得分0.84,单帧推理仅需0.05?s。训练采用AdamW优化器(学习率0.0001,批量32,60轮迭代),验证损失0.301。这项研究为实时农业质检提供了兼具可扩展性与高效性的创新方案。
生物通微信公众号
知名企业招聘