
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于混合视觉Transformer与残差网络的高精度草莓成熟度自动分类模型及其在精准农业中的应用
【字体: 大 中 小 】 时间:2025年09月18日 来源:Applied Fruit Science
编辑推荐:
本研究针对草莓成熟度自动化分类难题,提出了一种融合视觉Transformer与残差网络(ViT-ResNet)的混合模型。该模型实现了98.4%的分类准确率,显著优于传统CNN模型,在复杂环境下表现出卓越的鲁棒性,为精准农业和自动化采收系统提供了高效可靠的AI解决方案。
本研究提出了一种用于草莓成熟度自动分类的混合视觉Transformer-残差神经网络(ViT-ResNet)模型,该模型实现了98.4%的分类准确率,显著超越EfficientNet(93.2%)和ResNet-50(95.7%)。研究人员使用512张高分辨率图像进行训练,并通过数据增强扩展至1500张,使准确率从92.1%提升至98.4%,精确度从90.5%提高到98.1%,召回率从91.2%升至98.6%,而训练时间稳定保持在5小时。
通过五折交叉验证验证模型稳定性,获得平均97.2%的准确率(方差±0.5%)。在真实环境测试中,模型在低光照(96.5% vs 89.3%)、强光照(97.8% vs 91.5%)、遮挡(91.2% vs 83.5%)和视角变化(98.3% vs 90.1%)条件下均优于传统卷积神经网络(CNN)。光照适应性达96.5%–97.8%,遮挡鲁棒性为91.2%。
类激活图(CAM)可视化证实模型聚焦于颜色强度、纹理和种子分布特征。基于长短期记忆网络(LSTM)的时空分析框架可预测成熟度进程,收获前1天预测准确率达95.9%(7日前为82.3%)。不确定性估计标记8.4%的分类结果需人工复核,确保预测高置信度。该研究确立了ViT-ResNet作为实时、节能、自动化的草莓分类前沿解决方案,适用于精准农业与自主采收系统。
生物通微信公众号
知名企业招聘